RE a utf-8
Jan Kasprzak
kas na fi.muni.cz
Čtvrtek Září 4 08:49:10 CEST 2014
Pavel Smerk wrote:
: Ahoj vespolek,
:
: asi mám nějaké zatmění mysli: proč druhý příkaz nic nevypíše? Stejně tak se
: to chová i v perl 5.10, naopak novější nemám k dispozici.
5.8 a 5.18 se chová stejně. Na locale by to nemělo záviset, pokud nedáš
-Mlocale (i s LC_ALL=C se to chová stejně). Ještě jsem ověřil, že se to chová
stejně divně i pro jiné kategorie znaků:
$ echo AB:pスn | perl -Mutf8 -CSAD -ne 'print if /AB:.*スn$/'
kromě ascii, ovšem:
$ echo AB:pan | perl -Mutf8 -CSAD -ne 'print if /AB:.*an$/'
AB:pan
a že součástí problému může být struktura toho RE:
$ echo AB:pán | perl -Mutf8 -CSAD -ne 'print if /AB[:x].*án$/'
AB:pán
$ echo AB:pán | perl -Mutf8 -CSAD -ne 'print if /A[BC]:.*án$/'
AB:pán
naopak v -Mutf8 -CSAD problém není - když to nahradím za use utf8 a podobně,
tak se to chová stejně.
Moc jsem nepomohl, sorry.
-Y.
--
| Jan "Yenya" Kasprzak <kas at {fi.muni.cz - work | yenya.net - private}> |
| New GPG 4096R/A45477D5 -- see http://www.fi.muni.cz/~kas/pgp-rollover.txt |
| http://www.fi.muni.cz/~kas/ Journal: http://www.fi.muni.cz/~kas/blog/ |
Hatsune Miku: the only girl that can have a leek in a song called "Bad Apple"
Další informace o konferenci Perl