RE a utf-8

Jan Kasprzak kas na fi.muni.cz
Čtvrtek Září 4 08:49:10 CEST 2014


Pavel Smerk wrote:
: 	Ahoj vespolek,
: 
: asi mám nějaké zatmění mysli: proč druhý příkaz nic nevypíše? Stejně tak se
: to chová i v perl 5.10, naopak novější nemám k dispozici.

	5.8 a 5.18 se chová stejně. Na locale by to nemělo záviset, pokud nedáš
-Mlocale (i s LC_ALL=C se to chová stejně). Ještě jsem ověřil, že se to chová
stejně divně i pro jiné kategorie znaků:

$ echo AB:pスn | perl -Mutf8 -CSAD -ne 'print if /AB:.*スn$/'

kromě ascii, ovšem:

$ echo AB:pan | perl -Mutf8 -CSAD -ne 'print if /AB:.*an$/'
AB:pan

a že součástí problému může být struktura toho RE:

$ echo AB:pán | perl -Mutf8 -CSAD -ne 'print if /AB[:x].*án$/'
AB:pán
$ echo AB:pán | perl -Mutf8 -CSAD -ne 'print if /A[BC]:.*án$/'
AB:pán

naopak v -Mutf8 -CSAD problém není - když to nahradím za use utf8 a podobně,
tak se to chová stejně.

	Moc jsem nepomohl, sorry.

-Y.

-- 
| Jan "Yenya" Kasprzak   <kas at {fi.muni.cz - work | yenya.net - private}> |
| New GPG 4096R/A45477D5 -- see http://www.fi.muni.cz/~kas/pgp-rollover.txt |
| http://www.fi.muni.cz/~kas/     Journal: http://www.fi.muni.cz/~kas/blog/ |
Hatsune Miku: the only girl that can have a leek in a song called "Bad Apple"


Další informace o konferenci Perl