\W versus [\W]
Jan Kasprzak
kas na fi.muni.cz
Čtvrtek Listopad 19 22:00:25 CET 2009
Honza Pazdziora wrote:
: On Thu, Nov 19, 2009 at 10:08:22AM +0100, Jan Kasprzak wrote:
: > $ perl -Mutf8 -e '$a="á"; print "BAD\n" if $a=~/[\W]/'
: > BAD
: > $ perl -Mutf8 -e '$a="á"; print "BAD\n" if $a=~/\W/'
: > $
Ja nevim jestli se nekde nedela nejake spatne utf-8 parsovani
toho skriptu samotneho. Kdyz dam misto á \x{00e1}, tak se dozvim BAD
v obou pripadech:
$ perl -Mutf8 -e '$a="\x{00e1}"; print "BAD\n" if $a=~/[\W]/'
BAD
$ perl -Mutf8 -e '$a="\x{00e1}"; print "BAD\n" if $a=~/\W/'
BAD
: Pokut ty nepísmenné chceš zároveň ne-alpha a zároveň ne-number, tak si
: budeš muset zadefinovat vlastní property. Pak to (?:\W|_) ale zase
: nemusí být tak špatné. ;-)
Jo. Asi pouziju ?:, ne novou kategorii.
Coz me privadi k dalsi otazce: jde nejak ziskat seznam vsech
podporovanych Unicode skriptu (jak je uvedeny v perlunicode(1) v sekci
"Scripts")? (zatim jsem dal do kodu Latin, Greek, Arabic, Hebrew a Cyrillic
a asi to bude stacit, ale cistsi by mi prislo tyhle nacitat z definic
v Perlu.
-Y.
--
| Jan "Yenya" Kasprzak <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839 Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/ Journal: http://www.fi.muni.cz/~kas/blog/ |
Please don't top post and in particular don't attach entire digests to your
mail or we'll all soon be using bittorrent to read the list. --Alan Cox
Další informace o konferenci Perl