\W versus [\W]

Jan Kasprzak kas na fi.muni.cz
Čtvrtek Listopad 19 22:00:25 CET 2009


Honza Pazdziora wrote:
: On Thu, Nov 19, 2009 at 10:08:22AM +0100, Jan Kasprzak wrote:
: > $ perl -Mutf8 -e '$a="á"; print "BAD\n" if $a=~/[\W]/'
: > BAD
: > $ perl -Mutf8 -e '$a="á"; print "BAD\n" if $a=~/\W/'
: > $

	Ja nevim jestli se nekde nedela nejake spatne utf-8 parsovani
toho skriptu samotneho. Kdyz dam misto á \x{00e1}, tak se dozvim BAD
v obou pripadech:

$ perl -Mutf8 -e '$a="\x{00e1}"; print "BAD\n" if $a=~/[\W]/' 
BAD
$ perl -Mutf8 -e '$a="\x{00e1}"; print "BAD\n" if $a=~/\W/'
BAD

: Pokut ty nepísmenné chceš zároveň ne-alpha a zároveň ne-number, tak si
: budeš muset zadefinovat vlastní property. Pak to (?:\W|_) ale zase
: nemusí být tak špatné. ;-)

	Jo. Asi pouziju ?:, ne novou kategorii.

	Coz me privadi k dalsi otazce: jde nejak ziskat seznam vsech
podporovanych Unicode skriptu (jak je uvedeny v perlunicode(1) v sekci
"Scripts")? (zatim jsem dal do kodu Latin, Greek, Arabic, Hebrew a Cyrillic
a asi to bude stacit, ale cistsi by mi prislo tyhle nacitat z definic
v Perlu.

-Y.

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/    Journal: http://www.fi.muni.cz/~kas/blog/ |
Please don't top post and in particular don't attach entire digests to your
mail or we'll all soon be using bittorrent to read the list.     --Alan Cox


Další informace o konferenci Perl