Cz::Cstocs a UTF-8

Honza Pazdziora adelton na fi.muni.cz
Úterý Duben 19 18:37:08 MEST 2005


On Tue, Apr 19, 2005 at 06:30:17PM +0200, Jan Kasprzak wrote:
> 
> 	Nakonec reseni bylo jeste slozitejsi - ted mam tohle (omlouvam
> se za dlouhy radek):
> 
>         } elsif ($inputenc eq 'utf8') {
>                 $fntext .= qq! \$e = Encode::encode('utf-8', \$e) if Encode::is_utf8(\$e); \$e =~ s/[\\x21-\\x7f]|[\\xc0-\\xdf].|[\\xe0-\\xef]..|[\\xf0-\\xf7]...|[\\xf8-\\xfb]....|[\\xfc\\xfd]...../defined \$conv->{\$&} ? \$conv->{\$&} : (
>                 $use_fillstring ? \$fillstring : '') /esog; !;

Neda se to bez toho Encode? Je to dalsi modul navic, zatimco utf8 je
jaksi vevnitr perlu. utf8::is_utf8 by melo funcovat, stejne jako ten
utf8::encode.

> 	Cili to nejdriv prevod z UTF-8 na binarni data musi byt navic jeste
> podmineny tim, ze mam skutecne UTF-8 retezec.

Jup, to je vhodne.

> 	Adeltone, chces poslat moji verzi kvuli zacleneni techto veci
> do distribuce?

No, ja davam hlasovat, co s tim Cz::Cstocs, vlastne vubec. Protoze
to tedka chodi i na 5.004, coz s temito zmenami nebude. Takze bychom
museli mit separatni verzi pro 5.8+ a separatni pro starsi perly,
nebo tak.

Navic mi prijde, ze by asi bylo vhodne misto udrzovani Cz::Cstocs
i pro 5.8 propagovat ten Encode, at zmensujeme mnozstvi narodnich
specifik -- kdyz uz ma 5.8 v distribuci takova kvanta znakovych
sad.

-- 
------------------------------------------------------------------------
 Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
 .project: Perl, mod_perl, DBI, Oracle, large Web systems, XML/XSL, ...
		Only self-confident people can be simple.


Další informace o konferenci Perl