Cz::Cstocs a UTF-8
Honza Pazdziora
adelton na fi.muni.cz
Úterý Duben 19 18:37:08 MEST 2005
On Tue, Apr 19, 2005 at 06:30:17PM +0200, Jan Kasprzak wrote:
>
> Nakonec reseni bylo jeste slozitejsi - ted mam tohle (omlouvam
> se za dlouhy radek):
>
> } elsif ($inputenc eq 'utf8') {
> $fntext .= qq! \$e = Encode::encode('utf-8', \$e) if Encode::is_utf8(\$e); \$e =~ s/[\\x21-\\x7f]|[\\xc0-\\xdf].|[\\xe0-\\xef]..|[\\xf0-\\xf7]...|[\\xf8-\\xfb]....|[\\xfc\\xfd]...../defined \$conv->{\$&} ? \$conv->{\$&} : (
> $use_fillstring ? \$fillstring : '') /esog; !;
Neda se to bez toho Encode? Je to dalsi modul navic, zatimco utf8 je
jaksi vevnitr perlu. utf8::is_utf8 by melo funcovat, stejne jako ten
utf8::encode.
> Cili to nejdriv prevod z UTF-8 na binarni data musi byt navic jeste
> podmineny tim, ze mam skutecne UTF-8 retezec.
Jup, to je vhodne.
> Adeltone, chces poslat moji verzi kvuli zacleneni techto veci
> do distribuce?
No, ja davam hlasovat, co s tim Cz::Cstocs, vlastne vubec. Protoze
to tedka chodi i na 5.004, coz s temito zmenami nebude. Takze bychom
museli mit separatni verzi pro 5.8+ a separatni pro starsi perly,
nebo tak.
Navic mi prijde, ze by asi bylo vhodne misto udrzovani Cz::Cstocs
i pro 5.8 propagovat ten Encode, at zmensujeme mnozstvi narodnich
specifik -- kdyz uz ma 5.8 v distribuci takova kvanta znakovych
sad.
--
------------------------------------------------------------------------
Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
.project: Perl, mod_perl, DBI, Oracle, large Web systems, XML/XSL, ...
Only self-confident people can be simple.
Další informace o konferenci Perl