XML::Parser vs. UTF-8
Honza Pazdziora
adelton na informatics.muni.cz
Pondělí Září 30 15:54:22 MEST 2002
On Mon, Sep 30, 2002 at 03:42:02PM +0200, Jiri Polcar wrote:
>
> Jedno? Prevadi-li prece z jedne znakove sady do druhe (UTF-8), musi o
> obou vedet, ne?
Ale perl neprevadi (alespon ne v 5.6.*). Ten prevod dela XML::Parser
na zaklade informace v tom XML, nikoli perl.
> Vida. Mohu tuhle informaci menit? Stacilo, ze bych Perlu rekl, ze to co
> vraci Dumper je v UTF-8, cimz bych ho vratil do reality a vse by bylo
> OK. Tady bude asi zakopan psik.
Ale Dumper vraci to, co je v tech datech, ne?
> No, myslel jsem ze Perl uchovava informaci o kodovani retezce a ne jen
> jestli je UTF-8 a nebo neni. Pak bych mohl chtit, aby se choval k jinemu
> kodovani tak, jako ted k UTF-8. ( Napriklad pri slouceni dvou retrzcu v
> ruznych kodovanich by vracel vysledek v tom, co bych zmenil). To by
> ovsem melo jista uskali, protoze jednotliva kodovani nejsou bijektivni.
> Zapomente na to.
Man perlunicode a man utf8, rekl bych. Perl nepracuje se znakovymi
sadami, jedine, co umi, je mit unicodove retezce. Cili uchovava puze
tu informaci "je utf8/neni utf8".
> Pridam-li do sveho skriptu (co jsem posilal) "use utf8;", na jeho
> chovani (navenek) se nic nezmeni.
Jak pisi, nemam moznost overit.
--
------------------------------------------------------------------------
Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
... all of these signs saying sorry but we're closed ...
------------------------------------------------------------------------
Další informace o konferenci Perl