XML::Parser vs. UTF-8
Honza Pazdziora
adelton na informatics.muni.cz
Pondělí Září 30 15:16:04 MEST 2002
On Mon, Sep 30, 2002 at 03:03:33PM +0200, Jiri Polcar wrote:
>
> 1) Jak Perl vi, v jakem kodovani jsou textove retezce pouzite primo ve
> skriptu.
Rekl bych, ze je mu to jedno.
> 2) Kde je ulozena informace o kodovani dane textove promenne? Je vubec
> nekde ulozena?
U hodnoty je v jeji vnitrni reprezentaci uvedeno, jestli je v utf8
nebo jako posloupnost bajtu (jednobajtovych znaku).
> 3) Lze nejak menit kodovani, ve kterem Perl pracuje?
Co presne mate na mysli?
> 4) Jak mam vyresit svuj problem, tedy, jak mam Perlu rict, ze vse je v
> UTF-8, at se "nestara"?
use utf8, myslim.
> Prikladam testovaci skripticek. Cast __DATA__ obsahuje XML kod,
> ktery obsahuje dva tagy: <tag1> a <tag2>. Oba obsahuji slovo "b\'yk".
> Upozornuji na to proto, ze nevim co se s kodovanim po ceste stane.
Nemam ted po ruce perl 5.6.*+, abych to mohl vyzkousel, ale
XML::Parser vzdy vraci UTF-8 a vstupni znakovou sadu ridi vzdy
podle encodingu uvedeneho v tom XML.
--
------------------------------------------------------------------------
Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
... all of these signs saying sorry but we're closed ...
------------------------------------------------------------------------
Další informace o konferenci Perl