XML::Parser vs. UTF-8

Honza Pazdziora adelton na informatics.muni.cz
Pondělí Září 30 15:16:04 MEST 2002


On Mon, Sep 30, 2002 at 03:03:33PM +0200, Jiri Polcar wrote:
> 
> 1) Jak Perl vi, v jakem kodovani jsou textove retezce pouzite primo ve
> skriptu.

Rekl bych, ze je mu to jedno.

> 2) Kde je ulozena informace o kodovani dane textove promenne? Je vubec
> nekde ulozena?

U hodnoty je v jeji vnitrni reprezentaci uvedeno, jestli je v utf8
nebo jako posloupnost bajtu (jednobajtovych znaku).

> 3) Lze nejak menit kodovani, ve kterem Perl pracuje?

Co presne mate na mysli?

> 4) Jak mam vyresit svuj problem, tedy, jak mam Perlu rict, ze vse je v
> UTF-8, at se "nestara"?

use utf8, myslim.

> Prikladam testovaci skripticek. Cast __DATA__ obsahuje XML kod,
> ktery obsahuje dva tagy: <tag1> a <tag2>. Oba obsahuji slovo "b\'yk".
> Upozornuji na to proto, ze nevim co se s kodovanim po ceste stane. 

Nemam ted po ruce perl 5.6.*+, abych to mohl vyzkousel, ale
XML::Parser vzdy vraci UTF-8 a vstupni znakovou sadu ridi vzdy
podle encodingu uvedeneho v tom XML.

-- 
------------------------------------------------------------------------
 Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
      ... all of these signs saying sorry but we're closed ...
------------------------------------------------------------------------


Další informace o konferenci Perl