XML::Parser vs. UTF-8

Jiri Polcar polcar na physics.muni.cz
Pondělí Září 30 15:47:36 MEST 2002


Ha. Kdyz jsem dal do meho skriptu: "use bytes;" pomohlo to.

Dik moc.


On Mon, Sep 30, 2002 at 03:16:41PM +0200, Honza Pazdziora wrote:
> On Mon, Sep 30, 2002 at 03:03:33PM +0200, Jiri Polcar wrote:
> > 
> > 1) Jak Perl vi, v jakem kodovani jsou textove retezce pouzite primo ve
> > skriptu.
> 
> Rekl bych, ze je mu to jedno.
> 
> > 2) Kde je ulozena informace o kodovani dane textove promenne? Je vubec
> > nekde ulozena?
> 
> U hodnoty je v jeji vnitrni reprezentaci uvedeno, jestli je v utf8
> nebo jako posloupnost bajtu (jednobajtovych znaku).
> 
> > 3) Lze nejak menit kodovani, ve kterem Perl pracuje?
> 
> Co presne mate na mysli?
> 
> > 4) Jak mam vyresit svuj problem, tedy, jak mam Perlu rict, ze vse je v
> > UTF-8, at se "nestara"?
> 
> use utf8, myslim.
> 
> > Prikladam testovaci skripticek. Cast __DATA__ obsahuje XML kod,
> > ktery obsahuje dva tagy: <tag1> a <tag2>. Oba obsahuji slovo "b\'yk".
> > Upozornuji na to proto, ze nevim co se s kodovanim po ceste stane. 
> 
> Nemam ted po ruce perl 5.6.*+, abych to mohl vyzkousel, ale
> XML::Parser vzdy vraci UTF-8 a vstupni znakovou sadu ridi vzdy
> podle encodingu uvedeneho v tom XML.
> 
> -- 
> ------------------------------------------------------------------------
>  Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
>       ... all of these signs saying sorry but we're closed ...
> ------------------------------------------------------------------------

-- 
JP


Další informace o konferenci Perl