Zmateny perl z kodovani

Honza Pazdziora adelton na fi.muni.cz
Středa Leden 19 14:16:32 MET 2005


On Wed, Jan 19, 2005 at 01:24:15PM +0100, Ondrej Koala Vacha wrote:
> 
> Mozna nejsem sam, koho by zajimalo, jaky je vlastne rozdil mezi UTF-8 
> znaky a touz posloupnosti bytu. Myslel jsem si, ze bud aplikace ceka 

man perluniintro

> kodovani UTF-8 a pak ho tak interpretuje (prip. hodi chybu) nebo neceka. CO tedy udela 
> ono znaceni na znaky?

Ze je u skalarni hodnoty nastaven priznak, ze jde o validni utf8.

> Je to nejaky zamer, ze v perlu nejsou osetrene vsechny cesty, jak se muze 
> dostat k datum? Jde mi o to, zda je to soucasny/docasny stav, nebo zda to 
> ma nejake jine netusene vyhody.

Pokud si napisu knihovnu v C, ktera bude vracet nejaka data, Vy si
kolem toho napisete XS wrapper a budete to volat z Perlu, tak
v obecnem pripade nebudete chtit, aby retezce, ktere Vam vracim, Perl
jakymkoli zpusobem modifikoval. Treba je to JPEG nebo gzip nebo cokoli
jineho, co dostanete jako posloupnost bajtu. Stejne tak v pripade HTTP
pozadavku -- pokud server vrati data v ISO-8859-2 a nastavi spravne
hlavicku, jsou dve moznosti -- budto dostanete ten retezec jako bajty,
nebo budete ocekavat, ze nejaka magie v Perlu bude tento a jiny
protokol umet a obcas Vam prekoduje do UTF-8. To je prece nesmysl.

Ze zrovna v pripade DBI se zda, ze by bylo vhodne, aby znakova data
byla znakovymi daty, je sice pekne, ale rozhodne to neznamena, ze by
to bez podpory DBD pro konkretni databazi slo nejak pekne udelat.

-- 
------------------------------------------------------------------------
 Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
 .project: Perl, mod_perl, DBI, Oracle, large Web systems, XML/XSL, ...
		Only self-confident people can be simple.


Další informace o konferenci Perl