utf8 data, il2 skript a Cz::Cstocs

Honza Pazdziora adelton na fi.muni.cz
Pondělí Leden 8 11:12:26 MET 2007


On Sat, Jan 06, 2007 at 08:29:36AM +0100, Pavel Smerk wrote:
> 
> Chapu teda správně, že pro korektní práci s utf8 bych měl mít data i skript
> v utf8, ve skriptu use utf8 a spouštět s -CSD? Pak mi totiž nebude fungovat

Například.

> to Cz::Cstocs, asi že ty utf8 řetězce jsou interně reprezentovány nějak
> jinak, nevím (dovnitř nevidím a manuál říká, že nemám chtít vidět ;-)
> 
> $ echo "ěščřžýáíé" | cstocs il2 utf8 | perl -ne 'BEGIN {use Cz::Cstocs "utf8_ascii"} print utf8_ascii $_'
> escrzyaie
> $ echo "ěščřžýáíé" | cstocs il2 utf8 | perl -CI -ne 'BEGIN {use Cz::Cstocs "utf8_ascii"} print utf8_ascii $_'
> WidĹŞý acter in print at -e line 1, <> line 1.
> 
> Mám do ascii překódovávat nějak jinak? Encode::encode('ascii', $string) mi
> ze znaků s diakritikou udělá otazníky, takže teď skrze Encode::encode kóduju
> do il2 a z něj skrze Cz::cstocs teprve do ascii, ale počítám, že by to mohlo
> jít i přímočařeji.

Můžeš zkusit Search::Tools::Transliterate. Obecně Ti totiž Cz::Cstocs
stejně bude fungovat jenom nad malinkou podmnožinou UTF-8.

Ona ale otázka je, proč chceš vlastně tu transliteraci do US-ASCII
dělat, v roce 2007, kdy UTF-8 podporují snad všechny systémy, co jich
kolem máme.

-- 
------------------------------------------------------------------------
 Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
             .project: Perl, C, Red Hat Network, IPv6, VoIP
		Only self-confident people can be simple.


Další informace o konferenci Perl