utf8 data, il2 skript a Cz::Cstocs
Honza Pazdziora
adelton na fi.muni.cz
Pondělí Leden 8 11:12:26 MET 2007
On Sat, Jan 06, 2007 at 08:29:36AM +0100, Pavel Smerk wrote:
>
> Chapu teda správně, že pro korektní práci s utf8 bych měl mít data i skript
> v utf8, ve skriptu use utf8 a spouštět s -CSD? Pak mi totiž nebude fungovat
Například.
> to Cz::Cstocs, asi že ty utf8 řetězce jsou interně reprezentovány nějak
> jinak, nevím (dovnitř nevidím a manuál říká, že nemám chtít vidět ;-)
>
> $ echo "ěščřžýáíé" | cstocs il2 utf8 | perl -ne 'BEGIN {use Cz::Cstocs "utf8_ascii"} print utf8_ascii $_'
> escrzyaie
> $ echo "ěščřžýáíé" | cstocs il2 utf8 | perl -CI -ne 'BEGIN {use Cz::Cstocs "utf8_ascii"} print utf8_ascii $_'
> WidĹŞý acter in print at -e line 1, <> line 1.
>
> Mám do ascii překódovávat nějak jinak? Encode::encode('ascii', $string) mi
> ze znaků s diakritikou udělá otazníky, takže teď skrze Encode::encode kóduju
> do il2 a z něj skrze Cz::cstocs teprve do ascii, ale počítám, že by to mohlo
> jít i přímočařeji.
Můžeš zkusit Search::Tools::Transliterate. Obecně Ti totiž Cz::Cstocs
stejně bude fungovat jenom nad malinkou podmnožinou UTF-8.
Ona ale otázka je, proč chceš vlastně tu transliteraci do US-ASCII
dělat, v roce 2007, kdy UTF-8 podporují snad všechny systémy, co jich
kolem máme.
--
------------------------------------------------------------------------
Honza Pazdziora | adelton na fi.muni.cz | http://www.fi.muni.cz/~adelton/
.project: Perl, C, Red Hat Network, IPv6, VoIP
Only self-confident people can be simple.
Další informace o konferenci Perl