Cz::Cstocs a UTF-8

Úterý Duben 19 18:30:17 MEST 2005

Honza Pazdziora wrote:
: On Tue, Apr 19, 2005 at 05:30:29PM +0200, Jan Kasprzak wrote:
: > 
: > 	OK, zkousel jsem utf8::downgrade() a to nefungovalo. Proc encode
: > ano a utf8::downgrade ne?
: > 
: > Wide character in subroutine entry at (eval 4) line 1.
: 
: Protoze downgrade umi jenom Latin-1 nebo EBCDIC, skoro bych rekl, ze
: to je funkcne plus minus
: 
: 	$data = Encode::encode("iso-8859-1", $data)
: 
: (az na to, ze to je in-place). Zatimco encode umi UTF-8.

	OK, diky.

	Nakonec reseni bylo jeste slozitejsi - ted mam tohle (omlouvam
se za dlouhy radek):

        } elsif ($inputenc eq 'utf8') {
                $fntext .= qq! \$e = Encode::encode('utf-8', \$e) if Encode::is_utf8(\$e); \$e =~ s/[\\x21-\\x7f]|[\\xc0-\\xdf].|[\\xe0-\\xef]..|[\\xf0-\\xf7]...|[\\xf8-\\xfb]....|[\\xfc\\xfd]...../defined \$conv->{\$&} ? \$conv->{\$&} : (
                $use_fillstring ? \$fillstring : '') /esog; !;

	Cili to nejdriv prevod z UTF-8 na binarni data musi byt navic jeste
podmineny tim, ze mam skutecne UTF-8 retezec.

	Adeltone, chces poslat moji verzi kvuli zacleneni techto veci
do distribuce?

-Y.

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/   Czech Linux Homepage: http://www.linux.cz/ |
-- Yes. CVS is much denser.                                               --
-- CVS is also total crap. So your point is?             --Linus Torvalds --