Provided by:
manpages-zh_1.5-1_all 
NAME
perltw - 正體中文 Perl 指南
DESCRIPTION
g禹到 Perl 的天地!
5.8.0 版開始, Perl 具淞送晟频 Unicode (萬a) 支援,
也連ег嗽Se多蓝≌Z系以外的敬a方式; CJK (中日韓) 便是其中的一部份.
Unicode 是H性的耸, 訢荷we世界上所有的字符: 西方世界, |方世界,
以及烧唛g的一切 (希臘文, ⒗, 阿啦, 希伯砦, 印度文, 印地安文,
等等). 它也容納了多種作I系統與平臺 (如 PC 及鹚).
Perl 本身以 Unicode 進行操作. 這表示 Perl 炔康淖执Y料可用 Unicode
表示; Perl 的函式與算符 (例如正冶硎臼奖圈) 也能 Unicode 進行操作.
在萑爰拜出r, 榱颂理以 Unicode 之前的敬a方式Υ娴馁Y料, Perl 提供了
Encode 這模組, 可以啄爿p易地讀取及入舊有的敬a資料.
Encode 延伸模組支援下列正體中文的敬a方式 ('big5' 表示 'big5-eten'):
big5-eten Big5 敬a (含倚天延伸字形)
big5-hkscs Big5 + 香港外字集, 2001 年版
cp950 字碼 950 (Big5 + 微芴砑拥淖址)
舉例碚f, Big5 敬a的n案轉成 Unicode, 祗需鍵入下列指令:
perl -Mencoding=big5,STDOUT,utf8 -pe1 < file.big5 > file.utf8
Perl 也雀搅 "piconv", 一支完全以 Perl 成的字符轉Q工具程式, 用法如下:
piconv -f big5 -t utf8 < file.big5 > file.utf8
piconv -f utf8 -t big5 < file.utf8 > file.big5
另外, 利用 encoding 模組, 你可以輕易出以字符槲位的程式碼, 如下所示:
#!/usr/bin/env perl
# ⒂ big5 字串解析; 耸莩鋈爰八叔e誤都設 big5 敬a
use encoding 'big5', STDIN => 'big5', STDOUT => 'big5';
print length("耨"); # 2 (雙引瘫硎咀址)
print length('耨'); # 4 (我表示位元組)
print index("照教誨", "彖"); # -1 (不包含此子字串)
print index('照教誨', '彖'); # 1 (牡诙位元組開始)
在最後一列例子裡, "" 的第二位元組與 "" 的第一位元組結合成 Big5 碼的
"彖"; "" 的第二位元組t與 "教" 的第一位元組結合成 "". 這解Q了以前 Big5
碼比μ理上常业念}.
~a
如果需要更多的中文敬a, 可以 CPAN (<http://www.cpan.org/>) 下載
Encode::HanExtra 模組. 它目前提供下列敬a方式:
cccii 1980 年文建的中文資咏籕碼
euc-tw Unix 延伸字符集, 包含 CNS11643 平面 1-7
big5plus 中文滴换夹g推V基金的 Big5+
big5ext 中文滴换夹g推V基金的 Big5e
另外, Encode::HanConvert 模組t提供了悍鞭DQ用的煞N敬a:
big5-simp Big5 正體中文與 Unicode 后w中文互轉
gbk-trad GBK 后w中文與 Unicode 正體中文互轉
若想在 GBK 與 Big5 之間互轉, 闸考阅=M雀降 b2g.pl 與 g2b.pl 芍С淌,
或在程式仁褂孟铝蟹:
use Encode::HanConvert;
$euc_cn = big5_to_gb($big5); # Big5 轉 GBK
$big5 = gb_to_big5($euc_cn); # GBK 轉 Big5
MY
闸考 Perl 雀降拇罅空f明文件 (不幸全是用英文的), 鞼粮嚓P於 Perl
的知識, 以及 Unicode 的使用方式. 不過, 外部的資源相S富:
PerlYW址
<http://www.perl.com/>
Perl 的首 (由W萊禮公司維護)
<http://www.cpan.org/>
Perl 綜合典藏網 (Comprehensive Perl Archive Network)
<http://lists.perl.org/>
Perl 郵遞寨一覽
WPerlW址
<http://www.oreilly.com.tw/chinese/perl/index.html>
正體中文版的W萊禮 Perl
<http://groups.google.com/groups?q=tw.bbs.comp.lang.perl>
臺 Perl 連居誢 (也就是各大 BBS 的 Perl 連景)
Perl
<http://www.pm.org/groups/asia.shtml#Taiwan>
臺 Perl 推V組一覽
<http://irc.elixus.org/>
肆旧狭奶焓
UnicodePW址
<http://www.unicode.org/>
Unicode W術W (Unicode 耸的制定者)
<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
Unix/Linux 上的 UTF-8 及 Unicode 答客
Y
槭颤N叫 "正體中文" 不叫 "繁體中文"?
<http://www.csie.ntu.edu.tw/~b7506051/mozilla/faq.html#faqglossary>
中文化荏w旅
<http://www.cpatch.org/>
Linux 荏w中文化
<http://www.linux.org.tw/CLDP/>
SEE ALSO
Encode, Encode::TW, encoding, perluniintro, perlunicode
AUTHORS
Jarkko Hietaniemi <jhi@iki.fi>
Autrijus Tang (唐宗h) <autrijus@autrijus.org>