星期日, 8月 03, 2008

好用的繁體<->簡體字轉換

在網路上已經有很多繁體和簡體的轉換程式,但是我覺得有一個免費的程式ConvertZ 用來最順手。 它不但可以做檔案的轉換,而且可以轉換剪貼簿裡的內容。即使是包括html的程式碼,也能做得很好。 更重要的是,許多台灣和大陸的不同的用語,裡面也可以做置換(詞彙修正)的動作。
例如,燙髮,若是直接用簡體字的烫发轉成繁體,就會變成燙發。但是經過詞彙修正就會變成燙髮。 而在簡體字,干和幹字通用,在置換之後,你就不會看到有總干事的詞彙。
而常常在文章裡的'里' (裡)字 和后字(後)也能做很好的修正。
一開始比較不習慣的是,程式執行之後不會看到一個視窗,原來程式藏在螢幕的最頂端,要把滑鼠移到那裡才會出現選項。





以下是程式的介紹,謝謝作者ALF 提供這麼好用的程式給我們。

由於歷史、地區原因,有時一種文字會出現多種編碼方案,特別是漢字。如果文字編碼跟系統預設編碼不同,則文字不能正確地列印及顯示,須要進行編碼轉換才能變成可以辨識的字符。
ANSI碼是單一字節(8-bit)的編碼集,最多只能表示256個字符,不能表示眾多的漢字字符,各個國家和地區在ANSI碼的基礎上又設計了各種不同的漢字編碼集(例如:Big5, GBK),使之能夠處理大數量的漢字字符。這些編碼使用單字節來表示ANSI的英文字符(即兼容ANSI碼),使用雙字節(16-bit)來表示漢字字符。由於一個系統中只能有一種漢字內碼,造成了交流的不便。新的作業平台(ie. WinNT/2000/XP)已全面支援Unicode編碼,目前支援Unicode的程式不多,一般程式只支援ANSI字符。
GB碼:GB碼是1980年國家公佈的簡體漢字編碼方案,在大陸、新加坡得到廣泛的使用,也稱國標碼。國標碼對6763個漢字集進行了編碼,涵蓋了大多數正在使用的漢字。
GBK碼:GBK碼是GB碼的擴展字符編碼,對多達2萬多的簡繁漢字進行了編碼,向下與GB碼兼容,簡體版Windows是使用GBK作系統內碼。
BIG5碼:BIG5碼是針對繁體漢字的漢字編碼,目前在台灣、香港的電腦系統中得到普遍應用,繁體版Windows是用Big5作系統內碼。
Unicode碼:Unicode碼是最新的國際標準編碼,採用二個字節 (16-bit) 編碼,收入了幾乎所有國家的文字符號,適用於所有語言的作業平台,但與ANSI碼不兼容,只應用於支援Unicode的程式。Unicode Little Endian普遍用於x86系統(ie. Intel),而 Unicode Big Endian 普遍用於RISC 系統 (ie. Alpha, Mac)。
UTF-8: Unicode 的變體,用 8-bit 編碼,每個字符由一至四個字節組成。
HZ碼:HZ是GB碼的變體,只用每個字節的首7-bit作編碼(即ANSI的首128個字符),常用於網絡資料傳送。
JIS: 日文編碼,即ISO-2022-JP,只用每個字節的首7-bit作編碼,常用於網絡資料傳送。
Shift-JIS: Microsoft制訂的日文編碼標準,適用於Windows日文平台。
EUC-JP: 常用於日文Unix平台,日文的PHP及MySQL多用這種編碼編寫。


黑米 推推王 del.icio.us

0 意見:

張貼留言