儲存文件應用Unicode還是UTF-8好?

2007-04-24 7:17 pm
用windows 的記事本可以set的
但好似差不多,UTF-8又細d
更新1:

UTF-8係咪支援code比較少,即是會可有可能睇唔到d字?

更新2:

我是儲日文字多的

回答 (2)

2007-04-26 9:32 am
✔ 最佳答案
在 [記事本] 中使用不同的語言格式
[記事本] 可以建立及開啟下列格式的文件:
ANSI、Unicode、big-endian Unicode 或 UTF-8。
這些格式可以讓您使用不同字集的文件。
文件預設會以標準的 ANSI 文字儲存。
Unicode 是世界上所有主要指令檔的聯集。
其包括商業及電腦所使用的公用字集。
當以 Unicode 儲存文件時,您可以使用 Unicode 控制字元
協助說明語言的文字流及方向(右至左),如阿拉伯語、希伯來語。
部份字型無法顯示所有的 Unicode 字元。
如果您發現文字檔中缺少了某些字元,請將字型變更為包含該字元的字型。
一般而言,Microsoft Sans Serif 是使用 Unicode 字元時很好的選擇。
在 big-endian 處理器 (如 Macintosh) 上建立之 Unicode 文件中的文字位元組
(存放單位) 排列順序,與在 Intel 處理器上建立之文件的文字位元組排列
順序相反。最重要的位元組擁有最低的位址,且會先儲存文字中較大的一端。
為讓這類電腦上的使用者能夠存取您的文件,請以 big-endian Unicode 格式儲存
[記事本] 檔案。
UTF 代表「通用字集轉換格式 (Universal Character Set Transformation Format)」。
UTF-8 是 Unicode 的 8 位元格式。
若使用的是個別位元組內只支援 8 個位元重要資料的舊型傳輸媒體,
請用 UTF-8 儲存文件。

如果電腦上已安裝多重語言,則在 Windows 中在任何編輯控制項 (如文字方塊),或使用 [記事本] 時,請按一下滑鼠右鍵,即可顯示 Unicode 控制字元。



2007-04-27 20:22:08 補充:
維基百科這裡有詳細解釋看這裡比較實際↓http://zh.wikipedia.org/wiki/UTF-8論壇答問↓http://netlab.cse.yzu.edu.tw/~statue/freebsd/hanzi/UTF-8-Unicode.html

2007-04-27 20:40:53 補充:
如果單純用一國文字(例如日文) UTF-8是可以但如果有夾雜其他文字或符號Unicode是最好選擇,Unicode對跨平台系統(例如Mac機)比較適合

2007-04-27 20:58:19 補充:
還有一點,如果儲存檔案是自用的便無所謂Unicode/UTF-8但字型最好是選支援uncode的字體例如→"新細明體",純日文可以用"MS Mincho"
2007-04-24 9:49 pm
Unicode 同 UTF-8 支援既 code 係完全一樣,UTF-8 只係 Unicode 既一個 transformation,即係一個 Unicode 碼你一定會搵到個對應既 UTF-8 碼。UTF-8中,位元組及位元的起始編碼的分派與ASCII是一致的(原來處理ASCII的軟件在不需要作出變動或作出很小的變動後,使可維持其他功能)。基於以上的原因,在電子郵件、網頁及其他使用利用位元來儲存或streamed的地方中,它穩定地成為優先採用的編碼。

一般都係會用 UTF-8 黎儲存文件的。純英文環境下,UTF-8 既英文 character 係同 ASCII 既 code 完全一樣,所以你拎個純英文 UTF-8 檔去一D 唔支援 UTF-8 既電腦度睇,都會睇得番入面既內容,用 Unicode 既話就唔可以咁做。

用 UTF-8 儲存文件不一定會令到檔案 size 縮細,要睇下你個文件係儲左乜野字,Unicode 儲存任何國家的文字都會用到 2 bytes,而 UTF-8 就需要 1-3 bytes (英文 - 1 byte, 中文 - 3 bytes),換句話講如果你個文件係純英文,用 UTF-8 會細D,如果係純中文既話就會 Unicode 細 D。

2007-04-26 16:47:22 補充:
用 UTF-8 既話,所有中日韓既文字都會用 3 bytes 黎儲存。即是純日文字檔案的話,UTF-8 會比 Unicode 使用更多儲存空間。


收錄日期: 2021-04-27 14:26:21
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20070424000051KK00928

檢視 Wayback Machine 備份