✔ 最佳答案
.txt是包含極少格式信息的文字文件的擴展名。.txt格式並沒有明確的定義,它通常是指那些能夠被系統終端或者簡單的文本編輯器接受的格式。任何能讀取文字的程序都能讀取帶有.txt擴展名的文件,因此,通常認為這種文件是通用的、跨平台的。
在英文文本文件中,ASCII字符集是最為常見的格式,而且在許多場合,它也是默認的格式。對於帶重音符號的和其它的非ASCII字符,必須選擇一種字符編碼。在很多系統中,字符編碼是由計算機的區域設置決定的。常見的字符編碼包括支持許多歐洲語言的ISO 8859-1。
由於許多編碼只能表達有限的字符,通常它們只能用於表達幾種語言。Unicode制定了一種試圖能夠表達所有已知語言的標準,Unicode字符集非常大,它囊括了大多數已知的字符集。Unicode有多種字符編碼,其中最常見的是UTF-8,這種編碼能夠向後兼容ASCII,相同內容的的ASCII文本文件和UTF-8文本文件完全一致。
Windows的.txt文件
微軟的MS-DOS和Windows採用了相同的文本文件格式,它們都使用CR和LF兩個字符作為換行符,這兩個字符對應的ASCII碼分別為13 和10。通常,最後一行文本並不以換行符(CR-LF標誌)結尾,包括記事本在內的很多文本編輯器也不在文件的最後添加換行符。
大多數Windows文本文件使用ANSI、OEM或者Unicode編碼。Windows所指的ANSI編碼通常是1位元組的ISO-8859編碼,不過對於像中文、日文、朝鮮文這樣的環境,需要使用2位元組字符集。在過渡至Unicode前,Windows一直用ANSI作為系統默認的編碼。而 OEM編碼,也是通常所說的MS-DOS代碼頁,是IBM為早期IBM個人電腦的文本模式顯示系統定義的。在全屏的MS-DOS程序中同時使用了圖形的和按行繪製的字符。新版本的Windows可以使用UTF-16LE和UTF-8之類的Unicode編碼。