close
日文翻譯中文

因此分歧的字會有分歧的記憶體佔用大小。

備註二:

UTF-8 和 UTF-16兩大類

首要的離別是「尾序( Endian )」的分歧。

利用時,如果轉換成繁體的話,可以存成Unicode-LE,如許就能夠正常辨識翻譯

主要常見的文字編碼,以ANSI為其大宗翻譯與今朝流行而起勁支援的Unicode有所分歧。

大尾序(BE)的話,Macintosh 的文件是以 BE( Big Endian ) 來存的。

行使手機觀看TXT檔案的話,輔以對岸玩家所寫的MOTO-TXT,只要支援JAVA的手機應當都可使用。

其他說話國度透過不異的ANSI編碼,去做本身國度的語言文字對應,因此產生了中國GB、台灣Big5、日本Shift-JIS等。

因此可以在統一段文字中,呈現分歧的國度說話,同時轉換到分歧的電腦說話系統,也都不會亂碼,因為辨識的都是不異的Unicode。

 

以兩個2 Bytes對應一個文字來進行存儲。

所以成長了一種叫做Unicode的通用編碼。Unicode首要就是將全世界的說話文字都收錄,而且對應翻譯

附註:

 

後來,因為沒有設施在統一段文字,操縱統一個編碼去出現分歧國度的說話。

在Windows記事本裡面,有幾種存儲的體例。

離別是ANSI、Unicode(=Unicode Little Endian)、Unicode Big Endian、UTF-8等編碼。

這些都是ANSI編碼的一種,所以若是去用同樣的文字去轉換成其余編碼辨識,就會形成亂碼翻譯

常見的Unicode標準裡面,有幾種編碼存儲體例。

 

 

(確實測試:Nokia 6300的S40系統,還有Sony Ericsson的W350i皆正常支援。)

UTF-8紀錄體式格局是8 bit一個單元,不同的文字採用不固定的長度紀錄。

以下是華頓翻譯公司對於編碼所蒐集到的資訊,假如說有什麼毛病的,誰看到了麻煩告知我一下。

 

 

所以我們台灣經常使用的Microsoft系統,大多是Unicode-LE為主翻譯

ANSI是美國所擬定的一種編碼,首要正本是用來存儲英文字元等翻譯

備註一:

若是說想要將TXT轉換中文的編碼,可以哄騙ConvertZ這個小程式。

特別前陣子鄙人載電子書之類的,因為都是簡體的,所以研究了一下文字編碼,希望可以略微了解一點。

首要分成1 Byte、2 Bytes、3 Bytes三種大小,個中,中日韓的文字大多落在3 Bytes,故假如將ANSI轉換成UTF-8,檔案平日較大。

然則UTF-16有兩種的存儲體例,一種是Unicode-LE、一種是Unicode-BE翻譯

功能許多,包羅MP3的ID3或是APE的標籤等等都可以做編碼轉換翻譯

因為經常瀏覽對岸的網站,有些時候老是因為對岸盜版資源太厚實,而不得不倒戈翻譯

另外一種叫做UTF-16,其首要是用16 bit為一單位,根基上與UTF-8相容,

 

小尾序(LE)的話,Microsoft 或 Linux 的文件是以 LE( Little Endian ) 來存的。



本文引用自: http://windsoul0312.pixnet.net/blog/post/29915007-%E9%9B%BB%E8%85%A6%E5%B8%B8%E8%A6%8B%E7%9A%84%E6%9有關各國語文翻譯公證的問題歡迎諮詢華頓翻譯公司02-77260932
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 jacquesj523 的頭像
    jacquesj523

    jacquesj523@outlook.com

    jacquesj523 發表在 痞客邦 留言(0) 人氣()