Unicode與UTF-8
Unicode的發展旨在建立一個新的標準,用於對映當前使用的絕大多數語言中的字元,以及建立文字所必需的其他字元。UTF-8只是編碼檔案的多種方法之一,因為有多種方法可以將檔案中的字元編碼為Unicode。
UTF-8的開發考慮到了相容性。ASCII是一個非常突出的標準,那些已經使用ASCII標準的人可能會猶豫是否採用Unicode,因為它會破壞他們當前的系統。UTF-8消除了這個問題,因為任何只在ASCII字符集中包含字元的編碼檔案都會產生一個相同的檔案,就好像它是用ASCII編碼的一樣。這使得人們可以採用Unicode,而不需要轉換他們的檔案,甚至不需要更改他們目前不知道Unicode標準的遺留軟體。Unicode的任何其他對映方法都會破壞與ASCII的相容性,並迫使人們轉換他們的系統。
遵守UTF-8與ASCII的相容性會產生副作用,這使得它非常適合字處理,因為在大多數情況下,所有使用的字元都包含在ASCII字符集中。UTF-8僅使用一個位元組來表示每個程式碼點,從而導致檔案大小為UT-16中使用2個位元組編碼的相同檔案的一半,以及UTF-32中使用4個位元組編碼的相同檔案的四分之一。
由於UTF-8既節省空間又面向位元組,它已被全球資訊網採用。網頁通常是簡單的文字檔案,通常不包含ASCII字符集以外的任何字元。使用其他編碼方法只會增加網路負載,而沒有任何好處。即使在電子郵件傳輸系統中,UTF-8也在緩慢但肯定地被採用,以替代仍在使用的舊編碼系統。
Summary:1. Unicode 是計算機顯示和操作文字的標準,而UTF-8是Unicode2的許多對映方法之一。UTF-8是一種對映方法,它保留了與舊的ASCII3的相容性。與其他編碼方法相比,UTF-8是最節省空間的Unicode對映方法4。UTF-8是web上最常用的Unicode標準
...rchar的語法是varchar[(n | max)]。Varchar儲存的ASCII資料是非Unicode資料,它是正常使用中使用的資料型別。Varchar每個字元使用一個位元組。它還將每個字串的長度儲存在資料庫中。Varchar的資料長度可變,最多可以儲存8000個非Unicode...
... 新Windows終端的主要功能包括“多標籤、Unicode和UTF-8字元支援、GPU加速的文字呈現引擎、自定義主題、樣式和配置。”微軟還增加了自定義Windows終端的方法。 ...
ASCII和Unicode都是指文字的數字表示的標準,特別是組成文字的字元。然而,這兩個標準有著顯著的不同,許多屬性反映了它們各自的創作順序。 ...
... ASCII得到了極大的擴充套件,並被Unicode所取代,Unicode是一個更全面、更雄心勃勃的標準,下面將對此進行討論。2008年,Unicode在網路應用方面超過了ASCII。 ...
...作為字元呈現在螢幕上。 相關:什麼是字元編碼像ANSI和Unicode,他們有什麼不同? 到目前為止,非常簡單,特別是如果你認為字母表中只有26個字元,10個數字,還有一些語法標記,比如!或者@。 然而,也有26個大寫字母和更多...
...作。 倒過來的文字實際上只是一種技巧,它使用特殊的Unicode符號,看起來像是倒過來的字母,儘管它們實際上並沒有倒過來。用正確的倒過來的字母替換普通的字母,就好像你在倒過來寫一樣。 倒置示例 下面是使用Unicode字...
...所取代,其中包括像歐元符號這樣的更新字形。 (藏文Unicode v4節選自unicode.org) Unicode–此編碼標準旨在實現通用性。它目前包括93個指令碼組織在幾個街區,與更多的工作。Unicode的工作原理與其他字符集不同,它不是直接為...
...OM)時建立的。 BOM是一個不可見(對使用者而言)的可選unicode字元,它出現在UTF編碼文字的第一行前面,向讀取文字的應用程式發出訊號,說明文字文件是使用16位還是32位整數編碼的,以便應用程式可以正確設定位元組順序。 ...
...r schemes, which would conflict if read from different language terminals. Unicode came into being as a solution to the existence of different terminals by merging all possible meaningful characters into a single abstract character set. UTF-8 is one way to encode the Unicode character set. It is a v...