Unicode 編碼區段表
· 閱讀時間約 29 分鐘
Unicode 是一個由非營利組織 Unicode 聯盟所維護的國際性字符編碼標準。該標準旨在統一世界上大部分的文字系統,從而實現跨平臺和多語言環境下的信息交流。Unicode 是 ISO/IEC 10646 標準的實現,也成為全球性的通用字元集。
在 Unicode 標準中,每個字符都對應到一個唯一的數字代碼,這個代碼被稱為「區段」(Code Point)。區段是 Unicode 標準中一個至關重要的概念,用於確定每個獨特字符的位置。
Unicode 的區段範圍從 U+0000 到 U+10FFFF,這意味著它可以容納 1,114,112 個不同的字符。這些區段按照不同的功能和用途被劃分成多個子集,例如:
-
基本多文種平面(Basic Multilingual Plane, BMP):U+0000 到 U+FFFF
包括了拉丁字母、希臘字母、漢字等常用字符。
-
補充平面(Supplementary Planes):U+010000 到 U+10FFFF
包括了更多的象形文字、補充字符等。
有鑒於我們每次需要查找 Unicode 編碼時,總是得花費半小時去把 wiki 的資料表翻出來,所以還是把一些基本的資訊儲存起來吧。
Unicode 區段表
如果你有更近一步的需求,我們還是推 薦你去查原始表格:Unicode 區段
平面 | 區段範圍 | 漢語名稱 | 英語名稱 |
---|---|---|---|
0 BMP | 0000 – 007F | 基本拉丁字母 | Basic Latin |
0 BMP | 0080 – 00FF | 拉丁字母補充-1 | Latin-1 Supplement |
0 BMP | 0100 – 017F | 拉丁字母擴展-A | Latin Extended-A |
0 BMP | 0180 – 024F | 拉丁字母擴展-B | Latin Extended-B |
0 BMP | 0250 – 02AF | 國際音標擴展 | IPA Extensions |
0 BMP | 02B0 – 02FF | 佔位修飾符號 | Spacing Modifier Letters |
0 BMP | 0300 – 036F | 組合附加符號 | Combining Diacritical Marks |
0 BMP | 0370 – 03FF | 希臘字母和科普特字母 | Greek and Coptic |
0 BMP | 0400 – 04FF | 西里爾字母 | Cyrillic |
0 BMP | 0500 – 052F | 西里爾字母補充 | Cyrillic Supplement |
0 BMP | 0530 – 058F | 亞美尼亞字母 | Armenian |
0 BMP | 0590 – 05FF | 希伯來文字母 | Hebrew |
0 BMP | 0600 – 06FF | 阿拉伯文字母 | Arabic |
0 BMP | 0700 – 074F | 敘利亞字母 | Syriac |
0 BMP | 0750 – 077F | 阿拉伯文補充 | Arabic Supplement |
0 BMP | 0780 – 07BF | 它拿字母 | Thaana |
0 BMP | 07C0 – 07FF | 西非書面文字 | NKo |
0 BMP | 0800 – 083F | 撒瑪利亞字母 | Samaritan |
0 BMP | 0840 – 085F | 曼達安字母 | Mandaic |
0 BMP | 0860 – 086F | 敘利亞文補充 | Syriac Supplement |
0 BMP | 0870 – 089F | 阿拉伯字母擴展-B | Arabic Extended-B |
0 BMP | 08A0 – 08FF | 阿拉伯字母擴展-A | Arabic Extended-A |
0 BMP | 0900 – 097F | 天城文 | Devanagari |
0 BMP | 0980 – 09FF | 孟加拉文 | Bengali |
0 BMP | 0A00 – 0A7F | 古木基文 | Gurmukhi |
0 BMP | 0A80 – 0AFF | 古吉拉特文 | Gujarati |
0 BMP | 0B00 – 0B7F | 奧里亞文 | Oriya |
0 BMP | 0B80 – 0BFF | 泰米爾文 | Tamil |
0 BMP | 0C00 – 0C7F | 泰盧固文 | Telugu |
0 BMP | 0C80 – 0CFF | 卡納達文 | Kannada |
0 BMP | 0D00 – 0D7F | 馬拉雅拉姆文 | Malayalam |
0 BMP | 0D80 – 0DFF | 僧伽羅文 | Sinhala |
0 BMP | 0E00 – 0E7F | 泰文 | Thai |
0 BMP | 0E80 – 0EFF | 寮文 | Lao |
0 BMP | 0F00 – 0FFF | 藏文 | Tibetan |
0 BMP | 1000 – 109F | 緬甸文 | Myanmar |
0 BMP | 10A0 – 10FF | 喬治亞字母 | Georgian |
0 BMP | 1100 – 11FF | 諺文字母 | Hangul Jamo |
0 BMP | 1200 – 137F | 衣索比亞字母 | Ethiopic |
0 BMP | 1380 – 139F | 衣索比亞字母補充 | Ethiopic Supplement |
0 BMP | 13A0 – 13FF | 切羅基文 | Cherokee |
0 BMP | 1400 – 167F | 統一加拿大原住民音節文字 | Unified Canadian Aboriginal Syllabics |
0 BMP | 1680 – 169F | 歐甘字母 | Ogham |
0 BMP | 16A0 – 16FF | 盧恩字母 | Runic |
0 BMP | 1700 – 171F | 他加祿字母 | Tagalog |
0 BMP | 1720 – 173F | 哈努諾文 | Hanunoo |
0 BMP | 1740 – 175F | 布希德字母 | Buhid |
0 BMP | 1760 – 177F | 塔格班瓦字母 | Tagbanwa |
0 BMP | 1780 – 17FF | 高棉文 | Khmer |
0 BMP | 1800 – 18AF | 蒙古文 | Mongolian |
0 BMP | 18B0 – 18FF | 統一加拿大原住民音節文字擴充 | Unified Canadian Aboriginal Syllabics Extended |
0 BMP | 1900 – 194F | 林布文 | Limbu |
0 BMP | 1950 – 197F | 德宏傣文 | Tai Le |
0 BMP | 1980 – 19DF | 新傣仂文 | New Tai Le |
0 BMP | 19E0 – 19FF | 高棉文符號 | Khmer Symbols |
0 BMP | 1A00 – 1A1F | 布吉文 | Buginese |
0 BMP | 1A20 – 1AAF | 老傣文 | Tai Tham |
0 BMP | 1AB0 – 1AFF | 組合附加符號擴展 | Combining Diacritical Marks Extended |
0 BMP | 1B00 – 1B7F | 峇里字母 | Balinese |
0 BMP | 1B80 – 1BBF | 巽他字母 | Sundanese |
0 BMP | 1BC0 – 1BFF | 巴塔克字母 | Batak |
0 BMP | 1C00 – 1C4F | 絨巴文 | Lepcha |
0 BMP | 1C50 – 1C7F | 桑塔利文 | Ol Chiki |
0 BMP | 1C80 – 1C8F | 西里爾字母擴展-C | Cyrillic Extended-C |
0 BMP | 1C90 – 1CBF | 喬治亞字母擴展 | Georgian Extended |
0 BMP | 1CC0 – 1CCF | 巽他字母補充 | Sundanese Supplement |
0 BMP | 1CD0 – 1CFF | 吠陀擴展 | Vedic Extensions |
0 BMP | 1D00 – 1D7F | 音標擴展 | Phonetic Extensions |
0 BMP | 1D80 – 1DBF | 音標擴展補充 | Phonetic Extensions Supplement |
0 BMP | 1DC0 – 1DFF | 組合附加符號補充 | Combining Diacritical Marks Supplement |
0 BMP | 1E00 – 1EFF | 拉丁字母擴展附加 | Latin Extended Additional |
0 BMP | 1F00 – 1FFF | 希臘字母擴展 | Greek Extended |
0 BMP | 2000 – 206F | 一般標點 | General Punctuation |
0 BMP | 2070 – 209F | 上標及下標 | Superscripts and Subscripts |
0 BMP | 20A0 – 20CF | 貨幣符號 | Currency Symbols |
0 BMP | 20D0 – 20FF | 符號用組合附加符號 | Combining Diacritical Marks for Symbols |
0 BMP | 2100 – 214F | 類字母符號 | Letterlike Symbols |
0 BMP | 2150 – 218F | 數字形式 | Number Forms |
0 BMP | 2190 – 21FF | 箭頭 | Arrows |
0 BMP | 2200 – 22FF | 數學運算子 | Mathematical Operators |
0 BMP | 2300 – 23FF | 雜項技術符號 | Miscellaneous Technical |
0 BMP | 2400 – 243F | 控制圖形 | Control Pictures |
0 BMP | 2440 – 245F | 光學字元識別 | Optical Character Recognition |
0 BMP | 2460 – 24FF | 圍繞字母數字 | Enclosed Alphanumerics |
0 BMP | 2500 – 257F | 制表符 | Box Drawing |
0 BMP | 2580 – 259F | 方塊元素 | Block Elements |
0 BMP | 25A0 – 25FF | 幾何圖形 | Geometric Shapes |
0 BMP | 2600 – 26FF | 雜項符號 | Miscellaneous Symbols |
0 BMP | 2700 – 27BF | 裝飾符號 | Dingbats |
0 BMP | 27C0 – 27EF | 雜項數學符號-A | Miscellaneous Mathematical Symbols-A |
0 BMP | 27F0 – 27FF | 追加箭頭-A | Supplemental Arrows-A |
0 BMP | 2800 – 28FF | 點字圖案 | Braille Patterns |
0 BMP | 2900 – 297F | 追加箭頭-B | Supplemental Arrows-B |
0 BMP | 2980 – 29FF | 雜項數學符號-B | Miscellaneous Mathematical Symbols-B |
0 BMP | 2A00 – 2AFF | 補充數學運算子 | Supplemental Mathematical Operators |
0 BMP | 2B00 – 2BFF | 雜項符號和箭頭 | Miscellaneous Symbols and Arrows |
0 BMP | 2C00 – 2C5F | 格拉哥里字母 | Glagolitic |
0 BMP | 2C60 – 2C7F | 拉丁字母擴展-C | Latin Extended-C |
0 BMP | 2C80 – 2CFF | 科普特字母 | Coptic |
0 BMP | 2D00 – 2D2F | 喬治亞字母補充 | Georgian Supplement |
0 BMP | 2D30 – 2D7F | 提非納文 | Tifinagh |
0 BMP | 2D80 – 2DDF | 衣索比亞字母擴充 | Ethiopic Extended |
0 BMP | 2DE0 – 2DFF | 西里爾字母擴展-A | Cyrillic Extended-A |
0 BMP | 2E00 – 2E7F | 補充標點 | Supplemental Punctuation |
0 BMP | 2E80 – 2EFF | 中日韓漢字部首補充 | CJK Radicals Supplement |
0 BMP | 2F00 – 2FDF | 康熙部首 | Kangxi Radicals |
0 BMP | 2FF0 – 2FFF | 表意文字描述字元 | Ideographic Description Characters |
0 BMP | 3000 – 303F | 中日韓符號和標點 | CJK Symbols and Punctuation |
0 BMP | 3040 – 309F | 平假名 | Hiragana |
0 BMP | 30A0 – 30FF | 片假名 | Katakana |
0 BMP | 3100 – 312F | 注音符號 | Bopomofo |
0 BMP | 3130 – 318F | 諺文相容字母 | Hangul Compatibility Jamo |
0 BMP | 3190 – 319F | 漢文訓讀符號 | Kanbun |
0 BMP | 31A0 – 31BF | 注音符號擴展 | Bopomofo Extended |
0 BMP | 31C0 – 31EF | 中日韓筆畫 | CJK Strokes |
0 BMP | 31F0 – 31FF | 片假名語音擴展 | Katakana Phonetic Extensions |
0 BMP | 3200 – 32FF | 中日韓圍繞字元及月份 | Enclosed CJK Letters and Months |
0 BMP | 3300 – 33FF | 中日韓相容字元 | CJK Compatibility |
0 BMP | 3400 – 4DBF | 中日韓統一表意文字擴充區 A | CJK Unified Ideographs Extension A |
0 BMP | 4DC0 – 4DFF | 易經六十四卦符號 | Yijing Hexagram Symbols |
0 BMP | 4E00 – 9FFF | 中日韓統一表意文字 (基本區) | CJK Unified Ideographs |
0 BMP | A000 – A48F | 彝文音節 | Yi Syllables |
0 BMP | A490 – A4CF |