更新时间:2022-06-15 13:20
表意文字补充平面(Supplementary Ideographic Plane,简称SIP),或称第二平面(Plane 2),是Unicode中的一个编码区段。编码从U+20000至U+2FFFF。它是在Unicode里面基本多文种平面以外储存的字符。现时整个平面所配置的,全部都是一些罕用的汉字、或地区的方言用字,如粤语用字及越南语的字喃。
状态
已分配和计划分配的编码区段为:
00020000-0002A6DF:中日韩统一表意文字扩展 B (CJK Unified Ideographs Extension B)Unicode的PDF文件
0002A6E0-0002F7FF:中日韩统一表意文字扩展 C1 (CJK Unified Ideographs Extension C1)
还在草拟阶段,预计最快要到2007年才可以公布最后草案(FDAM)。
0002F800-0002FA1F:中日韩兼容表意文字增补 (CJK Compatibility Ideographs Supplement)Unicode的PDF文件
扩展B
扩展B段包含有42,711个新的汉字。根据ISO/IEC JTC1/SC2/WG2/IRG N777号文件,这四万多个汉字分别从以下字典或字集中取得:
CNS 11643的第4平面到第15平面所收录的30,177个汉字;
在《汉语大字典》中出现的28,914个未收录汉字;
在《康熙字典》中出现的18,486个未收录汉字(包括一个在补遗篇出现汉字);
在北朝鲜的国家标准所收录的5,642个汉字;
在越南的国家标准所收录的4,232个字喃;
HKSCS中出现的1,081个未收录汉字;
《汉语大词典》中出现的553个未收录汉字;
《四库全书》中出现的522个未收录汉字;
日本国家工业标准的JIS x 0213第3平面及第4平面的302个未收录汉字;
1980年代版本的《辞海》中出现的247个未收录汉字;
大韩民国PKS 5700-3:1998中出现的166个未收录汉字;
《中国大百科全书》中出现的86个未收录汉字;
《辞源》中出现的66个未收录汉字;
北大方正排版系统中出现的65个未收录汉字;
这堆汉字中重覆的汉字有不少,所以经过整理之后,总数实际上只有42,711个汉字。