Big5
出典: フリー百科事典『ウィキペディア(Wikipedia)』
Big5(ビッグファイブ、中国語名:大五碼あるいは五大碼)は、台湾、香港、マカオの繁体字中国語圏で最も一般的に使われている文字コード(文字集合)。
目次 |
[編集] 概要
ローマ字、アラビア数字、蘇州号碼、記号類、注音符号のほか、漢字13,062字を収録するが、そのうち2字は重複しているため、実際の漢字の文字集合は13,060字である[1]。台湾や香港、マカオなどの繁体字地域で普及しているが、2003年にCNS 11643の附属書で追認されるまでは公的規格ではなかった。WindowsやMac OSといったオペレーティングシステムで採用されたことにより定着したデファクトスタンダードである。
1984年5月1日に台湾の資訊工業策進会(Institute for Information Industry)が制定した。5大パソコンメーカーであったエイサー(宏碁)、マイタック(神通)、佳佳、ゼロワン(零壱)、FIC(大衆)が共同で策定したことによりこの名がある。
2バイトで約13000字を収容し、第一バイトは0xA1~0xC6および0xC9~0xF9、第二バイトは0x40~0x7Eおよび0xA1~0xFEの範囲をとる。大きく分けて、非漢字、常用漢字、次常用漢字の3つのブロックで構成され、漢字は画数順に配列されている。一部、重複している漢字や、配列の誤りがある。
符号空間がシフトJISと似ており、第二バイトに0x5Cが含まれるため、シフトJISの抱える円記号問題と同様の問題をも抱えている。ただし、シフトJISはJIS X 0208文字集合の符号化方式の一つであるのに対して、Big5は文字集合と符号化方式が一体化しており、通常これ以外の符号化方式で利用されない点が大きく異なる。
[編集] 変種
いくつかの独自拡張があるが、中でも倚天(Eten)のものと香港大学(HKU)のものが古くから知られている。倚天の拡張は仮名を含んでおり、Big5ベースのシステムで日本語を表現する方法としてさかんに用いられた。
香港では、Big5に未収録の広東語方言字、固有名詞や科学技術に用いる漢字、仮名、漢字の部品などを外字として補充することが行われ、後に香港増補字符集と称する公的な文字集合となった。
[編集] 脚注
- ^ 漢字領域以外に度量衡記号の領域0xA259-0xA261に「兙兛兞兝兡兣嗧瓩糎」の9文字がある。重複字は「兀」(0xC94A)と「嗀」(0xDDFC)。
[編集] 関連項目