CJKV
出典: フリー百科事典『ウィキペディア(Wikipedia)』
CJKVは、中国語・日本語・朝鮮語・ベトナム語 (英語:Chinese-Japanese-Korean-Vietnamese) の略。特に、その4言語で共通して使われる、または使われていた文字体系である漢字(チュノムを含む)のこと。ソフトウェアの国際化、中でも文字コードに関する分野で用いられる。
比較的早くに漢字を廃止し、漢字に含めるべきか諸説あるチュノムを擁するベトナム語を除いた中国語、日本語、朝鮮語の頭文字だけをとってCJKと呼ぶこともある。主な東アジアの書記系を総称するときに用いられる。用語の使用頻度はCJKVよりCJKのほうが多いが、CJKと言いながら実際はCJKVについて述べていることも多い。
目次 |
[編集] 特徴
[編集] マルチバイト文字
CJK、すなわち中国語、日本語、朝鮮語 (韓国語) をコンピューターで扱う場合、英数字とプログラミングや操作に使われる記号に加え、漢字、平仮名、片仮名、ハングルが必要となる。そのため、欧米などの言語のように1文字を1バイト (8ビット) で表すのでは、表現できるパターンが足りずすべての文字を扱うことができない。そのためこれらの言語ではマルチバイト文字を使うことになる。
[編集] 文字の入力
漢字、平仮名、片仮名、ハングル(特に漢字)は文字集合が大きいので、すべての文字をキーボードに直接割り当てると巨大なものとなり、習得は難しくなってしまう。そのため現在では、英字キーボード、もしくはそれにいくつかのキーを追加したキーボードとソフトウェアによるインプットメソッドを使用して入力することが一般的である。そのためには入力先となるソフトウェアが、使用しているインプットメソッドに対応している必要がある。
[編集] 縦書き
コンピューターのテキスト表示・処理は元来横書きであったが、CJK (CJKV) の組版では縦書きへの対応も求められる。その際には単に縦に表示するだけではなく、文字の間隔や配置を縦書き対応にしなければならない。
[編集] 文字コード規格
[編集] Unicode
UnicodeのCJK統合漢字は、ベトナムの符号化文字集合規格であるTCVN 5773:1993とTCVN 6056:1995の漢字(チュニョ〔チュハン〕とチュノム)も原規格として統合しており、実態はCJKVである。たとえば、「U+7551 畑」には、日本語の国字の「畑」(JIS X 0208-1990の482A)とチュノムの「畑」(TCVN 5773:1993の3C2F)が統合されている。