See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
機種依存文字 - Wikipedia

機種依存文字

出典: フリー百科事典『ウィキペディア(Wikipedia)』

機種依存文字(きしゅいそんもじ)または環境依存文字(かんきょういそんもじ)とは、電子的に扱う文字データのうち、処理系(ソフトウェアおよびハードウェア)によって違う文字に表示されたり、全く表示・印刷できなかったりするものの慣用的な総称である。JEFJIPS等のようなメインフレーム/汎用機用の符号化文字集合については、コード体系そのものが機種依存するという前提があるため、本項では扱わない。

不特定多数との通信で機種依存文字を使用すると文字化けの原因にもなる。

目次

[編集] 機種依存文字に関する歴史

[編集] 初期

日本語の文字コード体系は、JIS C 6226-1978によって第一水準漢字、第二水準漢字、非漢字として規格化されたが、これらは実際の文書作成の際に必要となる記号や組文字を十分に組み込んだものではなかった。そして、コード空間の空き領域(09区~15区)は「一時的・局所的に文字を割り当てて使用しても構わない」自由領域とされた(この規定は1997年JIS X 0208-1997から削除)。

そのため、コンピュータメーカー各社はそれぞれ独自に拡張した記号類をこの領域に収録し、外字領域として扱われることになった。コンピュータの機種によって違う文字が表示されるコード領域となった。

[編集] 問題の表面化

1987年頃から主要なパソコン通信サービスが開始されるようになった。多くのパソコンがホスト局に接続され、電子掲示板電子メールなどで文章のやり取りが行われるようになると、特に問題となったのがPC-9800シリーズMacintoshDOS/V間での表示の相違だった。このことから、これらのコードをパソコン通信等の世界では「機種依存文字」と呼ぶようになった。また、当時PC-9800シリーズのシェアが多かったために、PC-9800(あるいはエプソンのPC-9800互換機)シリーズでしか表示できない文字として「98文字」(キューハチ文字)と呼ぶようになった。

Macintoshが機種依存文字で不利な立場に立たされたのは、シェアの低さだけでなく、Microsoft Windowsが1992年という早い段階からWindows標準システム外字に統一されたのに対して、Macintoshは二転三転を繰り返してきたことも指摘されている[1]

[編集] 現在

現在では、文字表示はオペレーティングシステム(OS)の役割となっており、使用するフォントセットによって拡張文字の表示は変化するため、「機種依存文字」の呼称は正確性を失うものとなった。また、機種依存文字の代表格だった丸囲い数字、ローマ数字などはUnicodeに収録され規格内のコードとなった。しかし、歴史的な経緯から、表示に関して機種依存性が高い文字の総称として現在も使用されている。この意味では半角カナも広い意味で機種依存文字ということができる。

なお機種依存文字の定義があいまいになった現在においても、典型的な機種依存文字であると言えるのが、携帯電話インターネット接続サービス(NTTドコモiモードなど)対応電話機で使用される「携帯電話の絵文字」である。これらの文字はShift_JISのユーザ拡張領域やUnicodeの私的領域に登録されており、他の機種においては別の実装をされている可能性が著しく高いからである。

なお、上記の領域はCP932においてユーザ拡張領域と定められているに過ぎず、JIS X 0208:1997においては拡張そのものが禁止されている。

[編集] 機種依存文字の定義

[編集] 1980年代

1980年代においては、以下の理由により、ベンダ定義文字(各コンピュータメーカーが、公的規格には無い文字を独自に拡張して搭載した文字)が、機種依存文字であるという定義が成り立っていた。

  • 日本語文字コードの公的規格はJIS X 0201JIS X 0208だけだった。
  • 各メーカーのパソコンごとに搭載されているフォントセットの文字集合がまちまちだった。

ただし、公的規格であっても、以下のような文字は、規格が普及・定着するまでは機種依存文字とされることがあった。

  • JIS X 0208 第2水準
  • 新JIS(JIS C 6226-1983)で追加もしくは字形が変更された文字

[編集] 2000年代

以下の理由により2000年代では、機種依存文字について、「どんな機種でも表示できるとは言えない文字」、もしくは、「異機種間のデータ交換の際に文字化けする確率が高い文字」という程度の定義しか出来ない。

  • Microsoft WindowsにおいてShift_JISに独自拡張された文字は全てUnicodeに登録されている。
  • 現在、日本で使われる符号化文字集合の公的規格は以下のように何種類も存在する。
  • 現在のほぼすべてのOSでは、フォントセットの切り替えによって、表示に使う文字集合を切り替えられる。
  • 現在のほぼすべてのOSでは、さまざまな文字符号化方式(エンコーディング)に対応している。
  • Microsoft WindowsのShift_JISの独自拡張だったNEC特殊文字は、現在ではJIS X 0213:2000において、同一面区点の位置に登録されている。また、iモードのShift_JISにおいてはNEC特殊文字はMicrosoft WindowsのShift_JISと同様のコードポイントで利用可能である。
  • JIS X 0213:2004の一部の文字などは公的規格の文字にもかかわらず、使える機種がWindows Vista搭載のPC等、ごく一部の機種に限られてしまうという実情がある。

[編集] 機種依存などの理由による文字の誤表示の各ケース

文字が正しく表示できないことについては、「どのように(How)表示出来なかったのか」という観点と、「なぜ(Why)表示出来なかったのか」という観点の二種類から語ることが出来る。

  • 「How」の2種類
    • 「〓(ゲタ)」「・(中黒)」「□(豆腐)」等の文字に置換されて表示された。
    • 別の文字として表示(文字化け)された。
  • 「Why」の3種類
    • 表示しようとしている文字がフォントセットの中に用意されていない。
    • データ自体と表示設定とで文字符号化方式(エンコーディング)が違う。
    • システム固有の登録文字を他システムで表示しようとしている。

「〓(ゲタ)」「・(中黒)」「□(豆腐)」等の文字に置換されて表示された場合というのは、大抵の場合、エンコーディングは一致しているものの、フォントセットを表示側のシステムが用意していない時である。

別の文字として表示(文字化け)された場合というのは、エンコーディングが違うか、システム固有の登録文字を他システムで表示しようとしている時である。

この中で、「フォントセットを表示側のシステムが用意していない」場合と「特定のシステムに固有の登録文字を他システムで表示しようとしている」場合が「機種依存」であるとされる。

詳しくは「文字化け」の項目を参照。

[編集] 機種依存文字問題の現在

機種依存文字に関しては、ネチケットを取り扱っているウェブページ等、色々な所で議論されることもある。しかし、2008年現在では、OSとしてMicrosoft Windowsがシェアとして非常に多い状況となっており、また他のOSを殆ど使用したことがない人、Mac OS XLinuxなどの、別のOSでテストする環境が一切ない人も少なくない。そのため、コンピュータの初心者のみならず上級者でも、いわゆるコンピュータ会社や工学部のある大学、インターネットサービスプロバイダのウェブページ、またそこから送信される電子メールの文章等に、公然とNEC特殊文字IBM拡張文字が含まれていることも往々にして存在する。なぜ、このようなことが可能なのかと言うと、Microsoft Windowsのメーラーが扱う文字符号化方式は純然たるISO-2022-JPではなく、それを拡張したCP50220であることが多いためである。同様にそれを閲覧する側にも、Microsoft Windowsを利用している人が多いため、それを指摘しない、指摘できない、気づかない、指摘する必要が無い場合も多く、しばしば放置されている事が多いのが現状である。

しかし、少数でもLinuxやMac OS Xなどを使用しているユーザーが世界に存在している以上、ウェブページを制作したり、ブログを書いたり、BBSを使用したり、電子メールを送信したり、DTP編集にかけるためのテキスト原稿を提出する場合には機種依存文字の問題について注意を払うべきである。機種依存文字が原因で誤植が発生した事例も過去に存在する。

[編集] 機種依存文字の将来

将来的にはUnicodeが文字コードの標準になると推測される。しかし、Unicodeに対応していないソフト、ウェブサイトは今でも多く、標準化にはしばらく時間がかかると推測される。

[編集] 脚注

  1. ^Apple にまつわる歴史

[編集] 関連項目

[編集] 外部リンク


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -