2バイト文字系の文字コード体系
2バイト文字系の文字コード体系の概要
先に説明したように、1バイトでは日本語の文字を表現しきれないので、2バイトの文字コード(或いはマルチバイトの文字コード)が誕生しました。
次から説明する文字コード体系ですが、1バイト文字系と2バイト文字系を合わせて1つの文字コードの名前になります。1バイト系はASCII/JIS7/JIS8の系統かEBCDICの系統のどちらかになりますが、これは既に説明済みのため、2バイト文字コードの部分だけの説明になります。
この2バイト文字系の文字コード体系は、マイナーなものからメジャーなものまでたくさんあります。
1978年にJISがJIS漢字コード(JISコード)を制定したので、その前後に各有力コンピューターメーカーがJIS漢字コードを元に拡張して、独自の2バイト文字系の文字コード体系を用意しています。1980年頃は、日本のコンピュータメーカーに勢いがあった頃なので、「うちのコード体系が一番」と各社競っていたんですね。この頃作られたのが富士通のJEFや日立のKEIS、NECのJIPS、三菱電機のMELCOM漢字などで、ちょっと時期が前後しますが、IBMのIBM漢字が1970年代前半、日本語EUCが1980年中頃です。
パソコンの領域では、MS−DOSやWindowsとかが普及した関係で、マイクロソフトが推していたシフトJISというのが有名です。
それらとは別に、世界共通の文字コードを作ろうということで、Unicodeなどの文字コード体系も作られています。
まず、基本となるJIS漢字コードから始めて、続いて各文字セットを説明します。