文字コードについて
NECのオフコンは、1バイトの文字をEBCDIC、2バイトの文字をA−VX内部コードという文字コードでファイルに保存しています。
一方、オープンのシステムは、シフトJISとかUnicodeとかいう文字コードを使っています。
オフコンのデータをオープンのシステムで使うには、文字コードの変換とかが必要になってきます。
文字コードの種類は、いくつもあるみたいだし、G1集合とか区点とか普段余り聞かないような単語も登場する。JISコードとかシフトJISとかJIS90とか、「ジス」がいろいろ出てくるけど、これらの関係は?とか、文字コード間で変換したら文字化けしたとか、同じ文字のはずなのにサーバの画面で見た文字とパソコンの画面で見た文字が違ったりする。文字コードに関する謎はたくさんあります。
私が文字コードについて勉強したものをまとめてみました。どちらかというと、自分用のメモです。ついでなのでNECのオフコンとは関係無さそうな文字コード体系についても書いています。
なにぶん、以上のように個人的に勉強してまとめたものなので、間違いはたくさんあると思います。
日本語EUCとUnicodeについては、主にインターネット上の情報で勉強したので、Googleか何かで検索して、そういったサイトに行ってもらった方が良いです。
前書き的なもの
1バイト文字系の文字コード体系の概要
・ASCII(アスキー)
・JIS7/JIS8
・EBCDIC (の仲間)
2バイト文字系の文字コード体系の概要
・JIS漢字コード
・1バイト文字のコードと2バイト文字のコードの区別
・Shift JIS(シフトJIS)
・JIPS
・NEC内部コード(A−VX内部コード)
・JEFとKEIS
・IBM漢字システム
・日本語EUC
・Unicode
文字コード体系間