1バイト文字系の文字コード体系
ASCII(アスキー)
ASCII文字コードは、American Standard Code for Information Interchangeの略で、ISO 646とANSI X3.4の規格書で定義された文字コード体系です。「American〜〜」という名前でわかるように、もともとはアメリカで作られた文字コード体系です。
ASCII文字コードは、7ビットで構成された文字コード体系で、94個の印字可能な文字と空白文字で構成されています。下表がASCII文字コードに33個の制御文字を追加したコード表です。(制御文字はなんぞやという話もありますが、ここでは省略します。)「SP」は空白の意味です。
ASCII文字コードには、拡張文字セット規格があります。この拡張文字セット規格は、7ビットあるいは8ビットで表現され、最大で256種類の文字を表現できます。
7ビットで表現する場合は、シフトイン(SI)とシフトアウト(SO)を使って、基本の領域の文字と拡張文字領域の文字を切り替えます。
8ビットで表現する場合は、8ビット目でシフトイン(0)とシフトアウト(1)を切り替えて使用します。
7ビットで表現する場合はオンライン処理の場合がほとんどで、コンピュータの文字処理(ファイルに保存するとか)には8ビットで表現した方が使われます。
拡張文字領域は幾つかの組み合わせがあり、それはISO 8859で定義されています。
下の表が、ASCII文字コード(拡張文字セット規格)のコード表です。
と難しい話はこれぐらいにして、実際にASCIIという文字コード体系がどのようなものなのか見てみましょう。
今議論しているのは、コンピュータで使用する場合なので、8ビット表現の場合で考えます。
ASCII文字コード(拡張文字セット規格)のコード表から、「A」の文字コードを調べてみましょう。
まず表の中の「A」という文字を探してください。列が4、行が1の位置にあると思います。16進数で41が、ACSII文字セットの場合の「A」の文字コードになります。(10進数だと65)
同じように調べると、「Z」は16進数で5A(10進数で90)、「S」は53(83)、「C」は43(67)、「{」は7B(123)になることが分かります。
逆に16進数で「41 53 43 49 49」という数値群があったら、これを文字に置き換えると「ASCII」となることが分かると思います。