JISコードについて調べていてわからなかったので質問します。
・メール等で利用されているいわゆる文字コードとしての「JISコード」が生まれたのは何年のことでしょうか?流れを見る限り 英語圏のASCII → JISコードを制定 → 問題点があったのでシフトJISを作った ということだと思ったのですが、年で調べた限り、シフトJISの方が早く生まれているというものしか見つかっていません。
・電子メールでは元々アルファベットしか対応してなかったようですが、日本語(MIME経由でJISコード)が扱えるようになったのは何年のことでしょうか?
文字コードの話はいくつも層があり、時に異なる層に似た用語が流用されたりしていてややこしいのですが、まずは質問への回答を。
以下はもうちょっと細かい話です。
文字コードを決めるには、まず「文字の集まりを決めて、それぞれの文字に区別するための番号を振ったもの」=「符号化文字集合」を決める必要があります。日本語では伝統的に「JIS漢字コード」がそれに相当します。これはいくつかの規格の集まりで、何度も改訂されていますが最初に制定された年は次のとおりです。
「JIS漢字コード」の「コード」は単に文字を区別するための数字で、それが直接コンピュータ上で扱われるわけではありません。(このコードは「○区△点」などと表現されていたので「区点コード」とも呼ばれていました。) 同じ符号化文字集合について、それをコンピュータ上でどう表現するかというやり方はいくつもあり、そのやりかたを「文字符号化方式」と呼びます。
「シフトJIS」は基本的には、JIS漢字コードをパソコン上で符号化するために決められた文字符号化方式です (しかし現実には、各ベンダが拡張文字を入れたため、符号化文字集合も同時に決めることになってしまったのですが)。ASCIIおよびいわゆる半角カナの範囲と重ならないように、JIS漢字コードの区点に簡単な演算を施してコードを算出します。最初に定められたのは1982~3年頃のようです。
いわゆる「JISコード」であるISO-2022-JPも、JIS漢字コードを符号化するための文字符号化方式です。こちらは、当時7bit文字しか扱えなかった電子メールシステム上で様々な文字集合を切り替えて扱うための枠組みであるISO 2022という仕組みを使ってJIS漢字コードを符号化したものです。上記のとおり、時期的にはシフトJISより後になりますが、そもそも目的が違うのでどちらがどちらの改良であるとかそういう関係ではありません。
気になったので自分のアーカイブを掘ってみました。今のところ手元に残った最古のメールは1996/3/18で既にヘッダにMIME-Version:1.0が入っています (MUAはEudora)。しかしこの時期のメールを見てみるとsubjectは日本人同士でも大半がASCII onlyで、日本語の場合もiso-2022-jpがそのまま入ってますね。 (MUAがセーブ時にデコードしていた可能性もありますが)。(これ以前は大学のアカウントだったからQICテープにアーカイブが取ってあるはずだけど読める環境が…)
2013/11/28 14:58:04practicalschemeさん、TransFreeBSDさん、meeflaさん、コメントありがとうございます。
2013/11/28 19:11:00>practicalschemeさん
こちらが調べたところによると、JUNETコードを作った方がRFC化したような流れで、JUNETコードという名前で元々RFC化しようとしたものの、最終的に(iso-2022方式を内部的に利用していたから?)iso-2022-jpに落ち着いたという経緯があるという記述を見かけました。あと、わざわざアーカイブ確認していただいてありがとうございます。参考になります。
>TransFreeBSDさん
当時のニュースグループの書き込みを見ていて件名が文字化けしてると思ったら、これESC抜きでエンコードしているんですね(笑)当時の様子から、大体その時の対応状況について伝わってきますね。インターネットが登場した以降の情報はインターネットのどこかに残っていて、インターネット自体が遺産みたいなものですね(笑)だからこそ逆にインターネットの黎明期の情報が少ないわけですが・・。
>meeflaさん
なるほど、こちらは大手会社のソフトの対応ということで、新情報ありがとうございます。やはり93年から96年ぐらいにかけて、ユーザー側、ソフト開発会社ともに一気に対応が進んだという感じなんですね。コメントありがとうございます。