海外にあり外国人が管理している国際データベースの日本語訳を私が担当しています。
英語の原文を各国語の担当者が Web ブラウザを介して訳すPHPベースのシステムです。
これから仕事を始めるにあたって、以下の条件に最もかなう文字コードを選びたいと思います。
・閲覧ブラウザの文字化けや、非日本語ホスト上でのデータ変質(ビット落ち)などのトラブルが起きにくい。
・非日本語ホスト上で検索プログラムが作りやすい。
・将来的に使われなくなる恐れがなく、他の日本語訳担当者に引き継ぎやすい。
・入力できる環境が普及している。
http://www.mars.dti.ne.jp/~torao/program/appendix/japanese.html では JIS は化けやすいと
言っている一方で、
http://tohoho.wakusei.ne.jp/wwwxx005.htm のように JIS が一番化けない、
という人もいるので、よく分からなくなりました。
サイト管理者に日本語の知識がなく、日本語環境として poor であることを前提にアドバイスをお願いします。
(もちろん、文字コードは明示的に指定するつもりです)
URLは参考に。
動作するOSで変わるとはおもいますが、文字化けが多いShift-Jisは避けましょう。
Linuxならば大体はEUCが標準漢字コード(のはず)ですので、EUCをおすすめします。
Unicodeは国際標準ではありますが対応しているソフトが少ない為、あまりおすすめできません。
> サイト管理者に日本語の知識がなく、日本語環境として poor であることを前提
ということですので、JISがよろしいのではないでしょうか。
JISは日本語に対応していないソフトでみても壊れません。
実際、メールなどもJISでやりとりされています。
結局、文字化けはHTML文の文字コードの指定のミスのようですが。
こちらのURLの方が詳しく記載されているようです。
2番目のサイトは、英語圏に住む日本人の方が書かれたようで参考になりますね。ありがとうございます。
http://support.microsoft.com/default.aspx?scid=kb;ja;413582
[IE5]日本語Webページが文字化けする場合(エンコードの推奨設定)
私は、海外のプロジェクトの日本語ページを管理しているのですが、unicodeはまず使わないほうが良いです。
特定のwindows上でIEを使用した場合、文字化けする可能性があります。
ただし、それ以外のブラウザでは問題ありません。今後unicode標準となる流れなので
時期早々ですが、あえて使うというのも手です。
JISは、過去の遺産です。引継ぎ時に問題がしにくいこと請け合いです。SMTPの問題のために残っているだけ。
shift-jisとEUCのどちらかが良いと思います。
しかし、私の経験上、shift-jisはプログラムのバグの原因になることがありますので、EUCをお勧めはします。
http://www.shtml.jp/mojibake/binew.html
「美乳」で文字化けが直るって本当?
ただし、EUCの問題として、自動判定しにくい文字コードであるため上記のような対策が必要になることがあります。
ありがとうございます。
今までの意見を総合すると、
・shift-jis はあまりよくない。
・unicode は現時点で普及が今一つ。
というところで、EUC か JIS のどちらかですね。
データベースなので検索の容易さについての意見もお待ちしております。
7ビットしか使わない JIS であれば非英語環境のツールや大昔のツールでも大丈夫なので、私も JIS がいいかと思うのですが、
・エスケープシーケンスのために検索プログラムが書きにくくないか?
・一番古いので一番早く廃止されないか?
というのが心配な点です。