【9-1】
文字コード
メールやwebページで文字化けを起こしたことはありませんか?
同じ日本語で書かれたはずなのにどうしてだろう・・・と思いますよね。

では、実際に両者を見てみましょう。
普通のページ
文字化けを起こしているページ

そもそも文字化けとは、文字コードというものが深く関係しています。
【Shift JIS】【JIS】【EUC】【Unicode】と、有名な文字コードを並べてみましたが
同じ日本語を表すのになぜいくつも種類があるのか、という話を簡単にします。

そもそも文字というのは、コンピュータの内部では数字として扱われます。
日本語であれば1文字が2バイト(16進数4桁)になります。
もともとJIS(日本工業規格)が制定した【JISコード】は1バイト(16進2桁)でした。(半角文字のみ)
そして漢字などの全角文字を表現するために2バイト(16進4桁)で表現することにしました。
しかし、それにより整合性がとれなくなり、それを解消するために作られたのが【Shift JIS】で、現在の主流になっています。
【EUC】は主にUNIX用の文字コードです。【Unicode】は世界の全ての言語を網羅した文字コードです。

例えば「あ」という文字は【Shift JIS】では82A0 【JIS】では2422 【EUC】ではA4A2 【Unicode】では3042と表現します。
つまり同じ日本語でも、表現するコードが違えば読めない(文字化けを起こす)ということになります。

文字化けは故意に起こすことは簡単です。さっきの文字化けページは【EUC】で書いたのに対して
読み込むときは【Shift JIS】に設定してあるだけです。なので、【EUC】で読み込んであげれば解決です。
IEなどのブラウザには文字コードを変える機能があります。それを使って、さっきの文字化けを直してみましょう。
ページを開いたら メニューより 表示 → エンコード → 日本語(EUC)です。
もし日本語(EUC)がなければ、その他 の中にあるはずです。

どうですか?読めましたでしょうか。もしどれにも合わないとか、1つ1つ確かめるのが面倒だという場合は、
表示 → エンコード → 自動選択 でも大丈夫です。

では、実際に問題を解いてみましょう。

問題 9-1 文字化けだらけ

++ 補足1 ++
上記の文字コードについては、私がなんとなく書いたものです。^-^;A
どこまで正しいかはわかりませんので、軽く受け止めて下さい。

参照サイト 情報・通信事典 e-Words 「文字コード

++ 補足2 ++
ブラウザより文字コードを変換すると、次に開いたページも同じ文字コードのままに
なってしまう場合があります。同じ文字コードならいいですが、そうでない時は文字化けを起こします。
このサイトは【Shift JIS】で、書かれているので注意して下さい。