メールには「使えない文字」がある
 ――
「文系な」あなたに贈るパソコン使いこなし講座


●おしらせ(2005.10.26)

このページは更新を停止した古いコンテンツです。書いてあることにまちがいはないと思いますが、新しいコンテンツをごらんになったほうがいいでしょう。新しいコンテンツは「●メールとウェブのお役立ちメモ」からどうぞ。

 電子メールは「各種の情報を記したヘッダ+本文」から成り立っています。そしてその実体は「テキストファイル」。それでは、テキストファイルだったら、どんな文字でも使えるのでしょうか?

 実はメールには「使えない文字」があります。そして「使えない文字」をメールに書いてしまうと、その部分が違う文字になったり、あるいは空白になったり……といった「文字化け」を起こしてしまうのです。

■「使えない文字」はこんなにある!
 「使えない文字」には次のようなものがあります。ウィンドウズ98を例にして、とにかく挙げていきましょう。

《図1》半角カタカナ
 図1:半角カタカナ
 濁点や半濁点も含まれます。これらは「顔文字」に使われていることがあるので、注意しましょう。

《図2》半角句読点類
 図2:半角句読点類
 半角のかぎや中黒(なかぐろ)も含まれます。特に半角中黒は、顔文字に使われていることがあります。

《図3》丸付き数字
 図3:丸付き数字
 シフトJISのコード番号では8740―8753にある文字。
 NECのPC-9801シリーズで採用されました。メールでは、(1)、(2)のように、半角かっこと半角数字を組み合わせて書きましょう。

《図4》ローマ数字の大文字
 図4:ローマ数字の大文字
 シフトJISのコード番号では8754―875Dにある文字。
 NECのPC-9801シリーズで採用されました。メールでは、I、IIのように、半角アルファベットの大文字で書きましょう。ちなみにローマ数字の小文字は、i、iiのように書きます。

《図5》単位の記号類
 図5:単位の記号類
 シフトJISのコード番号では875F―8775にある文字。
 NECのPC-9801シリーズで採用されました。メールでは、ミリ、キロのように全角カタカナで書いたり、mm、cmのように半角アルファベットを組み合わせて書きましょう。

《図6》その他の記号類
 図6:その他の記号類
 シフトJISのコード番号では877E―879Cにある文字。
 NECのPC-9801シリーズで採用されました。メールでは、No.、Tel、(株)、(有)のように書きましょう。

《図7》NEC選定のIBM拡張漢字
 図7:NEC選定のIBM拡張漢字
 シフトJISのコード番号ではED40―EEFCにある文字。
 IBMのメインフレームで使われていた拡張漢字の一部をNECが選定し、同社のPC-9801シリーズで採用しました。人名表記に使える漢字があって便利なのですが、メールでは使えません。ひらがなで書くしかないでしょう。

《図8》IBM拡張漢字
 図8:IBM拡張漢字
 シフトJISのコード番号ではFA40―FC4Bにある文字。
 IBMのメインフレームで使われていた拡張漢字で、PC/AT互換機(要はDOS/Vパソコンですね)用のOS(MS-DOSやPC-DOS)で採用されました。これもメールでは使えません。ひらがなで書くしかないでしょう。

■「使えない文字」が存在する理由――文字コードと文字集合
 こうした「使えない文字」が存在する背景には、「文字コード」と「文字集合」の問題があります。とても複雑な問題なのですが、ここではごく簡単に説明しておきましょう。

 コンピュータで文字を扱う際には、1文字ごとに処理用の番号を振らなければなりません。この処理用の番号が文字コード。ウィンドウズ98では「シフトJIS」という文字コードが使われています。一方インターネットでは、通信規格の制約からシフトJISが使えず、代わりに「ISO-2022-JP」という文字コードを使うようになりました。

 ISO-2022-JPという言葉を聞いて何か思い出したあなたは……メールのヘッダを見てみましょう。「Content-Type」という項目に「charset="Shift_JIS"」と書いてあるはず。これがメールの文字コード指定なんですね。

 それはともかく、問題は、シフトJISとISO-2022-JPのそれぞれが準拠している文字集合です。どちらも日本工業規格(JIS)の定めた2つの文字集合――
・「JIS X 0201」(いわゆる半角文字を規定)
・「JIS X 0208」(いわゆる全角文字を規定)
に準拠しているのですが、微妙に異なる部分があります。

 JIS X 0201について見ると――
・シフトJIS……半角カタカナと半角句読点類(《図1》―《図2》)を使っている
・ISO-2022-JP……半角カタカナと半角句読点類を使っていない

 JIS X 0208について見ると――
・シフトJIS……メーカーが独自に拡張した文字(《図3》―《図8》)を追加している
・ISO-2022-JP……何の追加もしていない

 したがって《図1》―《図8》で示した文字は、現在のインターネットでは「存在しない文字」となってしまうのです。存在しない文字を使えば、文字化けするのは当たり前。それどころか、そのメールが経由したどこかのコンピュータに致命的な障害を与えているかもしれません。

 将来、文字コードや文字集合が別のものになれば状況も変わってくるでしょうが、少なくとも今は、「メールには『使えない文字』がある」わけです。

 文字コード問題についてもっと詳しく知りたい方には、以下の書籍をおすすめしておきます。それぞれの著者の立場は異なりますが、2冊を合わせて読むことで、現在の文字コード状況が見えてくるでしょう。

・太田昌孝『いま日本語が危ない――文字コードの誤った国際化』光芒社 1997年
・川俣晶『パソコンにおける日本語処理/文字コードハンドブック』技術評論社 1999年

■「使えない文字」が使えるとき
 使えない、使えない、と何だか悪者扱いされてしまった(?)これらの文字ですが、たとえば自分で書いた原稿を自分のパソコンで印刷する場合、あるいは受け取る側との了解がある場合などには、もちろん使っても構いません。

 というわけで、MS-IME98を例にして、これらの文字の入力方法を書いておきましょう。

図9:MS-IME98のツールバーから「IMEパッド」ボタンを押す 《図9》
 MS-IME98のツールバーから「IMEパッド」ボタンを押す。

図10:文字一覧のウィンドウ 《図10》
 文字一覧のウィンドウが開く。スクロールバーを動かして、目的の文字を表示させる。

 シフトJISのコード番号は、枠内の文字にマウスカーソルを当てると表示されます。



[1999年11月 1日]
[1999年12月 1日修正]


目次に戻る