| メールには「使えない文字」がある ――「文系な」あなたに贈るパソコン使いこなし講座 |
|---|
|
|
| 電子メールは「各種の情報を記したヘッダ+本文」から成り立っています。そしてその実体は「テキストファイル」。それでは、テキストファイルだったら、どんな文字でも使えるのでしょうか? 実はメールには「使えない文字」があります。そして「使えない文字」をメールに書いてしまうと、その部分が違う文字になったり、あるいは空白になったり……といった「文字化け」を起こしてしまうのです。 |
| ■「使えない文字」はこんなにある! | |
| 「使えない文字」には次のようなものがあります。ウィンドウズ98を例にして、とにかく挙げていきましょう。 《図1》半角カタカナ 濁点や半濁点も含まれます。これらは「顔文字」に使われていることがあるので、注意しましょう。 《図2》半角句読点類 半角のかぎや中黒(なかぐろ)も含まれます。特に半角中黒は、顔文字に使われていることがあります。 《図3》丸付き数字 シフトJISのコード番号では8740―8753にある文字。 NECのPC-9801シリーズで採用されました。メールでは、(1)、(2)のように、半角かっこと半角数字を組み合わせて書きましょう。 《図4》ローマ数字の大文字 シフトJISのコード番号では8754―875Dにある文字。 NECのPC-9801シリーズで採用されました。メールでは、I、IIのように、半角アルファベットの大文字で書きましょう。ちなみにローマ数字の小文字は、i、iiのように書きます。 《図5》単位の記号類 シフトJISのコード番号では875F―8775にある文字。 NECのPC-9801シリーズで採用されました。メールでは、ミリ、キロのように全角カタカナで書いたり、mm、cmのように半角アルファベットを組み合わせて書きましょう。 《図6》その他の記号類 シフトJISのコード番号では877E―879Cにある文字。 NECのPC-9801シリーズで採用されました。メールでは、No.、Tel、(株)、(有)のように書きましょう。 《図7》NEC選定のIBM拡張漢字 ![]() シフトJISのコード番号ではED40―EEFCにある文字。 IBMのメインフレームで使われていた拡張漢字の一部をNECが選定し、同社のPC-9801シリーズで採用しました。人名表記に使える漢字があって便利なのですが、メールでは使えません。ひらがなで書くしかないでしょう。 《図8》IBM拡張漢字 ![]() シフトJISのコード番号ではFA40―FC4Bにある文字。 IBMのメインフレームで使われていた拡張漢字で、PC/AT互換機(要はDOS/Vパソコンですね)用のOS(MS-DOSやPC-DOS)で採用されました。これもメールでは使えません。ひらがなで書くしかないでしょう。 |
|
| ■「使えない文字」が存在する理由――文字コードと文字集合 | |
| こうした「使えない文字」が存在する背景には、「文字コード」と「文字集合」の問題があります。とても複雑な問題なのですが、ここではごく簡単に説明しておきましょう。 コンピュータで文字を扱う際には、1文字ごとに処理用の番号を振らなければなりません。この処理用の番号が文字コード。ウィンドウズ98では「シフトJIS」という文字コードが使われています。一方インターネットでは、通信規格の制約からシフトJISが使えず、代わりに「ISO-2022-JP」という文字コードを使うようになりました。 ISO-2022-JPという言葉を聞いて何か思い出したあなたは……メールのヘッダを見てみましょう。「Content-Type」という項目に「charset="Shift_JIS"」と書いてあるはず。これがメールの文字コード指定なんですね。 それはともかく、問題は、シフトJISとISO-2022-JPのそれぞれが準拠している文字集合です。どちらも日本工業規格(JIS)の定めた2つの文字集合―― ・「JIS X 0201」(いわゆる半角文字を規定) ・「JIS X 0208」(いわゆる全角文字を規定) に準拠しているのですが、微妙に異なる部分があります。 JIS X 0201について見ると―― ・シフトJIS……半角カタカナと半角句読点類(《図1》―《図2》)を使っている ・ISO-2022-JP……半角カタカナと半角句読点類を使っていない JIS X 0208について見ると―― ・シフトJIS……メーカーが独自に拡張した文字(《図3》―《図8》)を追加している ・ISO-2022-JP……何の追加もしていない したがって《図1》―《図8》で示した文字は、現在のインターネットでは「存在しない文字」となってしまうのです。存在しない文字を使えば、文字化けするのは当たり前。それどころか、そのメールが経由したどこかのコンピュータに致命的な障害を与えているかもしれません。 将来、文字コードや文字集合が別のものになれば状況も変わってくるでしょうが、少なくとも今は、「メールには『使えない文字』がある」わけです。 文字コード問題についてもっと詳しく知りたい方には、以下の書籍をおすすめしておきます。それぞれの著者の立場は異なりますが、2冊を合わせて読むことで、現在の文字コード状況が見えてくるでしょう。 ・太田昌孝『いま日本語が危ない――文字コードの誤った国際化』光芒社 1997年 ・川俣晶『パソコンにおける日本語処理/文字コードハンドブック』技術評論社 1999年 |
|
| ■「使えない文字」が使えるとき | |
| 使えない、使えない、と何だか悪者扱いされてしまった(?)これらの文字ですが、たとえば自分で書いた原稿を自分のパソコンで印刷する場合、あるいは受け取る側との了解がある場合などには、もちろん使っても構いません。 というわけで、MS-IME98を例にして、これらの文字の入力方法を書いておきましょう。 |
|
| 《図9》 MS-IME98のツールバーから「IMEパッド」ボタンを押す。 |
![]() |
《図10》 文字一覧のウィンドウが開く。スクロールバーを動かして、目的の文字を表示させる。 シフトJISのコード番号は、枠内の文字にマウスカーソルを当てると表示されます。 |
| [1999年11月 1日] [1999年12月 1日修正] |
|
|
| 目次に戻る |