suneo | Pointless In A Sence



半角カナ使用者保護運動

鋭意作成中

旧?サイトのほうが更新されていてこっちが追いついてないので、とりあえずリンクでごまかすとかいう。

半角カナ使用者保護運動(別館)

趣旨

半角カナを使用したというだけで、不正確な知識を根拠に不当な排斥処分を受けている半角カナ使用者を保護するための運動である。しかし、正確な知識によって排斥している場合もあるので、全てのものが不当であるわけではないことを留意すべきである。また、この運動は半角カナの使用を推奨しているわけではないことに注意されたい。

半角カナとは

いわゆる一般的に良く使われる半角カナという言葉、これはかなり不正確な表現なのである。それが意味するものを正確に表現する言葉は無いとされているのだが、便宜上、文字集合の名称を使用して「JIS X 0201カナ」と称されることが多い。

半角という表現は、全角に対する半分の幅、要するに文字の幅を表すものである。実際の幅は文字コードではなくフォントであるので、当然同じ文字であってもフォントによって変わってしまう(それはMicrosoftがMS UI Gothicで証明している)。彼らはフォントを排斥しているわけではないのですなわち不正確なのである。JIS X 0201カナのことだという注意書きが無く「半角カナ」としか書いていない排斥文書は、信用に足るものではないといっても過言ではない。

また、「半角カナ」という言葉が不正確な事を知って「1バイトカナ」などと表現している文書もあるが、これも不正確である。UNIXで良く使われる日本語EUCでは、JIS X 0201カナは2バイトで表される。つまり日本語EUCについての知識が無いという中途半端な知識で排斥しているのであって、信用に足るどころか説得力も無いのである。

だがしかし、Unicodeには「Halfwidth and Fullwidth Form」と題されている分類の文字がある。これはJISの文字集合を使用している文字コードとUnicodeとを相互変換出来るように用意されているものだが、その内のJIS X 0201カナにあたる文字には「Halfwidth-Katakana」などという名前がついていたりする。直訳するともろに半角カナ、いや日本語からの直訳なのかもしれないが。これをもってして半角カナという言葉は世界に通用するなどとして言葉の統一を図るのもいいのだが、余計ややこしくなるような気がするのでやらないほうが無難だろう。

この文章中ではいちいちJIS X 0201カナと記述するのはくどいので、以下JIS X 0201カナのことを「半角カナ」と称することにする。

インターネットと半角カナ

インターネットとは、ネットワーク同士を相互に接続した管理者不在の世界規模のネットワーク――という解説は他で見てもらうとして、インターネットでは半角カナは使えないという噂がある。使えないという優しい表現ではなく、禁止や厳禁などというきつい表現をしている所もある。確かに使えない場合もあるのだが、絶対に使えないわけではないし、ましてや使えない理由はインターネットだからということではないのである。

ISO-2022-JP

なぜ使えない場合があるのか。それはISO-2022-JPという文字コードには半角カナが含まれていないからである。インターネットといってごく普通に思い浮かべるものはe-mail、netnews、WWWの3つであろう。そしてISO-2022-JPという文字コードはe-mailやnetnewsで良く使用される。つまりそれがインターネットでは半角カナが使えないという理由だ。

そもそもISO-2022-JPには半角カナが含まれていないのだから使えるはずが無い。なのに禁止や厳禁というのはおかしいのではないかと思うだろう。実はISO-2022-JPであっても使えてしまうソフトウェアがあるのだ。正確に表現するならば、ISO-2022-JPでは無いものをISO-2022-JPとして送ってしまうのであるが、当然のことながら、そのようなソフトウェア同士以外では半角カナとして認識されない。つまり文字化けするのである。

いや、そもそも半角カナを使うならば半角カナの含まれた文字コードを使用すればよいのだ。日本語EUCやシフトJIS、Unicodeなどには半角カナが含まれている。にもかかわらずそれらを使おうという話にはならない。大抵がISO-2022-JPに半角カナをどうにかして入れようということになるのである。それで前述のようなソフトウェアが出てくるのだと思われるが、なぜそこまでISO-2022-JPにこだわるのか。

国際規格

このような話になると必ずといっていいほど出てくるのがISO 2022という規格である。これは複数の文字集合を組み合わせ、切り換えて使うための枠組みを規定するものだ。その名の通りISO(国際標準化機構)の定めた規格であり、文字コードの話で国際規格と出てきたら必ずISO 2022のことを指しているはずである。

このISO 2022、仕組み自体はそれほど複雑では無いのだが、扱える文字集合の多さによってまともに実装するには大きすぎる規格となってしまっている。そこで扱える文字集合を限定したサブセットを構成して使用する場合が多く、そのサブセットのことはISO 2022に準拠していると称される。

さて、問題のISO-2022-JPだが、これまでの展開と名前から予想される通り、ISO 2022準拠の文字コードである。厳密にいうとISO 2022に完全に準拠しているとはいえないのだが、それはひとまず置いておくことにする。ちなみに名前にISOと入っているが、ISOが定めたものではない。詳細はRFC1468を参照のこと。それはともかく、準拠しているからなんだ、というもっともな疑問も出てきているのではないだろうか。確かに準拠しているとそれなりの利点があるのだが、だからといって準拠していることが特別なことではない。何しろほとんどの文字コードはISO 2022準拠といっても過言ではないのである。

とはいっても何事にも例外はあるわけで、シフトJISはISO 2022準拠の文字コードではないのである。実は、シフトJISが嫌われる理由がそれだ。文字コードにこだわりのある人は、ISO 2022準拠でないことが嫌なものらしい。それと、もともとは自社製品用にMicrosoft他によって作られた独自規格であるというあたりが、嫌われることに拍車をかけているらしい。現在はJIS X 0208:1997規格票の附属書1で規定されているので、同規格票付随書2で規定されているISO-2022-JPと同程度のものになっていると思うのだが、嫌なものは嫌らしい。とにかく、シフトJISについては即却下状態なのである。

情報交換用と内部表現用

ならば日本語EUCはどうかというと、これも駄目らしい。


次回予告


情報求む!


待て次号! 以下次号!!