22.サイト内検索
雑感堂この半年−アクセスの実態−は、よろず雑感堂の(中間)決算報告のようなもので、すんげぇ手間がかかったわりには(いやほんとに)結局のところ雑感堂の内部に閉じた話であり、具体的な話題の拡がりには欠ける憾みがある。
とはいいながら自分ちを見直すいい契機にはなったわけで、副産物として出てきたのが、サイト内検索へのベクトルである。
これ、実はこのとき初めて出たことではない。今年の始めくらいから気にはしていたのだけれど、まずいなぁと思い始めたのが、文字種でやってしまった大ポカ。過去に自分で"かえで"の文字種切り替えトグルに反応しておきながら、あっさり忘れて大嘘書いたという...。
一応はリーダビリティがあるネタを載せているつもりではあり、その意味で情報提供は一つの柱である。それを、書いた本人が覚えていられないような状態というのでは、情報提供もへったくれもあったもんではない。
書き手側はそれでもローカルで検索すればいいわけだが、他方読み手側の問題。スタイルとしてはあくまで時系列トコロテン方式(別名ウナギの寝床)を貫くのが方針であり、本ネタメニューで大方の用は足りると思ってはいるものの、本ネタ700KB近くがどてぇっと並んでいるというのも、ほしい情報を探し出すには少々しんどい。なにしろ書いた本人が忘れがちなのだから。トップ雑感まで含めるならば、なおさらのことである。
というわけで、サイト内全文検索方法をgoogleで検索。"全文検索 Web cgi"くらいのキーワードで充分である。
なんといっても、やはりnamazuが当たる。実績を考えても最強最速は間違いないところながら、いやしかし、雑感堂にそこまで必要か。インデックスをメンテする手間もさることながら、"最強"を使いこなすには、ユーザ側も検索指定についてのルールをある程度知らなければならない。
インデックスを使わないいわゆるgrep方式だと検索に時間がかかるとはいうものの、雑感堂全HTML134ファイル1.47MBのレベルであれば、とりあえずはなんとかなるだろう。
さらに検索を継続。結局もっとも参考になったのは、シネマ1987onlineさんの全文検索ソフト(Perl版)徹底比較であった。
12種のシステムが比較検討されており、内容/表現とも必要充分で、非常にわかりやすい比較である。できる限り設置サンプルも置かれており、検索速度比較が可能なものもある。
もちろんここでもnamazuの評価は高いわけだがまぁ今回は遠慮しておいて、となると、一押しになっているとほほさんのwwwsrchとなる(シネマ1987onlineさんの紹介では名称が異なる。旧称か?)。他にもいくつか候補はあったのだが、"とりあえず"的な意識もあり、まずはダウンロード。
設置は20分ほどで終わった。検索そのものは、対象ディレクトリを指定してしかるべき場所に置くだけであっさり実現。返す結果のURLがcgiディレクトリを指してしまうのを正しく置換するのに少々試行錯誤があったくらいで、楽なものであった。
オンラインで自分のところがゴリゴリ検索できるというのは、なかなかにダイナミックでいいものである。いっぱしに情報発信している気になれるのは、たしか。半日ほどは、かなりご機嫌であった。
だが、しかぁし。
落ち着いて考えてみると、よろず雑感堂の中で、いったいなにを検索するのであろうか。
すっ飛ばして言ってしまうと、googleがありゃぁいいじゃんべつに、ってことなのである。Webは第一義的には巨大なテキストデータベースとして機能してほしいというのが私の立場であって、要は世の中のWebコンテンツがシームレスに横断できるのが望ましいのであって、その立場があるからこそHTML3.2にこだわったりなんだりということが出てくるのだ。
実際、googleエンジンからの雑感堂へのアクセスはかなりある。各ネタにダイレクトに飛んでくるので比較を伴う集計は難しいのだが、あの手の検索エンジン経由でアクセスがあるということは、とても非常に大変嬉しいことなのである。オノレのやっていることが多少なりとも世の中に認知されているということは、社会的動物であるホモ・サピエンスにとって多くの場合必須栄養素なわけだが、特にgoogleのような重み付けをもったロボットタイプで引っかかるというのは、単純にアクセス数を云々することとはまったく違った意味合いをもつ。まことにもって、ありがたい。
そのうえ自サイト内検索を用意するというのは、屋上屋を重ねるというか言ってることが違うというかあざといというか。ま、あんまりたいしたことではないのである。
"たいしたことではない"実証として、あえて。とほほさんのcgiを使っている方はしゅんろ〜さんをはじめかなりいらっしゃると思うので、このcgiの機能はかなり知れ渡っているだろう。ということで言ってしまうが、wwwsrch.cgiにはロギング機能がある。検索を行った日付/時間/ip/キーワードが記録される(andかorかまではわからない)。せっかく置いた検索システムなので、稼働実績が見たいなぁと思い、とりあえずロギング有効にしてみたのだが...
いやいやこれがまず、実数としてとぉっても少ない。設置後72時間で、77件である。自分のテスト分もかなりあるから、正味はもぉっと少ない。
そんでもってキーワードとしては、"魔鏡"がダントツトップである。あのぅこれ、爆笑すればいいのやら泣き崩れればいいのやら。わかんないので両方やってしまうわけだが、まぁ実態はそのようなところ。ついでに言ってしまうと、"魔鏡"以外の検索キーワードは圧倒的に、ハンドル、である。
つづまるところ"雑感堂にサイト内検索を置く"という意味合いは今のところ、
各ジャンルにおいて、"すべての情報はここにある"という立場のWebサイトであれば、たしかにサイト内検索は非常に有効であり、ある意味で必須だろう。あるいは@niftyパソコン通信会議室やメーリングリストのように、タイトルだけでは話の中身がまったく見えない場合も。
が、大上段にいうなら、情報が一極集中するのではなく、分散データベースが有効に機能するのが本筋だと、私は考える。ましてや個人が管理するWebサイトの場合、そこまでの情報の蓄積は、めったなことでは実現し得ない。程度の差はあるけれども、まぁあってもなくても"たいしたことではない"、ほどほどにしておけばいいんじゃないの、というのが現在の私のシメである。
(2001/10/06)