中田さん、いつもお世話になっております。
> ログの話は、1,2とも「正常」です。現在の「仕様」という意味でですが。
了解しました。
鷹の巣さん、
ログの話は、1,2とも「正常」です。現在の「仕様」という意味でですが。
中田さん、いつもお世話になっております。
鷹の巣 webmaster@sakaguch.com 2003/03/11 00:44 へ
> 「手を抜かないPerlスクリプト」にするためには、refererのアクセス元は、アクセス先のファイル名の
> 一致を見るようにすれば良いだけですが、ちょっと腰が引けています。
common log形式から、combined形式のログに変換するPerlスクリプトを処理時間がかからない様に
なんとか、「手を抜かないPerlスクリプト」にしてみました。
私の一日当りのアクセスログ5万行当り、refererのアクセス元情報を付けられないものは、多くて3個程度になりました。
refererログのアクセス先ファイルがCGIの場合は、?以下の引数が記録されていないので、そこは無視しています。
1.refererログのアクセス先ファイルがCGIの場合は、?以下の引数が記録されないのは、正常でしょうか?
2.Apacheなどと違って、refererとUser Agentのログの日付の書式とAccessログの日付の書式が違うのは、正常でしょうか?
参考URL:http://www.zdnet.co.jp/help/howto/linux/0007master/05/08.html
中田さん、いつもお世話になっております。
> そうすると、手を抜かないPerlスクリプトなら問題ないということでしょうか。。?
「手を抜かないPerlスクリプト」なら問題ないです。
ただ、「手を抜いたスクリプト」といっても、アクセス元とUser Agentを闇雲に付け足すのではなく、
情報削減が起こらないように画像ファイル関係は、無視するようにしています。
「手を抜かないPerlスクリプト」にするためには、refererのアクセス元は、アクセス先のファイル名の
一致を見るようにすれば良いだけですが、ちょっと腰が引けています。
「本当に手を抜かないPerlスクリプト」では、時刻の幅を持った一致とrefererのアクセス元は、
アクセス先のファイル名の一致を見ることになります。
また、時刻が一致したUser Agentでは、記録順序を頼りにすることになります。
# 間違っているかもしれませんが、combined形式から、common log形式のログを正しく作れても、
# common log形式から、combined形式のログは、正しく作れないと考えています。
ちょっとAWstatsをログ解析の話題から外れますが、私の場合は、ほとんど生ログを見ていますので、
combined形式の方が助かります。
小規模サイトでは、refererログやUser Agentログを単独に分割するログサイズでもありませんし、
combined形式の方が生ログを見る時間が節約できて実用的だと考えています。
ということで、AN HTTPDにcombined形式の選択肢があると嬉しいです。
鷹の巣さん、
そうすると、手を抜かないPerlスクリプトなら問題ないということでしょうか。。?
中田さん、いつもお世話になっております。
> アクセスログとrefererとUser Agentのログで順番のずれはあると思うのですが、
私の手を抜いたPerlスクリプトは、アクセスログの順番にrefererのアクセス元URLとUser Agentをひっつけて行きます。
アクセス先URL(ファイル)も照合していませんし、日付も照合していません。
それでアクセスログ解析ソフトが騙せると考えていました。
404エラーでアクセス元が表示されるものですから、ちょっと困ったことになった訳です。
> 時刻のずれはありますか?
多少はあるようです。ただし、サーバ機の時刻補正(1時間に1回)がアクセス中でも行なわれますので、
時刻のずれが発生する頻度が上がるのだろうと考えています。
目的からしますと、時刻のずれは全くきになりません。
refererのアクセス元URLは、時刻に関係なく、アクセスログのアクセスURL(ファイル)と一致する行に正確にひっつければ良いです。
また、User Agentの方は、アクセスログのどこの行にひっつけても、アクセスログ解析ソフトは、同じ結果になります。
> combined への対応は考えます。
ありがとうございます。宜しく御願いします。
鷹の巣さん
アクセスログとrefererとUser Agentのログで順番のずれはあると思うのですが、時刻のずれはありますか?
combined への対応は考えます。
中田さん、今晩は。鷹の巣です。
いつもお世話になっております。
http://homepage1.nifty.com/yito/namazu/gbook/20021104.2344.html
の続きになるのですが、AN HTTPDのログ形式が、Apacheでいうところのcombined形式
になるオプションがあると、たいへん嬉しいです。(要望で、申し訳ありません。)
一応、アクセスログ解析ソフトのAWstatsを使用して、AN HTTPDのログから、
http://sakaguch.com/log/2003/200301.html(refererとUser Agentのログを未使用)
http://sakaguch.com/log/2003/200302.html(refererとUser Agentのログを 使用)
を作って見ましたが、refererとUser Agentのログがアクセスログにうまく連結できません。
AWstatsは、現在(たぶん将来も)、combined形式しかサポートしていません。
サーバ機で時刻合わせのソフトが動作していることも原因の一つですが、
アクセスログとrefererとUser Agentのログの時刻がずれることがあります。
# もう少し真剣にやれば、Perlスクリプトでも出来るとは思いますが。
# http://sakaguch.com/log/2003/200302errors404.html
# 上記の404エラーのアクセス元を見ますと、
# 手を抜いたせいか、ワームのアクセス元が自分のサイトだったりします。
TODOのリストに加えて頂く様、ご検討願いませんでしょうか。