うずら豆さん、
キャッシュのみで使う場合は、どの(ありそうな)ファイル名とも一致しない方がよいのではないかと思いますが。。。
>デフォルトインデックスのファイル名は index.html とは限らない
>(たとえば default.htm やその他の場合もある)のでそのようにしています。
wget http://www.hoge.com/~hoge/
とやると本当はprofile.htmlなところでも
勝手にindex.htmlとして保存してるみたいです。
>まあ、index.html にしてしまう(か、そういうオプションをつける)
>というのでもいいですが。。。
オプションの方がよいかもしれませんね。
"/"のデフォルトがprofile.htmlでかつindex.htmlという意味があるファイルがある
可能性も否定できないですから。
(.cache_welcomeという名前のファイルよりはずっと大きい?)
うずら豆さん、
デフォルトインデックスのファイル名は index.html とは限らない(たとえば default.htm やその他の場合もある)のでそのようにしています。
まあ、index.html にしてしまう(か、そういうオプションをつける)というのでもいいですが。。。
中田さんお返事ありがとうございます。
>キャッシュを作り直したり不足分を補ったりしているので、
>現状ではつかないようにはできません。
wget等で落としたデータをそのままキャッシュのフォルダに
突っ込んでもきちんとオフラインで仮想webとして再現できているので
(ファイル名の「%7E」の部分は「~」に換えてますが)
可能かと思ったのですが
それでごまかせるのはブラウザぐらいで
それ以外のアプリも試したのですが
ほかのアプリはほとんどごまかせませんでした。
IEの場合コンテントタイプのヘッダがないためなんでも
そのままブラウザに表示しようとするみたいです(正常な動作ですが)。
「キャッシュのみ」の時のみヘッダが無い場合には
ファイル自身の情報から(ファイルサイズ更新時間拡張子)
ヘッダをでっち上げるってのを思いつきましたが
一人で使うならまだしも共有する場合は問題ありですね
僕自身の使用環境は「キャッシュのみ」の機能で
オフラインで仮想webを再現したり、
オンラインで見たページをそのままオフラインで再現するのに使ってます。
キャッシュのフォルダの中をそのまま再利用できたら便利かな
と思ったのですが現状でも特に不都合はありません。
>それで再利用はできると思います。
はい単純にwgetを使えば
大量のファイルのヘッダを取り除くことも簡単ですね。
findコマンドでファイルリストを作って
エディタの置換でhttp://hoge.com/hoge/index.html
とかに置換して
wget -x -i list.txt
で可能です。
ヘッダのついてないファイルはダウンロードできなくて
ヘッダのついてるもののみヘッダがとれた状態で(当然ですが)
手に入ります。
あんまり大量のファイルをいっぺんにとろうとすると
ウィンドウズの動作がおかしくなります
プロキシの機能ですが、http://hoge.com/~hoge/
とすると
>$cacheroot/hoge.com/~hoge/.cache_welcome
として保存されますが本当のファイル名(index.htmlなど)でも一緒に保存
してくれるようになっていると「キャッシュのみ」派にも便利なのですが
可能でしょうか?
うずら豆さん、
そのヘッダ(サーバのレスポンスヘッダそのままですが)の情報からキャッシュを作り直したり不足分を補ったりしているので、現状ではつかないようにはできません。
ヘッダ部分(と空行)を消せばファイルそのものになりますから、それで再利用はできると思います。
ヘッダ情報を別ファイルにする方式ならいいのですが、それをやるとなるとちょっとまた面倒なので。。。
初めまして
webサーバ機能proxyサーバ機能両方とも普段から重宝してます。
学校でダウンロードしたwebページや保存したキャッシュファイル
に対してなまずのインデックスを作って検索してます。
すでになくなったら困るような存在になってます。
ところでそのproxyサーバのキャッシュ機能ですが
キャッシュ機能により保存されたファイルの頭には
HTTP/1.1 200 OK
Date: hogehoge
Server: hogehoge (hogex)
というようなヘッダがつくのですが
これをつかないようにする方法はあるのでしょうか?