●スパイダーをつくりたい。
情報の自動収集→自動HTML化から着想したアイデアが、
自分の頭の中で、ずいぶん発展してきた。
そしてそれはだんだんと、自分専用のスパイダーをつくりたい欲求に・・・。
ちなみにスパイダーとは、
クローラーとか、ロボットと呼ばれるものと同義。
自動的にウエブをはいまわって(クロールして)くる、ツール。
ちょっと調べてたら、↓こんなサイトを発見した。
IBMのサイトから。
これって、もしかしてとんでもないお宝じゃないの?
それにそれに。
あの、いつもよく使ってたwgetって、そんなに便利なソフトだったんだー。
例えば↑のIBMのサイトで紹介されていた例として、
wget -A mp3,mpg,mpeg,avi -r -l 3 http://"some URL"
定義されたURLに接続し、再帰的に 3 レベルまで辿って、
拡張子が mp3、mpg、mpeg、または avi のファイルを取り込む。
だって。
この他に、
curl
snarf
fget
fetch
あたりも有効だとか。
これはいいこときいた。
今まで、Linuxといえば サーバー(クライアントに対するという意味の)として
使うことしか頭になかったんだけど、
そう、Linuxをクライアントして、常時動かす道具にしたら、
すごいことができてしまう。。
早くDebianマシンをもう一度手元におきたい。Fedraでもいいけどね。
Vistaを買って、今動いてるXPをつぶしちゃおーかなぁ。




