クローラー【用語解説】

クローラーとは、インターネット上を自動で巡回し、Webサイト・画像・動画・ドキュメントなどのデータを収集・保存するプログラムのこと。

もっと詳しく解説

クローラーとは、インターネット上を自動で巡回し、Webサイト・画像・動画・ドキュメントなどのデータを収集・保存するプログラムのことです。

GoogleやBingなどの検索エンジンごとに種類があり、「ボット」や「スパイダー」と呼ばれることもあります。

クローラーがWebサイトを巡回することを、「クローリング」と呼びます。

クローラーは、特定の既知のWebページから、リンクを辿りながら巡回します。Webサイトは常に更新・削除・ロケーション移動しているため、定期的にクローリングを行うことで、情報を新鮮に保っています。

主な検索エンジンと、クローラー名は以下の通りです。

主な検索エンジンと、クローラー名

また、検索エンジン以外のサービスにもクローラーは利用されています。

検索エンジン以外のサービスのクローラーの例

クローラーはHTTP/HTTPSプロトコルにより、世界中のサーバから以下の種類のファイルを収集しています。

クローラーが収集する主なファイル