検索エンジンの仕組み 最後の更新: 平成17年8月1日


キーワードが入力されて検索の問い合わせがあると、検索サイトのウェブ・サーバーは直ちに検索照合の結果を探しに行き、数十億のウェブ上の文章を分類します。これれの集められて分類された文章は、更に入力されたキーワードに対する関連性に関しても処理されます。この分類作業(いわゆるインデクシング)は自動化されていて、手作業による介入が許されていません。またこの検索サイトのウェブ・サーバーが実際にウェブ上で必要とするのは、検索の問い合わせがあった時に入力されるキーワードのみです。そして見つけられるサイトにとって重要となるのは、ホームページの内容、そのホームページのリンクをのせるサイト先の数と質、更には(ホームページ上の)キーワードとホームページの内容の関連性などがあげられます。
 より詳しいことは、Googleのサイトで説明されています。例えばあなたのコ ンピュータを通して検索の問い合わせがあると、まずはウェブ・サーバーがそれを受け取ります。そしてこの検索の問い合わせはインデックス・サーバーへと送られます。このインデックス・サーバーは、あなたが入力したキーワードを数十億のページと比較して相当のものを見つけだします。最後には、検索の問い合わせはドキュメント・サーバーへと移動します。ドキュメント・サーバーでは、実際の文書がデータとして保存されています。そしてあなたの検索の問い合わせの結果がウェブ・サーバーを通してやっと返されるということです。驚くことに、これらの全ての処理にかかる時間は2分の1秒にも満たないということです。
 それでは何故検索サイトに載る結果の順番は日々かわるのでしょう?それは単に、検索サイトのデータベースのリストが随時更新しているからです。特定のキーワードに対するサイトの相対的な重要性あるいは検索結果の順番は、リストが更新されたり、新しいサイトが登録されたり、既成のものが削除された時などに、上がったり下がったりします。