Công cụ tìm kiếm

Công cụ tìm kiếm (search engine) là hệ thống phần mềm thu thập thông tin từ World Wide Web và trình bày cho người dùng đang tìm kiếm thông tin cụ thể.

Công cụ tìm kiếm thực hiện các quy trình sau:

  • Thu thập web (Web crawling): Tìm kiếm các trang web bằng cách điều hướng qua siêu liên kết trên các trang web, cả trong cùng một trang web và từ trang web này sang trang web khác. Chủ sở hữu trang web có thể ngăn các vùng của trang bị truy cập bởi trình thu thập web (hay spider) của công cụ tìm kiếm, bằng cách định nghĩa thông tin "robot exclusion" trong tệp có tên robots.txt.
  • Lập chỉ mục (Indexing): Liên kết các từ khóa và thông tin khác với các trang web cụ thể đã được thu thập. Điều này cho phép người dùng tìm thấy các trang liên quan nhanh nhất có thể.
  • Tìm kiếm (Searching): Tìm kiếm các trang web liên quan dựa trên các truy vấn bao gồm từ khóa và các lệnh khác gửi đến công cụ tìm kiếm. Công cụ tìm kiếm tìm các URL của trang khớp với truy vấn và xếp hạng chúng theo mức độ liên quan. Sau đó, nó trình bày kết quả cho người dùng theo thứ tự xếp hạng.

Công cụ tìm kiếm phổ biến nhất là Google. Các công cụ tìm kiếm hàng đầu khác bao gồm Yahoo!, Bing, Baidu và AOL.

Xem thêm