<style type="text/css">.wpb_animate_when_almost_visible { opacity:1; }</style>
Cách thức hoạt động của bộ máy tìm kiếm

Cách thức hoạt động của bộ máy tìm kiếm

  • 2017-04-06 16:23:28

Công cụ tìm kiếm có hai chức năng chính:Thu thập dữ liệu để xây dựng chỉ mục và Cung cấp cho người dùng danh sách xếp hạng các trang web liên quan nhất đến từ khóa mà họ tìm kiếm.

Thu thập dữ liệu(Crawling) và lập chỉ mục (indexing)

Hãy tưởng tượng internet như một mạng lưới các trạm dừng trong một hệ thống tàu điện ngầm trong 1 thành phố lớn.
crawl-and-index
 
Mỗi điểm dừng là một trang web, đôi khi là một tệp PDF, JPG.. Các công cụ tìm kiếm luôn tìm một cách để có thể index toàn bộ thành phố và tìm thấy tất cả các điểm dừng trên đường đi, do đó, và con đường tốt nhất hiện nay mà các bot này sử dụng đó là các liên kết (links).
 
Cấu trúc liên kết của website hổ trợ cho việc kết nối tất cả các trang thành phần lại với nhau.Liên kết cho phép các bot của các công cụ tìm kiếm, được gọi là "crawlers" hoặc "spider" thu thập thông tin từ hàng tỷ  tài liệu được kết nối trên web.
 
Một khi bộ máy tìm kiếm tìm thấy các trang này, họ sẽ giải mã và lưu trữ các phần đã chọn trong các cơ sở dữ liệu khổng lồ, sau đó sẽ được "show ra" khi có một truy vấn tìm kiếm liên quan. Để có thể hoàn thành nhiệm vụ lưu giữ hàng tỷ trang mà có thể truy cập trong chớp mắt,  các công ty như google và bing đã xây dựng các vô số trung tâm dữ liệu (datacenters) trên khắp thế giới.
google-datacenter
Google datacenter
 
Những cơ sở lưu trữ khổng lồ này chứa hàng nghìn các bộ máy có thể xử lý số lượng lớn thông tin một cách nhanh chóng. Khi một người thực hiện tìm kiếm tại bất kỳ bộ máy nào, họ luôn yêu cầu kết quả ngay lập tức; Thậm chí chỉ cần chậm một hoặc hai giây có thể làm họ không hài lòng, vì vậy các bộ máy này luôn vận hành hết công suất để cung cấp câu trả lời càng nhanh càng tốt.
 

Cung cấp kết quả

 Khi một người tìm kiếm trực tuyến, công cụ tìm kiếm sẽ lục lọi hàng ngàn tài liệu và thực hiện hai việc sau: 
- Đầu tiên, nó sẽ tìm những kết quả có liên quan hoặc hữu ích liên quan đến từ khóa tìm kiếm
- Thứ hai, nó xếp hạng các kết quả theo sự phổ biến của các trang web. Bao gồm sự liên quan và sự phổ biến, quá trình SEO có ảnh hưởng lớn đến điều này.
 
Làm thế nào để công cụ tìm kiếm xác định sự liên quan và phổ biến?
Đối với bộ máy tìm kiếm, sự liên quan luôn có ý nghĩa nhiều hơn việc tìm kiếm một trang với những từ thích hợp. Trong thời kì đầu, các công cụ tìm kiếm luôn thực hiện các bước rất đơn giản, khiến kết quả tìm kiếm cũng bị giới hạn khá nhiều. Qua nhiều năm, các kỹ sư chuyên nghiệp đã tìm ra cách tốt hơn để kết hợp kết quả với truy vấn của người tìm kiếm. Ngày nay, có hàng trăm yếu tố ảnh hưởng đến kết quả tìm kiếm, và chúng ta sẽ cùng tìm hiểu về những điều quan trọng nhất trong phần tiếp theo.
 
Các công cụ tìm kiếm thường cho rằng trang web càng phổ biến, thông tin nó cung cấp càng có giá trị hơn. Giả thuyết này được chứng minh bằng sự hài lòng của người dùng với kết quả tìm kiếm.
 
Tính phổ biến và mức độ liên quan được xác định bằng các bộ máy sử dụng phương trình toán học (các thuật toán) sau đó để xếp hạng chúng theo thứ tự chất lượng.
 
Những thuật toán này thường chứa hàng trăm biến. Trong lĩnh vực digital marketing, chúng được gọi là "các yếu tố xếp hạng."