Các công cụ tìm kiếm hoạt động như thế nào?

Các công cụ tìm kiếm có hai chức năng chính: thu thập dữ liệu và xây dựng một chỉ mục và cung cấp cho người dùng tìm kiếm một danh sách xếp hạng các trang web mà họ đã xác định là phù hợp nhất.

Hãy tưởng tượng World Wide Web là một mạng lưới các điểm dừng trong hệ thống tàu điện ngầm thành phố lớn.

Mỗi điểm dừng là một tài liệu duy nhất (thường là một trang web, nhưng đôi khi là tệp PDF, JPG hoặc tệp khác). Các công cụ tìm kiếm cần một cách để thu thập dữ liệu trên toàn bộ thành phố và tìm tất cả các điểm dừng trên đường đi, vì vậy họ sử dụng đường dẫn tốt nhất có sẵn các liên kết.

Cấu trúc liên kết của web phục vụ để liên kết tất cả các trang với nhau.

Liên kết cho phép các robot tự động của các công cụ tìm kiếm, được gọi là “trình thu thập thông tin” hoặc “trình thu thập dữ liệu” để tiếp cận với hàng tỷ tài liệu được kết nối với nhau trên web.

Khi các công cụ tìm thấy các trang này, họ giải mã mã từ chúng và lưu trữ các phần được chọn trong cơ sở dữ liệu lớn, sẽ được gọi lại sau khi cần cho truy vấn tìm kiếm. Để hoàn thành nhiệm vụ hoành tráng là nắm giữ hàng tỷ trang có thể truy cập trong một phần giây, các công ty công cụ tìm kiếm đã xây dựng các trung tâm dữ liệu trên toàn thế giới.

Những cơ sở lưu trữ khổng lồ này chứa hàng ngàn máy móc xử lý số lượng lớn thông tin rất nhanh. Khi một người thực hiện tìm kiếm tại bất kỳ động cơ chính nào, họ yêu cầu kết quả ngay lập tức; thậm chí độ trễ một hoặc hai giây có thể gây ra sự không hài lòng, vì vậy các động cơ làm việc chăm chỉ để đưa ra câu trả lời nhanh nhất có thể.

Công cụ tìm kiếm là máy trả lời. Khi một người thực hiện tìm kiếm trực tuyến, công cụ tìm kiếm sẽ quét toàn bộ hàng tỷ tài liệu và thực hiện hai việc: thứ nhất, nó chỉ trả về những kết quả có liên quan hoặc hữu ích cho truy vấn của người tìm kiếm; thứ hai, nó xếp hạng những kết quả đó theo mức độ phổ biến của các trang web phục vụ thông tin. Đó là cả sự liên quan và phổ biến mà quá trình SEO có nghĩa là ảnh hưởng.

Làm thế nào để công cụ tìm kiếm xác định sự liên quan và phổ biến?

Đối với một công cụ tìm kiếm, mức độ liên quan có nghĩa nhiều hơn là tìm một trang có từ đúng. Trong những ngày đầu của web, các công cụ tìm kiếm đã không đi xa hơn bước đơn giản này và kết quả tìm kiếm có giá trị hạn chế. Trong những năm qua, các kỹ sư thông minh đã nghĩ ra những cách tốt hơn để khớp kết quả với những người tìm kiếm truy vấn trên mạng. Ngày nay, hàng trăm yếu tố ảnh hưởng đến sự liên quan và chúng tôi sẽ thảo luận về những yếu tố quan trọng nhất trong hướng dẫn này.

Các công cụ tìm kiếm thường cho rằng một trang web, trang hoặc tài liệu càng phổ biến thì thông tin mà nó chứa càng có giá trị. Giả định này đã được chứng minh khá thành công về sự hài lòng của người dùng với kết quả tìm kiếm.

Mức độ phổ biến và mức độ liên quan được xác định bằng tay. Thay vào đó, các động cơ sử dụng các phương trình toán học (thuật toán) để phân loại lúa mì từ chaff (mức độ liên quan), và sau đó xếp hạng lúa mì theo thứ tự chất lượng (mức độ phổ biến).

Các thuật toán này thường bao gồm hàng trăm biến. Trong lĩnh vực tiếp thị tìm kiếm, chúng tôi gọi chúng là các yếu tố xếp hạng.

Làm thế nào để tôi có được một số thành công?

Hoặc, “làm thế nào các nhà tiếp thị tìm kiếm thành công”

Các thuật toán phức tạp của các công cụ tìm kiếm dường như không thể xuyên thủng. Thật vậy, bản thân các công cụ cung cấp ít kiến ​​thức về cách đạt được kết quả tốt hơn hoặc thu được nhiều lưu lượng truy cập hơn. Những gì họ làm cung cấp cho chúng tôi về tối ưu hóa và thực hành tốt nhất được mô tả dưới đây:

THÔNG TIN SEO TỪ HƯỚNG DẪN WEBMASTER GOOGLE

Google khuyến nghị những điều sau đây để có được thứ hạng tốt hơn trong công cụ tìm kiếm của họ:

Tạo các trang chủ yếu cho người dùng, không phải cho các công cụ tìm kiếm. Đừng lừa dối người dùng của bạn hoặc trình bày nội dung khác nhau cho các công cụ tìm kiếm hơn là bạn hiển thị cho người dùng, một thực tế thường được gọi là “che giấu”.
Tạo một trang web với một hệ thống phân cấp và liên kết văn bản rõ ràng. Mỗi trang phải có thể truy cập được từ ít nhất một liên kết văn bản tĩnh.
Tạo một trang web hữu ích, giàu thông tin và viết các trang mô tả rõ ràng và chính xác nội dung của bạn. Đảm bảo rằng các phần tử <title> và thuộc tính ALT của bạn là mô tả và chính xác.
Sử dụng các từ khóa để tạo các URL mô tả, thân thiện với con người. Cung cấp một phiên bản của URL để tiếp cận tài liệu, sử dụng chuyển hướng 301 hoặc thuộc tính rel = “canonical” để giải quyết nội dung trùng lặp.

THÔNG TIN SEO TỪ HƯỚNG DẪN BING WEBaMASTER
Các kỹ sư của Bing tại Microsoft khuyến nghị những điều sau đây để có được thứ hạng tốt hơn trong công cụ tìm kiếm của họ:

Đảm bảo cấu trúc URL giàu từ khóa rõ ràng.
Đảm bảo nội dung không bị chôn vùi bên trong đa phương tiện (Adobe Flash Player, JavaScript, Ajax) và xác minh rằng đa phương tiện không ẩn các liên kết khỏi trình thu thập thông tin.
Tạo nội dung phong phú từ khóa và khớp từ khóa với những gì người dùng đang tìm kiếm. Sản xuất nội dung tươi thường xuyên.
Donith đặt văn bản mà bạn muốn lập chỉ mục bên trong hình ảnh. Ví dụ: nếu bạn muốn tên công ty hoặc địa chỉ của bạn được lập chỉ mục, hãy đảm bảo rằng nó không được hiển thị bên trong logo công ty.

Không sợ hãi, Fellow Search Marketer!

Ngoài lời khuyên được đưa ra một cách tự do này, trong hơn 15 năm tồn tại tìm kiếm trên web, các nhà tiếp thị tìm kiếm đã tìm ra các phương pháp để trích xuất thông tin về cách các công cụ tìm kiếm xếp hạng các trang. SEO và các nhà tiếp thị sử dụng dữ liệu đó để giúp trang web của họ và khách hàng của họ đạt được định vị tốt hơn.

Đáng ngạc nhiên, các động cơ hỗ trợ nhiều trong số những nỗ lực này, mặc dù tầm nhìn công khai thường thấp. Các hội nghị về tiếp thị tìm kiếm, chẳng hạn như Hội chợ tiếp thị tìm kiếm, Pubcon, Chiến lược công cụ tìm kiếm, Chưng cất và Moz Moz sở hữu MozCon thu hút các kỹ sư và đại diện từ tất cả các động cơ chính. Đại diện tìm kiếm cũng hỗ trợ quản trị trang web bằng cách thỉnh thoảng tham gia trực tuyến trên blog, diễn đàn và nhóm.

Có lẽ không có công cụ nào lớn hơn dành cho các quản trị web nghiên cứu hoạt động của các công cụ hơn là tự do sử dụng các công cụ tìm kiếm để thực hiện các thử nghiệm, kiểm tra giả thuyết và đưa ra ý kiến. Chính nhờ quá trình lặp đi lặp lại đôi khi rất khó khăn này mà một lượng kiến ​​thức đáng kể về các chức năng của các động cơ đã được lượm lặt. Một số thí nghiệm chúng tôi đã thử làm một cái gì đó như thế này:

  1. Đăng ký một trang web mới với các từ khóa vô nghĩa (ví dụ: ishkabibbell.com).
  2. Tạo nhiều trang trên trang web đó, tất cả đều nhắm mục tiêu một thuật ngữ lố bịch tương tự (ví dụ: yoogewgally).
  3. Làm cho các trang càng gần giống nhau càng tốt, sau đó thay đổi một biến tại một thời điểm, thử nghiệm vị trí của văn bản, định dạng, sử dụng từ khóa, cấu trúc liên kết, v.v.
  4. Liên kết điểm tại tên miền từ các trang được lập chỉ mục, được thu thập tốt trên các tên miền khác.
  5. Ghi lại thứ hạng của các trang trong công cụ tìm kiếm.
  6. Bây giờ thực hiện các thay đổi nhỏ cho các trang và đánh giá tác động của chúng đối với kết quả tìm kiếm để xác định các yếu tố nào có thể đẩy kết quả lên hoặc xuống so với các đồng nghiệp.
  7. Ghi lại bất kỳ kết quả nào có vẻ hiệu quả và kiểm tra lại chúng trên các tên miền khác hoặc với các điều khoản khác. Nếu một số thử nghiệm liên tục trả về cùng một kết quả, rất có thể bạn đã phát hiện ra một mẫu được sử dụng bởi các công cụ tìm kiếm.

Một thử nghiệm ví dụ chúng tôi đã thực hiện

Trong thử nghiệm của chúng tôi, chúng tôi đã bắt đầu với giả thuyết rằng một liên kết sớm hơn (cao hơn) trên một trang mang nhiều trọng lượng hơn một liên kết thấp hơn trên trang. Chúng tôi đã kiểm tra điều này bằng cách tạo một miền vô nghĩa với một trang chủ có liên kết đến ba trang từ xa mà tất cả đều có cùng một từ vô nghĩa xuất hiện chính xác một lần trên trang. Sau khi các công cụ tìm kiếm thu thập dữ liệu các trang, chúng tôi thấy rằng trang có liên kết sớm nhất trên trang chủ được xếp hạng đầu tiên.

Quá trình này rất hữu ích, nhưng không đơn độc trong việc giúp giáo dục các nhà tiếp thị tìm kiếm.

Ngoài loại thử nghiệm này, các nhà tiếp thị tìm kiếm cũng có thể thu thập thông tin cạnh tranh về cách các công cụ tìm kiếm hoạt động thông qua các ứng dụng bằng sáng chế được thực hiện bởi các công cụ chính cho Văn phòng Bằng sáng chế Hoa Kỳ. Có lẽ nổi tiếng nhất trong số này là hệ thống đã tạo ra Google trong các ký túc xá Stanford vào cuối những năm 1990, PageRank, được ghi nhận là Bằng sáng chế # 6285999: “Phương pháp xếp hạng nút trong cơ sở dữ liệu được liên kết.” Bài báo gốc về chủ đề này – Giải phẫu của một công cụ tìm kiếm web siêu văn bản quy mô lớn – cũng là chủ đề của nghiên cứu đáng kể. Nhưng đừng lo lắng; bạn không cần phải quay lại và tính toán khắc phục để thực hành SEO!

Thông qua các phương pháp như phân tích bằng sáng chế, thử nghiệm và thử nghiệm trực tiếp, các nhà tiếp thị tìm kiếm như một cộng đồng đã hiểu được nhiều hoạt động cơ bản của công cụ tìm kiếm và các thành phần quan trọng của việc tạo trang web và trang có thứ hạng cao và lưu lượng truy cập đáng kể.

Phần còn lại của hướng dẫn này được dành để làm rõ những hiểu biết này. Enjoy nào!

 

Chuyển đến thanh công cụ