Google không index bài viết: 13 nguyên nhân chính

Tại sao Google không index bài viết hoặc website ?

Dưới đây là những nguyên nhân chính có thể gây ra sự cố Google không index (index: lập chỉ mục).

1.Khác biệt giữa www và không www

Xét hai website: www.domain.com và domain.com

www được coi là subdomain, vậy nên hai website trên hoàn toàn khác nhau. Do đó nếu gặp tình trạng website không index thì bạn nên kiểm tra cả hai phiên bản.

Hãy thiết lập một tên miền ưa thích trong Google Search Console.

Vào Cài đặt (Góc phải màn hình, bên dưới hình ảnh đại diện Gmail) → Cài đặt trang web → Chọn tên miền ưa thích. Thông thường là sẽ chọn không www.

Cài đặt tên miền ưa thích cho website

2.Google chưa tìm thấy website

Thường xảy ra với website mới, chỉ cần chờ một ít ngày là Google sẽ cập nhật.

Trường hợp Google không index thì hãy tải lên Sitemap và yêu cầu Google lập chỉ mục.  Xem thêm hướng dẫn từ Google.

3.Bị chặn bởi Robots.txt

Đôi khi bạn vô tình chặn việc lập chỉ mục trong tập tin Robots.txt

Chỉ cần xóa đi dòng bị chặn đó là được. Xem thêm về cách sử dụng Robots.txt tại: http://www.robotstxt.org/robotstxt.html

4.Chưa có sitemap

Sitemap (Sơ đồ trang web) là một tập tin liệt kê các trang, bài viết trên web để Google và các công cụ tìm kiếm khác biết về cách sắp xếp nội dung trang web của bạn.

Sitemap có hai loại là sitemap cho công cụ tìm kiếm (sitemap.xml) và sitemap cho người đọc (sitemap.html). Ta đang nói tới sitemap cho công cụ tìm kiếm.

Xem thêm tại: https://support.google.com/webmasters/answer/156184

Mọi website nên có sitemap! Để tạo sitemap hãy vào: http://www.xml-sitemaps.com

Trường hợp bạn dùng WordPress thì cài tiện ích SEO Yoast hoặc Google XML Sitemaps.

Tạo sitemap bằng SEO Yoast

5.Lỗi thu thập dữ liệu

Trong một vài trường hợp, Google không thể thu thập dữ liệu nên nó lập chỉ mục website được.

Hãy kiểm tra lỗi thu thập dữ liệu bằng cách vào Google Search Console → Chọn website → Crawl (Thu thập dữ liệu) → Crawl Errors (Lỗi thu thập dữ liệu).

loi-thu-thap-du-lieu

6.Quá nhiều nội dung trùng lặp

Nếu website có quá nhiều nội dung trùng lặp, chẳng hạn bài viết, sản phẩm copy hoặc nhiều liên kết trả về cùng một bài viết, cũng là một trong các nguyên nhân Google không index.

Ví dụ: domain.com/san-pham/giay-da và domain.com/san-pham/giay-da?sort=blue đều trả về cùng một bài viết thì được coi là trùng lặp.

Hãy sử dụng chuyển hướng 301 để giải quyết nội dung trùng lặp kiểu này.

7.Tính năng ngăn chặn công cụ lập chỉ mục đang bật

Xảy ra trong WordPress, vào Cài đặt (Settings) → Reading (Đọc) → Nhìn ô cuối cùng

ngăn công cụ tìm kiếm lập chỉ mục website

8.Web bị chặn bởi .htaccess

Cấu hình sai có thể khiến .htaccess chặn thu thập dữ liệu và lập chỉ mục

Xem thêm: Những cách cấu hình .htaccess

9.Cấu hình meta tag là NOINDEX

Website bị cấu hình như này:

<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>

sẽ chặn Google thu thập và lập chỉ mục website.

cấu hình noindex website

10.Lỗi Ajax/Javascript

Google có khả năng lập chỉ mục Ajax/Javascript, nhưng khó khăn hơn HTML nhiều. Vì vậy nếu cấu hình Ajax và JavaScript không hợp lí, Google có thể không lập chỉ mục website được.

Xem thêm: https://support.google.com/webmasters/answer/174993

11.Tải trang web quá lâu

Google không thích website tải quá chậm. Nếu quá trình tải mất quá nhiều thời gian thì Google sẽ không lập chỉ mục.

12.Hosting Down Times

Down Times hiểu đơn giản là lỗi không truy cập website được.. Hầu hết các đơn vị cung cấp host đều chỉ đảm bảo thời gian Up Times (thời gian vận hành) tối đa là 99%.

Hosting down times thì Google không thu thập dữ liệu được, do đó nó cũng không thể lập chỉ mục website được.

13.Website bị Deindex

  • Có thể website bị phạt nên Google đã gỡ bỏ toàn bộ kết quả khỏi trang kết quả tìm kiếm
  • Nếu là website mới, thì có thể trong quá khứ bị phạt
  • Hoặc bạn tiến hành deindex trong Google Search Console

Lược dịch từ SearchEngineJournal.com

Bình luận

Bình luận

 

Bài viết liên quan