Để kiểm tra được website của bạn đã được index chưa thì có nhiều cách khác nhau. Nhưng dễ dàng và phổ biến nhất thì gồm có cách cách sau đây. Bên cạnh đó, nếu như URL, website của bạn không được index, các bạn hãy tìm nguyên nhân để khắc phục hiệu quả.
Cách kiểm tra Google index webstie chưa
Cách 1: Dùng toán tử “site:domain”
Bạn vào trang Google, bạn nhập cú pháp Site:Domain vào thanh tìm kiếm là được. Ngay sau đó, Google sẽ trả kết quả cho bạn với số lượng Google đã index trang web của bạn là bao nhiêu. kết quả đó sẽ ngay ở dưới thanh tìm kiếm.
Cách 2: Dùng Add-on SEOquake
Add-on thì chắc hẳn đã quen thuộc với nhiều bạn làm trong ngành Marketing, đặc biệt là bạn làm ở trong ngành SEO. SEOquake chính là add-on SEO miễn phí tích hợp rất nhiều tính năng hữu ích cho SEO, sử dụng được trên nền tảng trình duyệt khác nhau. Sở hữu giao diện thân thiện, đơn giản, giúp người dùng tối ưu được onpage hiệu quả.
Sau khi bạn cài đặt, bạn sẽ thấy biểu tượng của SEOquake xuất hiện, bạn chỉ cần click vào đó là các chỉ số onpage và index sẽ xuất hiện.
Cách 3: Kiểm tra bằng công cụ Google Search Console
Bạn chỉ cần nhập vào trong thanh tìm kiếm ở trên cùng công cụ URL để kiểm tra, và kết qảu sẽ trả lại cho bạn giúp bạn biết được URL được lập chỉ mục hay chưa. Nếu như kết quả đưa ra là URL in not on Google thì URL đó vẫn chưa được index, lập chỉ mục.
Nguyên nhân khiến cho website không index được
Chặn Index với file .htaccess
Ngoài công cụ chuyển hướng người dùng thì file .htaccess có chức năng chỉnh lỗi chính tả, dùng chặn index. Nếu như website của bạn gặp vấn đề này thì Google sẽ khó mà lập chỉ mục, index được.
Chặn Index bằng file robots.txt
Robots.txt chính là tệp tin văn bản ở trong thư mục gốc trang web. Nhiệm vụ này cung cấp hướng dẫn cho Google tìm kiếm, thu thập các thông tin.
Cấu trúc của robots.txt gồm có:
- User-agent: Tên của trình thu thập các dữ liệu web.
- Allow: Thông báo Googlenbot nó sẽ truy cập vào trang hay là thư mục con.
- Sitemap: Sử dụng để cung cấp vị trí bất cứ sitemap.xml nào liên kết với cả URL.
- Crawl-delay: Thông báo trình thu thập chờ bao giây trước khi tiến hành tải, thu thập các dữ liệu của trang.
- Disalow: Thông báo cho User-agent không được thu thập dữ liệu URL. Mỗi dòng sẽ chỉ gắn 1 URL.
Website chứa thẻ noindex
Dùng thẻ meta robots noindexchính là cách web thông báo với Googlebot trang web thuộc website của bạn không cần lập chỉ mục. Vị trí thẻ này sẽ đặt ở phần sau head.
Do đó, trong trương hợp nào đó, website của bạn dính thẻ này sẽ không được index, nên các bạn kiểm tra để khắc phục nó.
Do đó, trang web được index sẽ giúp trang web của bạn tiếp cận với người dùng dễ dàng, tạo ra các cơ hội lên top đầu của Google. Vì thế, bạn nên kiểm tra website của mình xem đã Google Index. Nếu chưa cần phải khắc phục, xử lý kịp thời.
Nguồn : Tham khảo và tổng hợp Internet