[Google Crawler Update]: Googlebot gặp sự cố thu thập dữ liệu và cách xử lý ngay
Gần đây, nhiều trang web gặp tình trạng Googlebot thu thập dữ liệu chậm hơn, với số lượng yêu cầu giảm mạnh, trong khi thời gian phản hồi máy chủ lại tăng đáng kể. Điều này có thể ảnh hưởng đến quá trình lập chỉ mục và hiệu suất SEO của website.

Nguyên nhân gây ra Googlebot thu thập dữ liệu chậm
Theo Gianna Brachetti-Truskawa đăng thông tin trên Linkedinvề tình trạng Google Bot thu thập dữ liệu chậm.

Gianna Brachetti-Truskawa
(Nguồn Linkedin)
Nguyên nhân của việc này là do Google đã cập nhật danh sách IP của Googlebot vào ngày 4 tháng 2 năm 2025. Nếu website của bạn sử dụng CDN (mạng phân phối nội dung), tường lửa ứng dụng web (WAF) của CDN có thể chưa cập nhật danh sách IP mới, dẫn đến việc Googlebot bị chặn hoặc giới hạn tốc độ thu thập dữ liệu.
Những CDN nào đang bị ảnh hưởng?
Không phải tất cả các CDN đều gặp sự cố. Cloudflare đã cập nhật kịp thời và không bị ảnh hưởng, nhưng một số nhà cung cấp lớn như Akamai Technologies vẫn gặp vấn đề do chưa cập nhật danh sách IP của Googlebot.
Dưới đây là biểu đồ thu thập dữ liệu từ diễn đàn trợ giúp quản trị trang web của Google, cho thấy sự sụt giảm mạnh trong số lượng yêu cầu thu thập dữ liệu:

(Nguồn: diễn đàn trợ giúp quản trị trang web của Google)
Google bắt đầu công khai danh sách IP của Googlebot vào năm 2021 để giúp quản trị viên web xác minh lưu lượng truy cập hợp lệ. Tuy nhiên, bản cập nhật mới nhất vào tháng 02/2025 dường như đã có tác động lớn hơn bình thường.
🗣Theo John Mueller từ Google đã đưa tin trên Bluesky về cập nhật danh sách IP:

Chúng tôi tự động cập nhật danh sách IP – các thay đổi có thể xảy ra theo thời gian. Nếu bạn cần theo dõi, hãy kiểm tra thường xuyên. Những thay đổi gần đây không quá lớn, nhưng đôi khi có thể gây ảnh hưởng đến hệ thống của một số trang web.
(Nguồn: Bluesky - John Mueller)
Cách kiểm tra và khắc phục Googlebot gặp lỗi thu thập dữ liệu chậm
Nếu bạn nhận thấy số lần thu thập dữ liệu của Google giảm mạnh hoặc thời gian phản hồi máy chủ tăng lên, hãy thực hiện các bước sau:
✅ Kiểm tra với nhà cung cấp CDN của bạn xem họ đã cập nhật danh sách IP của Googlebot chưa. Nếu chưa, hãy yêu cầu họ cập nhật ngay lập tức.
✅ Theo dõi danh sách IP của Googlebot bằng cách sử dụng Google JSON File chính thức. Bạn có thể kiểm tra và cập nhật danh sách này theo thời gian để đảm bảo Googlebot không bị chặn.
🔗 Xem danh sách IP mới nhất tại đây: Googlebot JSON File

✅ Lưu trữ phiên bản danh sách IP trước đây bằng Wayback Machine hoặc sử dụng các công cụ so sánh như Testomato, Little Warden hoặc Compare plugin trong Notepad++ để phát hiện thay đổi kịp thời.
✅ Tham khảo cộng đồng SEO để tìm hiểu xem CDN nào đang gặp vấn đề và cập nhật giải pháp khắc phục nhanh nhất.
Thảo luận và cập nhật
Vấn đề này hiện đang được thảo luận trên LinkedIn và Bluesky. Ngoài ra, trên WebmasterWorld cũng đang báo cáo vấn đề tương tự.
Dưới đây là một biểu đồ khác từ diễn đàn, thể hiện sự thay đổi trong việc thu thập dữ liệu của Googlebot.

( Nguồn: WebmasterWorld - Google Crawling Problem)
👉Hãy kiểm tra Google Search Console của bạn ngay để xem trang web có bị ảnh hưởng không! Nếu có bất kỳ vấn đề nào, hãy thực hiện các bước khắc phục để đảm bảo Googlebot có thể thu thập dữ liệu trang web của bạn mà không bị gián đoạn.
Đây là những thông tin mới nhất về Googlebot gặp sự cố thu thập dữ liệu và cách khắc phục, Seodoctor hy vọng đã mang đến bạn thông tin hữu ích.