Trường Sơn
Writer
Hiện tượng website của bạn (và nhiều trang khác) nhận được lượng traffic từ Trung Quốc tăng đột biến, đặc biệt là từ cuối năm 2024 đến nay, là một vấn đề rất phổ biến. Nguyên nhân là gì và có đáng lo không?
Trước hết, mình xin khẳng định phần lớn lượng truy cập này không phải là người dùng thật, mà là Bot Traffic (truy cập từ robot). Vì sao mình biết được như vậy? Là vì hãy nhìn vào thời gian trên trang web (time on site) là 0.
Thường đến từ các thành phố như Lanzhou (Lan Châu)
Khả năng đầu tiên nên nghĩ đến là AI Scrapers (robot thu thập dữ liệu cho AI). Các công ty công nghệ Trung Quốc đang chạy đua phát triển các mô hình ngôn ngữ lớn (LLM). Họ thả hàng triệu con bot đi "quét" (scrape) nội dung trên toàn cầu để huấn luyện AI.
Ngoài ra, có thể có Ghost Traffic (Truy cập "ma"). Một số bot không hề truy cập vào website của bạn mà chỉ gửi dữ liệu giả trực tiếp vào mã theo dõi Google Analytics (GA4) của bạn. Điều này khiến bạn thấy số liệu tăng vọt trong báo cáo nhưng server thực tế lại không có ai truy cập.
Cũng có khả năng các nhóm hacker hoặc tổ chức spam sử dụng bot để tìm kiếm các lỗ hổng (như plugin lỗi thời, trang đăng nhập yếu) nhằm mục đích tấn công hoặc chèn link quảng cáo bẩn.
Chính vì vậy, lưu lượng ảo này không phải là không có ảnh hưởng đến trang của bạn. Nghiêm trọng nhất là ảnh hưởng đến thống kê chung của trang, làm tỷ lệ thoát (Bounce Rate) tăng vọt, time on site giảm nghiêm trọng. Vì vậy, bạn không thể đánh giá chính xác hiệu quả marketing thật sự.
Nếu hàng nghìn con bot truy cập cùng lúc, nó sẽ chiếm dụng băng thông và tài nguyên CPU/RAM của hosting, khiến website bị chậm hoặc thậm chí bị sập (tương tự một cuộc tấn công DDoS nhẹ).
Cách đối phó với tình trạng này là dùng Cloudflare chặn IP theo quốc gia (Geo-blocking). Cách này hơi tốn kém vì chi phí dịch vụ Cloudflare khá đắt nhất là với website nhỏ. Một cách khác là trong GA4, tạo các bộ lọc để loại bỏ lưu lượng truy cập từ quốc gia hoặc các ISP đáng ngờ nhằm làm sạch báo cáo.
Trước hết, mình xin khẳng định phần lớn lượng truy cập này không phải là người dùng thật, mà là Bot Traffic (truy cập từ robot). Vì sao mình biết được như vậy? Là vì hãy nhìn vào thời gian trên trang web (time on site) là 0.
Thường đến từ các thành phố như Lanzhou (Lan Châu)
Khả năng đầu tiên nên nghĩ đến là AI Scrapers (robot thu thập dữ liệu cho AI). Các công ty công nghệ Trung Quốc đang chạy đua phát triển các mô hình ngôn ngữ lớn (LLM). Họ thả hàng triệu con bot đi "quét" (scrape) nội dung trên toàn cầu để huấn luyện AI.
Ngoài ra, có thể có Ghost Traffic (Truy cập "ma"). Một số bot không hề truy cập vào website của bạn mà chỉ gửi dữ liệu giả trực tiếp vào mã theo dõi Google Analytics (GA4) của bạn. Điều này khiến bạn thấy số liệu tăng vọt trong báo cáo nhưng server thực tế lại không có ai truy cập.
Cũng có khả năng các nhóm hacker hoặc tổ chức spam sử dụng bot để tìm kiếm các lỗ hổng (như plugin lỗi thời, trang đăng nhập yếu) nhằm mục đích tấn công hoặc chèn link quảng cáo bẩn.
Chính vì vậy, lưu lượng ảo này không phải là không có ảnh hưởng đến trang của bạn. Nghiêm trọng nhất là ảnh hưởng đến thống kê chung của trang, làm tỷ lệ thoát (Bounce Rate) tăng vọt, time on site giảm nghiêm trọng. Vì vậy, bạn không thể đánh giá chính xác hiệu quả marketing thật sự.
Nếu hàng nghìn con bot truy cập cùng lúc, nó sẽ chiếm dụng băng thông và tài nguyên CPU/RAM của hosting, khiến website bị chậm hoặc thậm chí bị sập (tương tự một cuộc tấn công DDoS nhẹ).
Cách đối phó với tình trạng này là dùng Cloudflare chặn IP theo quốc gia (Geo-blocking). Cách này hơi tốn kém vì chi phí dịch vụ Cloudflare khá đắt nhất là với website nhỏ. Một cách khác là trong GA4, tạo các bộ lọc để loại bỏ lưu lượng truy cập từ quốc gia hoặc các ISP đáng ngờ nhằm làm sạch báo cáo.