중국발 무효 트래픽은 참 무섭네요.


항상 구글 애드센스의 "페이지뷰"와 구글 어낼리틱스의 "조회수" 그리고 블로그에 설치한 방문자 카운터가 다 제각각이죠.

이게 왜 오차범위 밖으로 다른가 궁금했는데 확인이 되었네요.


봇이나 크롤러 중에 구글이나 빙, 네이버 또는 퍼플렉시티나 챗GPT 등과 달리 정체를 밝히지 않는 봇들이 많죠.

게다가 리퍼러 주소도 없는 봇들이 많습니다.


그런 악성 봇이나 크롤러 중에서도 실제 이용자가 웹 브라우저를 통해 접근하는 것과 동일하게 페이지의 자바스크립트까지도

몽땅 가져다가 웹 페이지 렌더링까지 하는 봇들이 많네요.

대부분은 정적 HTML 코드만 가져가고 자바스크립트는 가져가지 않는 경우가 많은데 완전히 다릅니다.


특히나 중국의 클라우드인 텐센트와 화웨이에서 방문하는 봇은 중국의 베이징, 홍콩은 물론 미국 산타클라라,

멕시코의 멕시코시티는 기본이고 브라질, 필리킨 등에서도 옵니다.


막아도 막아도 끝이 없습니다. 클라우드 플레어를 사용하면 막을 수는 있는데 룰을 5개 밖에 넣을 수가 없고

무엇보다도 응답속도가 많이 느려집니다.


그래서 결국은 IPTable에 IPSet 이라는 툴을 추가로 연동해 IP 대역을 많이 등록해도 속도저하가 거의 없는 방식으로

차단하고 있습니다. 현재 ipset에 등록된 ip 대역이 500개가 넘었습니다.


대부분은 /24 로 등록했고 일부는 워낙 넓은 범위에서 무작위 IP 대역으로 들어와서 /16으로 등록한 것도 일부 있습니다.


그랬더니 점점 워드프레스에 설치한 방문자 카운터의 숫자가 구글 애드센스의 페이지뷰 숫자와 점점 비슷해지고 있습니다.