Đến điên với google

Ngô Nguyễn Duy
(caspi)

Thành viên
Ngày xưa HAO còn host chung với 1 site khác, mấy tháng nay bỏ được site đó đi rồi, tuy nhiên google hình như 0 chịu tha cho mình nên ngày nào cũng có 1 lần google cho 1 đống những thứ này vào server mình
[Thu Apr 06 20:46:23 2006] [error] [client 203.160.1.37] File does not exist: /var/www/html/i, referer: http://72.14.203.104/s
earch?q=cache:jd1ihf0N46EJ:www.site_khac.com/?cate_id=5&action=cate+thiet+ke+cong+trinh+xay+dung+cong+nghiep&
hl=vi&gl=vn&ct=clnk&cd=4&ie=UTF-8
Và hàng trăm phát như vậy liên tục làm cho mình bị cứng đơ. Hiện tại anh chưa có giải pháp nào khác ngoài việc viết 1 cái RewriteRule cho trang đó, vì domain của họ vẫn trỏ vào IP của mình.
RewriteRule ^/(.*) http://www.xxxdomain.com/$1 [R=301,L]
Có cách giải quyết nào khác 0 nhỉ ? :)
 
Nếu về kĩ thuật mình không chặn được thì anh thử gửi mail liên hệ thẳng với họ xem ạ ?
 
Đặng Trần Hiếu đã viết:

May ra thì được :D anh Duy làm cái file robots.txt cho vào ngay / của cái site_khac ý ạ :D Vì việc đầu tiên của bọn spider của google sẽ vào http://site_khac.com/robots.txt bon chen hóng hớt :p

Nội dung file đấy thì chỉ cần đơn giản :
User-agent: *
Disallow: /

:-j chả bít có được không nữa :D Em cũng ko hiểu mấy mây con spider của mấy bọn tìm kiếm chúng nó hoạt động thế nào, anh thử xem ạ :D
 
RewriteRule ^/(.*) http://www.xxxdomain.com/$1 [R=301,L]
Mà cái đoạn này hơi lạ. Thế tức là nó có 2 domains, 1 cái trỏ vào HAO, 1 cái ở chỗ khác (xxxdomain) thế nên bác mới phải dùng cái RewriteRule trên để redirect request đến domain cũ của nó (cái trỏ vào HAO) --> xxxdomain?? Thế sao ko bảo nó trỏ cái domain cũ của nó sang chỗ khác có phải đơn giản ko??
 
Đặng Trần Hiếu đã viết:
Mà cái đoạn này hơi lạ. Thế tức là nó có 2 domains, 1 cái trỏ vào HAO, 1 cái ở chỗ khác (xxxdomain) thế nên bác mới phải dùng cái RewriteRule trên để redirect request đến domain cũ của nó (cái trỏ vào HAO) --> xxxdomain?? Thế sao ko bảo nó trỏ cái domain cũ của nó sang chỗ khác có phải đơn giản ko??
Hehe ừ nó vốn có 2 domain ở chỗ mình, 1 cái thì mới đưa sang chỗ khác, cái còn lại "chưa kịp" chuyển, cho nên anh bắn cái thứ 2 này sang cái nó mới chuyển luôn.

Cái dòng đó là khi mình google, xong click vào trang web 0 được thì click vào cache của nó, anh chỉ 0 hiểu làm sao user gọi cache của google mà mình vẫn phải gánh thôi

[Fri Apr 07 14:26:33 2006] [error] [client MY_IP] File does not exist: /var/www/html/vbb, referer: http://72.14.203.104/search?q=cache...m+duong+dai&hl=vi&gl=vn&ct=clnk&cd=6&ie=UTF-8

Như ví dụ ở trên, anh gõ đoạn referer vào web browser của anh và nhận được trang cache của google, thế nhưng server mình vẫn bị nhận 1 connection từ IP của anh ( MY_IP ) và báo lỗi trong error_log, thế là thế nào.

Robots.txt thì anh đang lười, vì mình dùng virtualhost, hiện giờ nó vào trang chính của mình, nếu muốn dùng thì anh phải làm lại cái virtualhost của site kia rồi bỏ trong DocumentRoot của nó :)

Việt: anh 0 thích bảo google xóa hết cache của bọn kia đi vì tiếc cho bọn nó :)
 
Chỉnh sửa lần cuối:
Chắc tại nó update cache. Cái này phải hỏi ai làm ở Google mới biết chính xác được. Nói chung là 1 thời gian nữa là Google tự điều chỉnh ấy mà.
 
Back
Bên trên