IPv6 crawler gesichtet
Friday, February 25. 2011
Yo, der erste, den ich bewusst wahrnehme, im access_log steht:
blog.dreckhaen.de:80 2001:250:3c00:1062:224:e8ff:fe40:da50 - - [24/Feb/2011:11:15:53 +0100] "GET /robots.txt HTTP/1.0" 200 43 "-" "agent6/Nutch-1.1"
Wer ist das?
host 2001:250:3c00:1062:224:e8ff:fe40:da50
0.5.a.d.0.4.e.f.f.f.8.e.4.2.2.0.2.6.0.1.0.0.c.3.0.5.2.0.1.0.0.2.ip6.arpa domain name pointer cernet.edu.cn.
Ein chinesisches Wissenschaftsnetzwerk an der Qinghua Universität.
So, und warum crawlt man mit einem IPv6-crawler, um eine Suchmaschiene nur fuer per IPv6 zugänglichen Content aufzubauen? Wär ja mal ein Projekt, beim Googeln findet man immer wieder Leute, die danach fragen und als Antwort auf sixy.ch verwiesen werden.
Nutch jedenfalls ist eine opensource Suchmaschiene.
Trackbacks
Trackback specific URI for this entry
Comments