IPv6 crawler gesichtet

Friday, February 25. 2011

Yo, der erste, den ich bewusst wahrnehme, im access_log steht:

blog.dreckhaen.de:80 2001:250:3c00:1062:224:e8ff:fe40:da50 - - [24/Feb/2011:11:15:53 +0100] "GET /robots.txt HTTP/1.0" 200 43 "-" "agent6/Nutch-1.1"

Wer ist das? 

host 2001:250:3c00:1062:224:e8ff:fe40:da50 
0.5.a.d.0.4.e.f.f.f.8.e.4.2.2.0.2.6.0.1.0.0.c.3.0.5.2.0.1.0.0.2.ip6.arpa domain name pointer cernet.edu.cn.

Ein chinesisches Wissenschaftsnetzwerk  an der Qinghua Universität. 

So, und warum crawlt man mit einem IPv6-crawler, um eine Suchmaschiene nur fuer per IPv6 zugänglichen Content aufzubauen? Wär ja mal ein Projekt, beim Googeln findet man immer wieder Leute, die danach fragen und als Antwort auf sixy.ch verwiesen werden. 

Nutch jedenfalls ist eine opensource Suchmaschiene



Trackbacks


Trackback specific URI for this entry
    No Trackbacks

Comments


    No comments

Add Comment

Enclosing asterisks marks text as bold (*word*), underscore are made via _word_.
Standard emoticons like :-) and ;-) are converted to images.
E-Mail addresses will not be displayed and will only be used for E-Mail notifications.
To leave a comment you must approve it via e-mail, which will be sent to your address after submission.

To prevent automated Bots from commentspamming, please enter the string you see in the image below in the appropriate input box. Your comment will only be submitted if the strings match. Please ensure that your browser supports and accepts cookies, or your comment cannot be verified correctly.
CAPTCHA