下载 nutch 1.2 使用
bin/nutch crawl urls -dir crawl -depth 3 -topN 5
显示: No URLs to fetch - check your seed list and URL filters
参考如下修改文件 nutch-1.2/conf/crawl-urlfilter.txt 即可:
# accept hosts in MY.DOMAIN.NAME
+^http://([a-z0-9]*\.)*coolder.com/
运行正常。