上一篇:推荐一个学习Java的好链接
下一篇:No URLs to fetch - check your seed list and URL filters
安装、运行nutch 1.2
米娅 2011年10月22日 20:41:50

调试了一阵nutch 1.3,很多问题弄不清,后来请教高手,说用nutch 1.2会解决很多问题;

下载nutch 1.2 的bin-zip文件,解压可看到.war文件,部署到Tomcat的WebApp目录下,重启Tomcat,使用

http://localhost:8080/nutch-1.2,可看到nutch-1.2的起始页面。

参看: 如何安装使用nutch搜索,solr索引,luke查看
http://www.coolder.com/forum/2217-1-1 

安装 nutch 1.2 bin 到cygwin。

运行 bin/nutch crawl urls -dir crawl -depth 3 -topN 5

修改Tomcat下的nutch-1.2的C:\xampp\apache\tomcat\webapps\nutch-1.2\WEB-INF、nutch-site.xml,添加如下内容,其中的路径是nutch执行crawl命令时产生的index所在路径:

<property>
     <name>searcher.dir</name>
     <value>D:\cygwin\home\nutch-1.2\crawl\</value>
</property>

这时就可以在http://localhost:8080/nutch-1.2 搜索到nutch爬行(crawl)的内容。


共1页
相关链接
1. Drupal Rooms: 安装后不显示Full Calendar
2. 在siteground.com的shared Server上安装SSL笔记
3. 组装计算机,安装系统运行,经常出现蓝屏(已解决)
4. Windows Office 2007: 错误1706 安装程序找不到所需文件
5. Discuz 2.5 模板风格安装体验篇(排版混乱问题)
6. 如何安装使用nutch搜索,solr索引,luke查看
7. 网站如何屏蔽安装360浏览器的用户访问
8. eZ Publish CMS 安装笔记
9. 如何安装curl
10. Windows Vista下安装、运行xampp,搭建网站的流水帐
11. 翻墙工具 之 Hotspot Shield 安装运行详解
12. PC机的操作系统和应用程序安装流水账