发布网友 发布时间:2022-04-12 19:26
共2个回答
懂视网 时间:2022-04-12 23:47
参考http://wiki.apache.org/nutch/RunNutchInEclipse 一、环境准备 1、下载nutch2.3源代码 wget http://mirror.bit.edu.cn/apache/nutch/2.3/apache-nutch-2.3-src.tar.gz 或者下载正在开发中的最新版本 svn co https://svn.apache.org/repos/asf/nutch/bra
参考http://wiki.apache.org/nutch/RunNutchInEclipse
一、环境准备
1、下载nutch2.3源代码
wget http://mirror.bit.edu.cn/apache/nutch/2.3/apache-nutch-2.3-src.tar.gz或者下载正在开发中的最新版本
svn co https://svn.apache.org/repos/asf/nutch/branches/2.x
2、选择使用的数据库类型,以hbase为例
在conf/nutch-site.xml中增加以下属性:
storage.data.store.class org.apache.gora.hbase.store.HBaseStore Default class for storing data
3、在ivy/ivy.xml中增加与hbase相关的依赖项,此项本已存在,但被注释掉,将注释去掉即可
其中plugin.folders的值为$NUTCH_HOME/build/pluginshttp.agent.name My Nutch Spider http.robots.agents none plugin.folders /Users/liaoliuqing/0_Search/1_Nutch/1_Official/apache-nutch-2.3/build/plugins
5、执行ant eclipse
二、导入project
1、导入project
三、运行程序
1、Run as ----> Run configuration,选择project与主类
2、填写参数
/Users/liaoliuqing/Downloads/seed.txt
-Dhadoop.log.dir=logs -Dhadoop.log.file=hadoop.log
3、点击run,输出结果如下:
InjectorJob: starting at 2015-01-28 16:27:43
InjectorJob: Injecting urlDir: /Users/liaoliuqing/Downloads/seed.txt
InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.
InjectorJob: total number of urls rejected by filters: 0
InjectorJob: total number of urls injected after normalization and filtering: 1
Injector: finished at 2015-01-28 16:27:47, elapsed: 00:00:04
注意,在运行程序前,本机需要先启动hbase。
4、查看hbase中的数据
hbase(main):003:0> scan 'webpage' ROW COLUMN+CELL com.163.www:http/ column=f:fi, timestamp=1422433667377, value=x00'x8Dx00 com.163.www:http/ column=f:ts, timestamp=1422433667377, value=x00x00x01K/xA7:x14 com.163.www:http/ column=mk:_injmrk_, timestamp=1422433667377, value=y com.163.www:http/ column=mk:dist, timestamp=1422433667377, value=0 com.163.www:http/ column=mtdt:_csh_, timestamp=1422433667377, value=?x80x00x00 com.163.www:http/ column=s:s, timestamp=1422433667377, value=?x80x00x00 1 row(s) in 0.2970 seconds
热心网友 时间:2022-04-12 20:55
你意思是不是:用eclipse生成一个.exe可运行文件??
第一步
先从网上下载fatjar插件,安装插件,步骤见这个链接
但是下载的插件版本是net.sf.fjep.fatjar_0.0.31.jar在新版本的eclipse(我的版本是4.5)中不起作用,解决办法见这个链接:新版本eclipse无法安装FatJar插件的问题
插件安装完毕
第二步
导出jar文件
但是又出现问题了,我程序有图片,在eclipse中一切运行正常,可是导出jar包后,图片不显示,解决办法见链接
eclipse导出(用fat插件)jar包图片显示不了解决办法
一开始 图片的加载路径是 new ImageIcon(“./imageX.png”)格式,在Jar中如果用这种方式加载是不行的, 换成下面
Icon runImg = new ImageIcon(this.getClass().getClassLoader().getResource("image/run.png"));11
这时候的image包要放在src下.
图片原来在image下
第三步
exe4j 安装步骤
http://jingyan.baidu.com/article/f0e83a258a92d222e59101c4.html