亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Nutch1.7如何配置到eclipse

發布時間:2021-11-27 15:28:19 來源:億速云 閱讀:331 作者:小新 欄目:云計算

這篇文章主要介紹Nutch1.7如何配置到eclipse,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

進入正題:

1、將nutch項目部署到eclipse
首先到nutch官網上找到FAQ鏈接http://wiki.apache.org/nutch/FAQ,進入鏈接
點擊第二個鏈接查看。

參照文檔進行配置,有卡殼不明白的地方,繼續在網上針對具體問題查找資料。集成時可參照http://blog.csdn.net/witsmakemen/article/details/8866235。
運行之前必須有一下先決條件:
A、在windows上安裝配置Apache Ant,http://ant.apache.org/manual/index.html
B、安裝Eclipse,這個不用說肯定是必須的。
C、在Linux安裝svn。目的:遷出nutch2.7源代碼。
D、在Linux下檢出nutch2.7代碼
[root@nutch-five branch-1.7]# svn co http://svn.apache.org/repos/asf/nutch/branches/branch-1.7/
E、在Linux安裝ivy插件。目的,根據ivy配置文件動態下載jar包。
F、編譯branch2.7

[root@nutch-five branch-1.7]# ant

2、在Linux下執行ant命令編譯源代碼:ant</p>

3、編譯成功后,將trunk文件夾復制到windows中,導入eclipse</span>

A、eclipse : File -- New -- Java Project


B、點擊NEXT
找到 conf 文件夾 ,然后點擊 Add Folder 'conf' to build path

defautl output 設置為 apache-nutch-1.7/conf
在這兒我因為不能創建conf,所以寫為conf

點擊Finish
至此,建立成功。




C、此時會發現工程有錯誤(紅色的小叉叉),這是因為缺少引用導致。
以parse-html為例:
import org.cyberneko.html.parsers.*;
這里報錯是因為缺少 nekohtml-0.9.5.jar
如何獲取nekohtml-0.9.5.jar:
找到runtime/local/plugins/lib-nekohtml/nekohtml-jar,單擊右鍵add to build path,其他bug以此類推。
在 這兒一共要的jar包大概有,runtime/local/plugins/lib-nekohtml/nekohtml-jar、runtime /local/plugins/parse-html/tagsoup.jar、runtime/local/plugins/feed /rome.jar(解決了com.sun.syndication.io.SyndFeedInput報錯問題)、runtime/local /plugins/urlfilter-automaton/automaton.jar(解決 dk.brics.automaton.RunAutomaton報錯問題)
至此整個工程將應該不會有錯了。
4、新建文件夾urls
在文件夾內新建文件url,存放待抓取網址
如:http://www.163.com/
5、運行程序


6、報異常:
ERROR security.UserGroupInformation (UserGroupInformation.java:doAs(1193)) - PriviledgedActionException as:hadoop cause:java.io.IOException: Failed to set permissions of path: \tmp\hadoop-hadoop\mapred\staging\hadoop1071373990\.staging to 0700
解決方案:
下 載hadoop的源代碼,重新編譯hadoop的hadoop-core.jar包,替換掉nutch項目中的hadoop-core.jar的jar 包。(注意:下載時先確定nutch引用的hadoop的哪個版本的jar包,然后下載對應版本。在runtime/local/lib中可以找到對應 hadoop的jar包。)
下載hadoop源代碼:
下載鏈接:http://apache.dataguru.cn/hadoop/common/hadoop-1.2.1/

1、注釋掉build.xml中的
<target name="create-native-configure">
<exec executable="autoreconf" dir="${native.src.dir}" searchpath="yes" failonerror="yes">  <arg value="-if"/>
</exec>
 </target>
2、去掉compile-core-native中的create-native-configure依賴
 <target name="compile-core-native" depends="create-native-configure,compile-core-classes"
if="compile.native">
3、修改hadoop-1.1.2/src/core/org/apache/hadoop/fs/FileUtil.java 691行,把throw new IOException改為LOG.warn
4、用ant編譯項目,編譯成功后從build文件夾中取出hadoop-core.jar文件夾,放入nutch項目中,替換項目中原有hadoop-core.jar,放入build/lib文件夾下。再通過buildpath添加jar包。
添加完畢后,運行測試
7、繼續運行,繼續報錯
java.lang.RuntimeException: Error in configuring object

解決方案:
將nutch-default.xml中的
<property>
 <name>plugin.folders</name>
 <value>./src/plugin</value>
<description>Directories where nutch plugins are located.  Each
element may be a relative or absolute path.  If absolute, it is used
as is.  If relative, it is searched for on the classpath.</description>
</property>
紅色處改一下就可以了。
參照上邊的運行方法,繼續運行測試,產生異常:
java.net.SocketException: Software caused connection abort: recv failed
解決方案:
鏈接不成功,可以忽略,對程序沒有影響。
至此,nutch在eclipse中集成成功。

相關異常:
ERROR security.UserGroupInformation (UserGroupInformation.java:doAs(1193)) - PriviledgedActionException as:hadoop cause:java.io.IOException: Failed to set permissions of path: \tmp\hadoop-hadoop\mapred\staging\hadoop1071373990\.staging to 0700
解決方案:
重新編譯hadoop的hadoop-core.jar包,替換掉nutch項目中的hadoop的jar包
1、注釋掉build.xml中的
<target name="create-native-configure">
<exec executable="autoreconf" dir="${native.src.dir}" searchpath="yes" failonerror="yes">  <arg value="-if"/>
</exec>
 </target>
2、去掉compile-core-native中的create-native-configure依賴
 <target name="compile-core-native" depends="create-native-configure,compile-core-classes"
if="compile.native">
3、修改hadoop-1.1.2/src/core/org/apache/hadoop/fs/FileUtil.java 691行,把throw new IOException改為LOG.warn
4、用ant編譯項目,編譯成功后從build文件夾中取出hadoop-core.jar文件夾,放入nutch項目中,替換項目中原有hadoop-core.jar,放入build/lib文件夾下。再通過buildpath添加jar包。
添加完畢后,運行測試
源碼環境搭建時發現sun.net.util.ipaddressutil的包沒有
sun.net 包里的類,在eclipse里默認是不讓用的。解決辦法是自定義access rules工程上右鍵->工程屬性->java builder path->Libraries標簽,點擊JRE System Library里面的Access rules,add sun/** 為accessible,如果該項存在,就edit。

以上是“Nutch1.7如何配置到eclipse”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

峨眉山市| 昌黎县| 贵南县| 云浮市| 古蔺县| 东明县| 涟源市| 克什克腾旗| 乾安县| 青龙| 武陟县| 武山县| 囊谦县| 平度市| 平昌县| 平阴县| 长沙县| 张家口市| 康平县| 塘沽区| 东山县| 广东省| 叶城县| 凯里市| 库车县| 库尔勒市| 天津市| 鲁山县| 射阳县| 西畴县| 昭通市| 新乡市| 内黄县| 慈利县| 昂仁县| 台东县| 松江区| 大埔县| 巴中市| 德令哈市| 文登市|