亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么搭建Hadoop集群

發布時間:2021-11-17 15:04:06 來源:億速云 閱讀:151 作者:小新 欄目:大數據

小編給大家分享一下怎么搭建Hadoop集群,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

  1、發行版本說明

  Hadoop 發行版本分為開源社區版和商業版。社區版是指由 Apache 軟件基金會維護的版本,是官方維護的版本體系。 商業版 Hadoop 是指由第三方商業公司在社區版 Hadoop 基礎上進行了一些修改、整合以及各個服務組件兼容性測試而發行的版本,比較著名的有 cloudera的 CDH、mapR、hortonWorks 等。

  我們等會要學習的是商業版:cloudera 的 CDH。如未說明都指 CDH版本。Hadoop 的版本很特殊,是由多條分支并行的發展著。大的來看分為3個大的系列版本:1.x、2.x、3.x。Hadoop1.0 由一個分布式文件系統 HDFS和一個離線計算框架 MapReduce 組成。

  Hadoop 2.0 則包含一個支持 NameNode 橫向擴展的 HDFS,一個資源管理系統YARN 和一個運行在 YARN 上的離線計算框架 MapReduce。相比于 Hadoop1.0, Hadoop 2.0 功能更加強大,且具有更好的擴展性、性能,并支持多種計算框架。Hadoop 3.0 相比之前的 Hadoop 2.0 有一系列的功能增強。目前已經趨于穩定,但是整個生態圈體系升級整合還未完畢,所以商用還值得商榷。 我們要講的Hadoop集群搭建過程,使用的是當前 2 系列最穩定版本:CDH 2.6.0-CDH14.0。

  2、Hadoop集群簡介

  Hadoop集群具體來說包含兩個集群:HDFS 集群和 YARN 集群,兩者邏輯上分離,但物理上常在一起。HDFS集群負責海量數據的存儲,集群中的角色主要有:NameNode 、 DataNode 、 SecondaryNameNode。YARN 集群負責海量數據運算時的資源調度,集群中的角色主要有: ResourceManager、NodeManager。

  那 mapreduce是什么呢?它其實是一個分布式運算編程框架,是應用程序開發包,由用戶按照編程規范進行程序開發,后打包運行在 HDFS 集群上,并且受到 YARN 集群的資源調度管理。Hadoop 部署方式分三種,Standalone mode(獨立模式)、Pseudo-Distributed mode(偽分布式模式)、Cluster mode(群集模式),其中前兩種都是在單機部署。獨立模式又稱為單機模式,僅 1 個機器運行 1 個 java 進程,主要用于調試。偽分布模式也是在 1 個機器上運行 HDFS 的 NameNode 和 DataNode、YARN 的ResourceManger 和 NodeManager,但分別啟動單獨的 java 進程,主要用于調試。集群模式主要用于生產環境部署。會使用 N 臺主機組成一個 Hadoop 集群。這種部署模式下,主節點和從節點會分開部署在不同的機器上。我們以 3 節點為例進行搭建,角色分配如下:

  node-01 NameNode DataNode ResourceManager

  node-02 DataNode NodeManager SecondaryNameNode

  node-03 DataNode NodeManager

  3、服務器準備

  本案例使用 VMware Workstation Pro 虛擬機創建虛擬服務器來搭建 HADOOP 集群,所用軟件及版本如下:

  VMware Workstation Pro 12.0

  Centos 6.9 64bit

  4、網絡環境準備

  采用 NAT 方式聯網。如果創建的是桌面版的 Centos 系統,可以在安裝完畢后通過圖形頁面進行編輯。如果是 mini 版本的,可通過編輯 ifcfg-eth*配置文件進行配置。 注意 BOOTPROTO、GATEWAY、NETMASK。

  5、服務器系統設置

  同步時間

  #同步集群各機器時間

  date -s "2019-03-03 03:03:03" yum install ntpdate

  #網絡同步時間

  ntpdate cn.pool.ntp.org

  設置主機名

  vi /etc/sysconfig/network NETWORKING=yes

  HOSTNAME=node-1

  配置 IP、主機名映射vi /etc/hosts

  192.168.33.101 node-1

  192.168.33.102 node-2

  192.168.33.103 node-3

  配置 ssh 免密登陸

  #生成 ssh 免登陸密鑰

  ssh-keygen -t rsa (四個回車)

  執行完這個命令后,會生成 id_rsa(私鑰)、id_rsa.pub(公鑰)

  將公鑰拷貝到要免密登陸的目標機器上

  ssh-copy-id node-2

  配置防火墻

  #查看防火墻狀態

  service iptables status

  #關閉防火墻

  service iptables stop

  #查看防火墻開機啟動狀態

  chkconfig iptables --list

  #關閉防火墻開機啟動

  chkconfig iptables off

  6、JDK 環境安裝

  #上傳 jdk 安裝包

  jdk-8u65-linux-x64.tar.gz

  #解壓安裝包

  tar zxvf jdk-8u65-linux-x64.tar.gz

  #配置環境變量 /etc/profile

  export JAVA_HOME=/export/servers/jdk1.8.0_65

  export PATH=$PATH:$JAVA_HOME/bin

  export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

  #刷新配置

  source /etc/profile

以上是“怎么搭建Hadoop集群”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

荣成市| 含山县| 黎川县| 东海县| 丰原市| 吉隆县| 崇明县| 昭通市| 丰县| 邵阳县| 新巴尔虎右旗| 弥渡县| 大余县| 永善县| 土默特右旗| 连州市| 永川市| 岳普湖县| 津南区| 吴江市| 怀远县| 新乡市| 南召县| 邳州市| 阿勒泰市| 和政县| 电白县| 休宁县| 交口县| 喜德县| 仙桃市| 高尔夫| 义马市| 朔州市| 扶沟县| 隆化县| 永登县| 合山市| 文化| 文成县| 霍山县|