您好,登錄后才能下訂單哦!
再看hadoop PRC
以前寫過一篇文章叫做《hadoop RPC從入門到暫時放棄》,現在粗略的把《Hadoop 2.xHDFS源碼剖析》看完了第一遍,感覺對HDFS的整體了解上升了一個層次,并且重新看了一下動態代理、protocol buffer所以這次重新來寫寫對于hadoop RPC的認識。
下面還是主要通過ClientProtocol協議,即hdfs客戶端與NameNode通信的協議,來介紹一下對hadoopRPC的認識。
客戶端
首先編寫程序操作hadoop hdfs的時候,通常都是會用到DFSClient這個類的,這里的DFSClient類中,持有一個實現了ClientProtocol接口的ClientNameNodeProtocolTranslatorPB(以下簡稱translator)的對象實例,這個實例主要的功能就是將ClientProtocol轉化為protocol buffer方式序列化的請求,其實主要也是在這其中使用動態代理獲取了ClientNamenodeProtocolPB的代理對象來實現轉換。其中獲取translator的時候還需要考慮NameNode是否是HA模式的。
其次Client部分最主要的方法就是Client.call方法,在調用call方法時會需要獲取相應RPCServer 的連接對象(Connection),但是由于建立連接在任何一個系統中都是一個十分耗時的操作,所以connection會緩存到相應服務器的連接。Connection對象除了負責建立連接之外,還會在獲取相應請求對應的應答后喚起相應請求的線程。PRC請求除了包括經過protocol buffer序列化的參數,還有對應的請求協議的標識字段。當接收到請求相應的應答時,會根據callId喚起等待的線程,這里根據RPC調用是否成功需要考慮是調用正常的接受應答方法還是異常的應答方法。
2.服務器
以NameNode的RPC服務器為例,它有一個名為NameNodeRpcServer的類專門負責從客戶端、DataNode、以及其他NameNode發送過來的PRC請求。由于需要處理多種PRC協議(例如從客戶端發來的ClientNameNodeProtocolPB),所以在這個類中需要一個叫做BlockingService的類,根據發送的請求中關于調用協議的信息,找出相應得serverSideTranslator來處理相應的*PB協議轉化為真正的協議,例如通過clientNNPbService這個BlockingService將從客戶端發來的ClientNamenodeProtocolPB協議,利用clientProtocolServerTranslator轉化為jvm能夠識別的ClientProtocol協議。
除此之外,RPC服務端還參考了reactor設計模型,采用線程池以及nio的思想,提高了并發能力,具體細節可以參考以前寫得《hadoop RPC從入門到暫時放棄》。
以上差不多就是對hadoopRPC的全部認識了,以后有新的了解在及時更新。
肯草在深圳
2017-03-12
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。