解決Hadoop HA集群 NameNode 無法自動(dòng)故障轉(zhuǎn)移(切換active)在學(xué)習(xí) HA 自動(dòng)化配置,按照hadoop官網(wǎng):https://hadoop./docs/stable/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html 配置,最后所有的節(jié)點(diǎn)都啟動(dòng)正常。 用 kill -9 進(jìn)程號(hào) 殺死了當(dāng)前處于active狀態(tài)的NameNode后,其他的 Standby 狀態(tài)的NameNode 并沒有自動(dòng)切換為 Active狀態(tài),而且重啟殺死的 NameNode 后,可能出現(xiàn)所有NameNode節(jié)點(diǎn)都變成了 Standby狀態(tài)的情況,一個(gè)Active狀態(tài)的都沒有。 查看日志:${HADOOP_HOME}/logs/hadoop-root-zkfc-hadoop2.log ,發(fā)現(xiàn)報(bào)錯(cuò)了 2020-01-03 19:21:13,636 WARN org.apache.hadoop.ha.FailoverController: Unable to gracefully make NameNode at hadoop3/192.168.137.13:8020 standby (unable to connect) java.net.ConnectException: Call From hadoop2/192.168.137.12 to hadoop3:8020 failed on connection exception: java.net.ConnectException: 拒絕連接; For more details see: http://wiki./hadoop/ConnectionRefuse at sun.reflect.GeneratedConstructorAccessor8.newInstance(Unknown Source at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) at java.lang.reflect.Constructor.newInstance(Constructor.java:423 at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:792)
這是因?yàn)闆]有 fuster 程序,導(dǎo)致無法進(jìn)行 fence,根據(jù)官網(wǎng)上的配置,是在 hdfs-ite.xml 中配置過相關(guān)配置: <property> <name>dfs.ha.fencing.methods</name> <value>sshfence</value> </property> 解決方法:安裝包含fuster程序的軟件包Psmisc(每個(gè)機(jī)器上都要安裝): yum -y install psmisc |
|