分享一些轻易被忽视的Hadoop口试题及谜底
说明:起首大白什么是RAID,可以参考百科磁盘阵列。这句话错误的处地址于太绝对,详细环境详细说明。标题不是重点,常识步崆最重要的。由于hadoop自己就具有冗余手段,以是假如不是很严酷不必要都配备RAID。详细参考第二题。 28. 由于 HDFS 有多个副本,以是 NameNode 是不存在单点题目的。(错误 ) 29. 每个 map 槽就是一个线程。(错误 ) 说明:起首我们知道什么是map 槽,map 槽->map slotmap slot 只是一个逻辑值(org.apache.hadoop.mapred.TaskTracker.TaskLauncher.numFreeSlots),而不是对应着一个线程可能历程 30. Mapreduce 的 input split 就是一个 block。(错误 ) 31. NameNode 的 Web UI 端口是 50030,它通过 jetty 启动的 Web 处事。(错误) 32. Hadoop 情形变量中的 HADOOP_HEAPSIZE 用于配置全部 Hadoop 保卫线程的内存。它默认是 200 GB。(错误) hadoop为各个保卫历程(namenode,secondarynamenode,jobtracker,datanode,tasktracker)同一分派的内存在hadoop-env.sh中配置,参数为HADOOP_HEAPSIZE,默以为1000M。 33、33. DataNode 初次插手 cluster 的时辰,假如 log 中陈诉不兼容文件版本,那必要 NameNode执行“Hadoop namenode -format”操纵名目化磁盘。(错误 ) 说明: 起首大白先容,什么是ClusterID ClusterID 添加了一个新的标识符ClusterID用于标识集群中全部的节点。当名目化一个Namenode,必要提供这个标识符可能自动天生。这个ID可以被用来名目化插手集群的其他Namenode。 感激您的寓目,若有不敷之处,接待品评指正。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |