分享一些轻易被忽视的Hadoop口试题及谜底

发布时间：2019-03-28 17:48:16 所属栏目：教程来源：大数据资讯平台

导读：在互联网高速成长的本日，许多人还没有搞清晰什么是PC互联网，移动互联网来了，我们还没搞清晰移动互联网的时辰，大数据期间又来了。大数据已经无处不在，随之而来的就是大数据技强人才的急需，以下是关于大数据技能的口试题目，各人可以再口试俏拷寮。单

说明：起首大白什么是RAID，可以参考百科磁盘阵列。这句话错误的处地址于太绝对，详细环境详细说明。标题不是重点，常识步崆最重要的。由于hadoop自己就具有冗余手段，以是假如不是很严酷不必要都配备RAID。详细参考第二题。

28. 由于 HDFS 有多个副本，以是 NameNode 是不存在单点题目的。(错误 )

29. 每个 map 槽就是一个线程。(错误 )

说明：起首我们知道什么是map 槽,map 槽->map slotmap slot 只是一个逻辑值(org.apache.hadoop.mapred.TaskTracker.TaskLauncher.numFreeSlots)，而不是对应着一个线程可能历程

30. Mapreduce 的 input split 就是一个 block。(错误 )

31. NameNode 的 Web UI 端口是 50030，它通过 jetty 启动的 Web 处事。(错误)

32. Hadoop 情形变量中的 HADOOP_HEAPSIZE 用于配置全部 Hadoop 保卫线程的内存。它默认是 200 GB。(错误)

hadoop为各个保卫历程(namenode,secondarynamenode,jobtracker,datanode,tasktracker)同一分派的内存在hadoop-env.sh中配置，参数为HADOOP_HEAPSIZE，默以为1000M。

33、33. DataNode 初次插手 cluster 的时辰，假如 log 中陈诉不兼容文件版本，那必要

NameNode执行“Hadoop namenode -format”操纵名目化磁盘。(错误 )

说明：

起首大白先容，什么是ClusterID

ClusterID

添加了一个新的标识符ClusterID用于标识集群中全部的节点。当名目化一个Namenode，必要提供这个标识符可能自动天生。这个ID可以被用来名目化插手集群的其他Namenode。

感激您的寓目，若有不敷之处，接待品评指正。

【编辑保举】

【责任编辑：未丽燕 TEL：（010）68476606】
点赞 0

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

教你如何安装ghost xp	深度技术Ghost xp系统
ghost xp sp3电脑公司	8187无线网卡驱动,教您