简介
是一个由Apache基金会所开发的基础架构。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个(Hadoop Distributed File System),简称HDFS。HDFS有高的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
环境说明
角色 | 主机名 | IP | 功能 | 存储分区 |
Master | controller | 192.168.128.166 | NameNode|Secondarynamenode|JobTracker | /data |
Slave | compute | 192.168.128.165 | DataNode|TaskTracker | /data |
Hadoop部署部署Hadoop需要Master与所有Salve主机实现无秘密访问登录,即配置免秘钥登录,相关配置见:http://www.cnblogs.com/Dev0ps/p/8259099.html修改主机名并且加入hosts文件:192.168.128.166 controller192.168.128.165 compute安装java环境:[root@controller ~]# yum install -y java[root@controller jvm]# vim /etc/profile 添加以下java环境 #set java environment JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk-1.8.0.151-5.b12.el7_4.x86_64 PATH=$PATH:$JAVA_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export JAVA_HOME CLASSPATH PATH [root@controller jvm]# source /etc/profile[root@controller ~]# cd /usr/local/[root@controller local]# wget http://mirrors.shuosc.org/apache/hadoop/common/hadoop-2.6.5/hadoop-2.6.5.tar.gz[root@controller local]# tar xf hadoop-2.6.5.tar.gz[root@controller local]# cd hadoop-2.6.5/etc/hadoop/修改hadoop-env.sh[root@controller hadoop]# vim hadoop-env.shexport JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk-1.8.0.151-5.b12.el7_4.x86_64修改core-site.xml[root@controller hadoop]# vim core-site.xml修改hdfs-site.xml[root@controller hadoop]# vim hdfs-site.xml fs.default.name hdfs://controller:9000 true hadoop.tmp.dir /usr/local/hadoop/tmp A base for other temporary directories 修改mapred-site.xml[root@controller hadoop]# vim mapred-site.xml dfs.name.dir /usr/local/hadoop/name true dfs.data.dir /usr/local/hadoop/data true dfs.replication 1 true 配置环境变量export HADOOP_INSTALL=/usr/local/hadoopexport PATH=$PATH:$HADOOP_INSTALL/bin export HADOOP_COMMON_LIB_NATIVE_DIR=/usr/local/hadoop/lib/native export HADOOP_OPTS=-Djava.library.path=/usr/local/hadoop/lib格式化hdsfhdfs namenode –format启动服务[root@controller hadoop]# /usr/local/hadoop/sbin/start-all.sh访问hadoop的管理界面: HDFS管理界面:http://xxxx:50070 MR管理界面:http://xxxx:8088 mapred.job.tracker 192.168.128.166:9001 true