用mapreduce的方法在hadoop平台上,在数据文件中筛选出广东省2007年-2017年中,每一年发电量最高的月份的发电量
/usr/local/hadoop/sbin/start-dfs.sh
/usr/local/hadoop/sbin/start-yarn.sh
jps
/usr/local/hadoop/bin/hdfs dfs -mkdir /MaxEleInput
/usr/local/hadoop/bin/hdfs dfs -put GenerateEleData.txt /MaxEleInput(在Generation.txt所在目录下)
/usr/local/hadoop/bin/hadoop jar MaxEle /MaxEleInput /MaxEleOutput(在jar包所在目录下)
/usr/local/hadoop/bin/hdfs dfs -cat /MaxEleOutput/*
浏览器进入http://192.168.142.128:50070/explorer.html#/output 可以查看文件(50070前的地址为master的ip地址)
http://data.stats.gov.cn/easyquery.htm?cn=E0101
《Hadoop权威指南》