hadoop mapreduce求平均分

原创: 2016-06-07 14:58:43 1891浏览

hadoop mapreduce求平均分求平均分的关键在于，利用mapreduce过程中，一个key聚合在一起，输送到一个reduce的特性。假设三门课的成绩如下： china.txt [plain] 张三 78 李四 89 王五 96 赵六 67 english.txt [plain] 张三 80 李四 82 王五 84 赵六 86 math

求平均分的关键在于，利用mapreduce过程中，一个key聚合在一起，输送到一个reduce的特性。

假设三门课的成绩如下：

china.txt

[plain]

张三 78

李四 89

王五 96

赵六 67

english.txt

[plain]

张三 80

李四 82

王五 84

赵六 86

math.txt

[plain]

张三 88

李四 99

王五 66

赵六 72

mapreduce如下：

[plain]

public static class Map extends Mapper {

// 实现map函数

public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

// 将输入的纯文本文件的数据转化成String

String line = value.toString();

// 将输入的数据首先按行进行分割

StringTokenizer tokenizerArticle = new StringTokenizer(line, "\n");

// 分别对每一行进行处理

while (tokenizerArticle.hasMoreElements()) {

// 每行按空格划分

StringTokenizer tokenizerLine = new StringTokenizer(tokenizerArticle.nextToken());

String strName = tokenizerLine.nextToken();// 学生姓名部分

String strScore = tokenizerLine.nextToken();// 成绩部分

Text name = new Text(strName);

int scoreInt = Integer.parseInt(strScore);

// 输出姓名和成绩

context.write(name, new IntWritable(scoreInt));

}

public static class Reduce extends Reducer {

// 实现reduce函数

public void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {

int sum = 0;

int count = 0;

Iterator iterator = values.iterator();

while (iterator.hasNext()) {

sum += iterator.next().get();// 计算总分

count++;// 统计总的科目数

}

int average = (int) sum / count;// 计算平均成绩

context.write(key, new IntWritable(average));

}

输出如下：

[plain]

张三 82

李四 90

王五 82

赵六 75

hadoop mapreduce 平均分 hadoop ma PHP课程 HTML视频教程 CSS视频 JS视频教程 Vue视频教程

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn核实处理。

上一条：hadoop mapreduce数据排序下一条：mongodb过滤查询键值

查看更多

热门课程

Laravel 9 学习正当时—保姆级教程，想学不会都难！

￥229
￥279

已抢66547个
抢
前端基础到实战（HTML5+CSS3+ES6+NPM）

￥800
￥1200

已抢37558个
抢
PHP基础到实战（PHP+MySQL）

￥800
￥1200

已抢20813个
抢
PHP入门到实战消息队列RabbitMQ

￥59
￥99

已抢2570个
抢
在线商城系统开发（Laravel实战五）

￥159
￥299

已抢19126个
抢

打开APP，随时随地在线学习！

hadoop mapreduce求平均分

相关文章

￥229

￥800

￥800

￥59

￥159