有时候我们想到这样的功能: reducer能根据key(或value)值来输出多个文件,同一key(或value)处于同一个文件中。现在hadoop的0.17.x版本可以重写MultipleOutputFormat的generateFileNameForKeyValue就可以实现此功能。
比如:
package org.apache.hadoop.mapred.lib;
import java.io.IOException;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.io.Writabl ...
- 19:39
- 浏览 (179)
- 评论 (0)
- 分类: mapreduce¶llel
<!--
@page { size: 21cm 29.7cm; margin: 2cm }
P { margin-bottom: 0.21cm }
-->
/usr/lib/jvm/java-6-sun/bin/java
-Xmx1000m
-Dhadoop.log.dir=/home/hadoop01/hadoop/hadoop-0.14.3/logs
-Dhadoop.log.file=hadoop.log
-Dhadoop.home.dir=/home/hadoo ...
- 22:07
- 浏览 (425)
- 评论 (0)
- 分类: mapreduce¶llel
1. ssh
这东西连起来真麻烦, 比如有三台机器有10,20,30
要建ssh的有: 10->20,20->10, 10->30,30->10, 20->30, 30->20
最少要建连接数是一个排列数A(n, 2), 其中n代表节点数, 2代表任选两个节点. 3个节点得有A(3, 2) = 6.
2. 如果是用root用户, 则mpd.conf文件放在/etc下面,而不是.mpd.conf.其它用户是.mpd.conf
3. mp ...
- 15:19
- 浏览 (573)
- 评论 (0)
- 分类: mapreduce¶llel
- 浏览: 21368 次
- 性别:

- 来自: 广州

- 详细资料
搜索本博客
最新评论
-
lucene2.3.2与2.2.0建索 ...
泡坛看到有人说已经在这上面开发中文分词了吧?
-- by Arbow -
lucene2.3.2与2.2.0建索 ...
没有嘞,谢谢阿宝同学,哈哈~~ 这个看features貌似很牛的说。不过要用它还 ...
-- by coderplay -
lucene2.3.2与2.2.0建索 ...
aol同学有没有试用过 Sphinx 的索引?据说这个项目的性能比lucene高 ...
-- by Arbow -
ejabberd在linux平台的安 ...
# erl -pa /var/lib/ejabberd/ebin \ # ...
-- by wenew -
ejabberd在linux平台的安 ...
按照我的经历:outrace:需要修改你的hosts表试试。coderplay: ...
-- by eric.l






评论排行榜