导航：首页 > 互联网科技 >

如何利用MapReduce分析明星微博数据

发表于：2025-02-09 作者：千家信息网编辑

千家信息网最后更新 2025年02月09日，这篇文章主要介绍了如何利用MapReduce分析明星微博数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。1、项目需求自定义输入格式，

千家信息网最后更新 2025年02月09日如何利用MapReduce分析明星微博数据

这篇文章主要介绍了如何利用MapReduce分析明星微博数据，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

1、项目需求

自定义输入格式，将明星微博数据排序后按粉丝数关注数微博数分别输出到不同文件中。

2、数据集

明星明星微博名称粉丝数关注数微博数

俞灏明俞灏明 10591367 206 558

李敏镐李敏镐 22898071 11 268

林心如林心如 57488649 214 5940

黄晓明黄晓明 22616497 506 2011

张靓颖张靓颖 27878708 238 3846

李娜李娜 23309493 81 631

徐小平徐小平 11659926 1929 13795

唐嫣唐嫣 24301532 200 2391

有斐君有斐君 8779383 577 4251

3、分析

自定义InputFormat读取明星微博数据，通过自定义getSortedHashtableByValue方法分别对明星的fan、followers、microblogs数据进行排序，然后利用MultipleOutputs输出不同项到不同的文件中

4、实现

1）、定义WeiBo实体类，实现WritableComparable接口

package com.buaa;  import java.io.DataInput; import java.io.DataOutput; import java.io.IOException;  import org.apache.hadoop.io.WritableComparable;  /**  * @ProjectName MicroblogStar * @PackageName com.buaa * @ClassName WeiBo * @Description TODO * @Author 刘吉超 * @Date 2016-05-07 14:54:29 */ public class WeiBo implements WritableComparable

千家信息网

千家信息网

如何利用MapReduce分析明星微博数据

looks调色插件Magic Bullet Looks for Mac

Aurora HDR 2019 for mac有哪些改进

相关文章