千家信息网

flume的几种使用方式

发表于:2024-10-20 作者:千家信息网编辑
千家信息网最后更新 2024年10月20日,近期,听了王家林老师的2016年大数据Spark"蘑菇云"行动,需要将flume,kafka和Spark streaming进行整合。感觉一时难以上手,先从简单着手吧:一、netcat方式+Logge
千家信息网最后更新 2024年10月20日flume的几种使用方式

近期,听了王家林老师的2016年大数据Spark"蘑菇云"行动,需要将flume,kafka和Spark streaming进行整合。感觉一时难以上手,先从简单着手吧:


一、netcat方式+Logger日志显示


Flume 配置文件如下:

# example.conf: A single-node Flume configuration# Name the components on this agenta1.sources = r1a1.sinks = k1a1.channels = c1# Describe/configure the sourcea1.sources.r1.type = netcata1.sources.r1.bind = localhosta1.sources.r1.port = 44444# Describe the sinka1.sinks.k1.type = logger# Use a channel which buffers events in memorya1.channels.c1.type = memorya1.channels.c1.capacity = 1000a1.channels.c1.transactionCapacity = 100# Bind the source and sink to the channela1.sources.r1.channels = c1a1.sinks.k1.channel = c1

flume的启动:

$ bin/flume-ng agent --conf conf --conf-file example.conf --name a1 -Dflume.root.logger=INFO,console

触发数据:

telnet localhost 44444

会在flume的控制台出现同样的字符。


二、flume级联方式

通过avro,在两台机器间传送数据,源头为netcat


0