Storm怎么写一个爬虫
发表于:2024-11-19 作者:千家信息网编辑
千家信息网最后更新 2024年11月19日,这篇文章主要讲解了"Storm怎么写一个爬虫",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Storm怎么写一个爬虫"吧!package com.dig
千家信息网最后更新 2024年11月19日Storm怎么写一个爬虫
这篇文章主要讲解了"Storm怎么写一个爬虫",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Storm怎么写一个爬虫"吧!
package com.digitalpebble.storm.crawler.bolt.indexing;import java.util.Map;import org.slf4j.LoggerFactory;import backtype.storm.task.OutputCollector;import backtype.storm.task.TopologyContext;import backtype.storm.topology.OutputFieldsDeclarer;import backtype.storm.topology.base.BaseRichBolt;import backtype.storm.tuple.Tuple;import com.digitalpebble.storm.crawler.StormConfiguration;import com.digitalpebble.storm.crawler.util.Configuration;/** * A generic bolt for indexing documents which determines which endpoint to use * based on the configuration and delegates the indexing to it. ***/@SuppressWarnings("serial")public class IndexerBolt extends BaseRichBolt { private Configuration config; private BaseRichBolt endpoint; private static final org.slf4j.Logger LOG = LoggerFactory .getLogger(IndexerBolt.class); public void prepare(Map conf, TopologyContext context, OutputCollector collector) { config = StormConfiguration.create(); // get the implementation to use // and instanciate it String className = config.get("stormcrawler.indexer.class"); if (className == null) { throw new RuntimeException("No configuration found for indexing"); } try { final ClassimplClass = (Class ) Class .forName(className); endpoint = implClass.newInstance(); } catch (final Exception e) { throw new RuntimeException("Couldn't create " + className, e); } if (endpoint != null) endpoint.prepare(conf, context, collector); } public void execute(Tuple tuple) { if (endpoint != null) endpoint.execute(tuple); } public void declareOutputFields(OutputFieldsDeclarer declarer) { if (endpoint != null) endpoint.declareOutputFields(declarer); }}
感谢各位的阅读,以上就是"Storm怎么写一个爬虫"的内容了,经过本文的学习后,相信大家对Storm怎么写一个爬虫这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
爬虫
学习
内容
就是
思路
情况
文章
更多
知识
知识点
篇文章
跟着
问题
实践
推送
研究
验证
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
语音软件开发书籍
大连威思网络技术有限公司
移动办公应用网络安全域
怎么换dns服务器
vba 连接服务器mysql
svn服务器的搭建与管理
萌站服务器负荷较大需要暂时排队
软件开发规范类建设
服务器1tb硬盘价格
互联网科技公司宣传页介绍
惠普 服务器 官网
张湾区服务软件开发学习
服务器网络类型
公众号服务器
dnf喇叭和服务器有什么区别
哪个云服务器最便宜
分析电子商务网络技术的应用
网络技术课后总结
华为5g网络技术是什么
c语言怎样输入很多行数据库
网络安全法规定些什么
kk战队网络安全
软件开发与大数据创新
安师大网络安全实验室
本机svn服务器管理文档
HROSaaS软件开发商
上海健康云用的哪家服务器
服务器R5300g4
浙江图书馆显示服务器忙怎么办
某软件开发项目的实际进度