千家信息网

怎么利用Kettle转储接口数据

发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,这篇文章主要介绍"怎么利用Kettle转储接口数据",在日常操作中,相信很多人在怎么利用Kettle转储接口数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"怎么利用K
千家信息网最后更新 2025年01月31日怎么利用Kettle转储接口数据

这篇文章主要介绍"怎么利用Kettle转储接口数据",在日常操作中,相信很多人在怎么利用Kettle转储接口数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"怎么利用Kettle转储接口数据"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

利用Kettle转储接口数据

1. 项目背景

1.1. 项目背景

数据接口

API:应用程序接口(Application Program Interface)的简称,是实现计算机软件之间数据通信的工具。同时API也是一种中间件,为各个平台提供数据共享。在大数据与物联网发展的背景下,目前有大量的数据接口被提供或发掘出来,提供给开发者使用,应用到生活中的每一个细节中。本文旨在阐述kettle对于数据接口的监控、调用及其转储,更多详细的数据接口内容不在此具体说明。

项目背景

本文旨在提供一种方法,以帮助同学们掌握Kettle对于数据接口的调用与转储,Kettle的配置方法和组件的使用具有多样性,需要大家多多思考与发掘。

2. Kettle配置

本文使用的是Kettle 7.0版本,调用的接口为百度开发平台-百度地图API,返回数据集为JSON格式或者XML格式,本次使用了两种方式来存储数据,一种是导出成EXCEL,一种是导出到关系数据库进行存储。

2.1. Kettle转换的配置

总览

总览

校验接口信息

我们首先拿到WebAPI的地址,测试连接的畅通,这里我使用了百度地图的Place Suggestion API,输入城市需要检索的地点,返回建议值,效果如下:

http://api.map.baidu.com/place/v2/suggestion?query=%E6%98%A5%E7%86%99%E8%B7%AF®ion=%E6%88%90%E9%83%BD%E5%B8%82&output=json&ak=n0lHarpY3QZx6xXXIaWMFLxj

这里我们测试接口URL的连通性。

这里我的接口是没有校验身份的,只需要输入申请的AK就可以了。测试成功,返回的值为JSON字符串的格式。

接口信息接入

新建一个转换,接口信息接入可以选择EXCEL接入,文本接入,生成记录,或者表输入都行,视自己的情况而定,我这里因为只是测试,选用了生成记录,并且参数值固定死,后期可以使用"${}"将参数替换出来。

利用HTTP客户端解析数据

添加HttpClient组件,我们需要用到它作为客户端来解析API,类似浏览器。

这里的URL地址我们选择从前面的生成记录里面获取。注意字符集的设置,否则后面获取到的接口数据会是乱码。

判断是否获取到数据

这里添加过滤记录组件,用来判断是否成功从HTTP客户端获取到数据

解析JSON串

添加JSON输入组件,这里从流中获取到从API上获取的结果作为源字段。

将JSON串解析成多个字段的形式,具体路径需要自己先在过一下JSON串的格式,提前掌握这些信息。

嵌套循环解析JSON串

我们此次使用的JSON串,实际需要的数据实际是在其内曾的RESULT字段里面嵌套的JSON串里,所以我们需要再对RESULT字段进行解析。

输出数据

我们这里使用了EXCEL输出的方法,EXCEL输出没有特别需要强调的地方,主要需要注意的就是在这里我们只输出需要的内部的地址信息,因为其他字段在流中也会继承下来,这里合理选择输出的字段即可。

错误处理

错误处理一般来说都只是进行记录,或者写入日志,或者写入日志表,或者发送报错信息邮件到管理员邮箱。

这里不做具体讲解,具体的选择方案看项目需求而定。

运行结果

F9可执行改转换,转换没有错误的话则进入上面一条线,并且输出为EXCEL表格。

EXCEL展开如下图:

3. 其他

本附件列出了一些配置过程中可能与遇到的一些问题以及解决方案。

3.1. 常见错误信息

在实验过程中遇到一些错误在所难免,我这里提供了一些容易遇到的错误,给大家参考参考思路。

中文乱码

解决方案:在使用HTTP客户端接入的时候,需要正确选择字符集,一般使用UTF-8是没错的,它能够兼容大部分字符。在进行文本文件输出的时候,需要正确选择输出的格式,尽量不在这一步做编码转换。

API接口无效

解决方案:在解析API接口URL路径时,难免参数会带上中文汉字,这里的汉字需要提前做好转码,这里教大家一个小技巧,使用Chome浏览器,把URL链接粘贴进去,浏览器会自动帮我们把编码进行转换。此时,再把URL地址粘贴出来即可。

到此,关于"怎么利用Kettle转储接口数据"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

数据 接口 输出 信息 字段 错误 选择 格式 接入 地址 字符 客户 客户端 方案 方法 组件 背景 项目 学习 测试 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 搭梯子哪家服务器 个人服务器都能干什么 网络技术部的日常工作 自己租服务器开传奇最详细 中仁软件开发有限公司 Bios查看服务器管理ip 常德软件开发培训去哪好 腾讯云服务器怎么打开虚拟键盘 温岭天气预报软件开发 下列哪些属于网络安全的内容 歌尔软件开发岗面试题 服务器更新换代的速度 钓鱼网络安全新闻 计算机网络技术基础答案张博 高等数学答案软件开发 网络技术培训计划 网络安全 整改通知书 上海 嵌入式软件开发公司 代县网络安全宣传周活动 网络安全指数股票名单一览表 国家网络安全手抄报高中大全 网络安全与攻防试题及答案 公安dna数据库比对要多长时间 网络安全责任落实和考核层层签定 厂家信誉好的数据库培训 长宁区第三方软件开发客户至上 商城数据库建表 所有人都用管理员登录服务器 海南互联网软件开发创新服务 java操作数据库的方式
0