互联网科技列表
-
Hive初识
Hive产生背景:在给大家讲解Hive之前,我们要先熟悉下Hadoop的一些概念。Hadoop可以分为一下几个部分 HDFS hadoop的文件系统,用于数据存储 MapReduce 用于
2022-06-02 数据 处理 程序 工具 就是 成绩 数学 数据处理 方式 架构 语句 语文 存储 查询 最高 公司 只是 基础 文件 日志 -
性能测试分类
注意,以下分类从实际工作中的角度进行划分,没有对错之分。1. 基准测试一般为单用户测试,或者零数据量环境下的测试。目的是建立一个可度量的参考标准,为其他测试场景或者调优过程提供对比参考。也可认为是最基
2022-06-02 测试 压力 性能 基准 拐点 系统 问题 内存 场景 实际 指标 过程 参考 运行 验证 分类 平稳 明显 最大 必要 -
NEXT 2019:Hitachi Vantara的一场数据价值宣言
Hitachi Vantara是一家为数据价值而生的公司。如果说2017年Hitachi Data System、Pentaho、Hitachi Insight Group三家公司的合并,标志着Hit
2022-06-02 数据 服务 产品 用户 价值 管理 帮助 能力 边缘 中国 分析 大会 数字 混合 市场 数据中心 方案 架构 环境 解决方案 -
ActiveMQ 配置以及部署
安装包下载http://activemq.apache.org/activemq-5154-release.htmlJAVA环境变量配置1)我的电脑点击右键,然后选择属性,进入之后选择高级系统设置,然
2022-06-02 变量 密码 用户 用户名 环境 系统 登陆 输入 选择 代表 内容 属性 文件 量值 配置 高级 可以通过 对话框 按钮 控制台 -
Zabbix企业级分布式监控系统第2版即将出版
经过近一年的写作,博主的Zabbix第二本书籍也写完,目前在出版社编辑中,全书的目录结构如图所示。
2022-06-02 出版 书籍 全书 出版社 目录 结构 如图 企业 分布式 监控系统 系统 监控 -
Spark SQL 测试JoinType中所有join的类型,便于理解
准备 测试数据trade订单号 卖家 买家 买家城市1 A 小王 北京2 B 小李 天津3 A 小刘 北京order所属订单号 买家 商品名称 价格 发货时间1 小王
2022-06-02 小王 北京 小李 天津 冰箱 电视 空调 小刘 买家 类型 交集 等价 订单 订单号 部分 测试 价格 卖家 名称 商品 -
Storm容错机制Acker详解和实战案例
Storm中有个特殊的Executor叫acker,他们负责跟踪spout发出的每一个Tuple的Tuple树。当acker发现一个Tuple树已经处理完成了,它会告诉框架回调Spout的ack(),
2022-06-02 次数 跟踪 函数 参数 框架 存储 实战 案例 特殊 安全 恒定 遗憾 代码 动作 字节 手工 教程 更多 算法 线程 -
flink sql-clent MATCH_RECOGNIZE kafka 例子
环境 flink1.7.2增加flink1.7.2 的lib 中的jar, 否则会报类找不到avro-1.8.2.jar flink-connector-kafka-0.10_2
2022-06-02 不用 代码 大功告成 大功 环境 程序 会报 运行 例子 -
python logging模块打印log到指定文件
可能我们经常会使用print来输出信息到窗口,但当我们有很多个py文件需要运行,项目比较庞大的到时候,print简直就是太low了点了。那么我们可以使用强大的logging模块,把输出到指定的本地pc
2022-06-02 信息 这是 输出 文件 级别 运行 日志 优先级 文件名 文档 格式 程序 代表 内容 时间 路径 模块 强大 相同 到时候 -
动态发布接口
动态发布接口HTTP接口分为REST和SOAP2种方式,文中都涉及到,包含从动态生成文件到编译class再到装载到spring容器和ws.Endpoint中。REST风格方案:1.提供java文件模板
2022-06-02 文件 动态 接口 生成 编译 模板 内容 错误 容器 对象 目录 编码 范例 业务 公司 内存 方案 方法 机密 结果 -
FastDFS 安装部署
##FastDFS Github地址:https://github.com/happyfish200/fastdfs#FastDFS 简介:http://www.oschina.net/p/fastd
2022-06-02 文件 地址 分布式 架构 主机 同时 备份 客户 客户端 拓扑 拓扑图 状态 目录 简介 系统 软件 软件下载 逻辑 面的 三台 -
Spark基础
官方文档:spark.apache.org/docs/latestSpark背景MapReduce局限性:1>) 繁杂map/reduce (mapjoin没有reduce)low_levelcons
2022-06-02 源码 编译 测试 配置 版本 环境 脚本 仓库 代码 数据 文档 目录 软件 处理 排序 繁杂 各自为战 位置 参数 地址 -
亿级 Elasticsearch 性能优化
前言最近一年使用 Elasticsearch 完成亿级别日志搜索平台「ELK」,亿级别的分布式跟踪系统。在设计这些系统的过程中,底层都是采用 Elasticsearch 来做数据的存储,并且数据量都超
2022-06-02 数据 查询 内存 系统 索引 搜索 性能 节点 时候 副本 同时 指针 过程 功能 大小 效率 文档 分配 分布式 级别 -
深度解析数据挖掘关联规则Apriori算法
01、关联规则挖掘背景和基本概念如下所示的数据集,表中的每一行代表一次购买清单,注意我们只关心记录出现与否,不关心某条记录购买了几次,如购买十盒牛奶也只计一次。数据记录的所有项的集合称为总项集,上表中
2022-06-02 频繁 规则 关联 算法 啤酒 数据 尿布 支持 生成 条件 牛奶 个数 时间 次数 组合 高级 同时 定律 就是 选集 -
通过一张图说说测试职业如何发展(一)
前段时间应同事相邀,给目前在读的学员做了一次软件测试职业发展的沙龙座谈。当时为了准备素材,做了一张图,在这里也分享给大家。下面进入看图说话模式~~ 一般来说,测试的职业发展方向可以粗分为两个,一个是技
2022-06-02 方向 技术 测试 管理 职业 发展 不同 细腻 过硬 寂寞 枯燥 一言以蔽之 一般来说 两个 个人 代码 功底 发展方向 同事 学员 -
笔记-----配置NAT静态IP
hadoop---------------------1、可靠、可伸缩、分布式的计算框架,开源软件四大模块1、commonhadoop0-common2、hdfs3、mapreduce4、yarn--
2022-06-02 网关 静态 配置 网段 分布式 大小 客户 客户机 文本 模式 网卡 网络 脚本 菜单 命令 地址 文件 框架 桌面 模块 -
Impala隐藏的惊天秘密
元数据作为大数据的源泉,有着非常重要的作用。可在Impala中却隐藏着一个秘密?和元数据有着颇深的渊源,我们一起来追溯!一、Impala体系结构(1)每个slave节点运行一个Impala进程,和HD
2022-06-02 数据 缓存 进程 查询 节点 时候 不同 作用 客户 客户端 更新 服务 运行 秘密 重要 两个 体系 体系结构 信息 公众 -
hive表开启lastAccessTime参数
1.hive-site.xml 的 Hive 服务高级配置代码段(安全阀)中添加2个参数:hive.security.authorization.sqlstd.confwhitelist=hive.e
2022-06-02 参数 高级 安全 代码 安全阀 服务 配置 -
GPS 、AGPS、LBS、WiFi定位及测试方法
一、关键知识1、GPS是可以独立存在的,不依靠网络;2、AGPS必须依赖GPS,如果GPS不能正常工作,AGPS无从谈起;3、AGPS可以理解成是一个辅助工具,在GPS的基础上才有用,可用可不用,就像
2022-06-02 定位 手机 地图 浏览器 页面 浏览 登陆 就是 数据 测试 卫星 网络 再次 地址 机器 热点 十来 工作 方法 不行 -
selenium无法调用chrome或者firefox的原因
现在我们用的开源工具一般为selenium,当然其中的好处是可以调用不同的浏览器。包含了ie\google\firefox等等,但调用的时候会出现无法调用其浏览器。原因很简单,selenium和其浏览
2022-06-02 浏览器 浏览 情况 版本 问题 提示 错误 原因 不同 可以通过 好处 工具 按钮 文件 文件夹 方式 时候 目标 网站 升级