互联网科技列表
-
hadoop+spark+scala环境--单实例版
hadoop+spark环境--单实例版1、修改主机名及关系映射2、关闭防火墙并创建文件夹mkdir /hadoop/tmpmkdir /hadoop/dfs/namemkdir /hadoop/df
2022-06-03 文件 环境 配置 主机 实例 成功 内存 名称 文件夹 浏览器 界面 防火墙 浏览 输入 运行 防火 验证 -
正则表达式中\{\} --匹配模式出现的次数
正则表达式:\{\} 匹配字符出现的次数使用*可匹配所有匹配结果人一次,但如果只要制定次数,就应该使用\{\},此模式有三种形式。pattern\{n\} 匹配模式出现n次pattern\{n,\}
2022-06-03 模式 次数 正则 表达式 元字符 三种形式 之间 单个 多种 字符 整数 时候 结果 别为 混合 -
大数据的类型
"数据"被定义为"由计算机执行操作的数量,字符或符号,其可以以电信号的形式存储和传输并记录在磁,光或机械记录介质上",作为快速谷歌搜索会显示。大数据的概念并不复杂; 顾名思义,"大数据"指的是大量数据
2022-06-03 数据 结构 结构化 分析 生成 处理 存储 公司 机器 个人 传统 数据分析 数据库 计算机 增长 帮助 移动 巨大 适当 人工 -
python统计文本中的单词数和print的两种写法
#!/usr/bin/python# - * - coding: utf-8 - * -#作用,分别计算每个文本的单词数,并且输出所有文本的单词总数a = []sum = 0def count_wor
2022-06-03 单词 参数 写法 文本 总数 逗号 作用 函数 就是 utf-8 输出 统计 -
数据标注行业知多少
据相关资料显示,在中国,有10万的全职数据标注员,100万的兼职数据标注员。看到这个数据,不禁想问数据标注到底是一个怎样的行业?其实早在1998年第一家标注公司成立的时候,该行业就已经出现,只是那时人
2022-06-03 数据 行业 人工 人工智能 智能 价值 机器 公司 应用 一家 人类 企业 更多 需求 学习 工作 与日俱增 不可或缺 不断 不禁 -
系统质量之保障 运维外包不可少
在前面的文章中,我们了解了IT运维外包的概念,本文主要介绍IT运维外包在软件质量保障中的重要作用,希望能给大家带来帮助。 在竞争日益激烈的今天,企业发展主要取决于核心业务的成败,将非核心业务外包给最擅
2022-06-03 企业 系统 服务 公司 专业 技术 管理 工作 人员 客户 硬件 维护服务 信息 价格 成本 电脑 业务 问题 就是 费用 -
SparkSQL的3种Join实现
引言Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。对于Spark来说有3中Join
2022-06-03 数据 广播 相同 两个 内存 算法 一侧 节点 阶段 分布式 资源 原理 场景 方案 条件 维度 选择 不同 较大 事实 -
Badboy自动化测试工具9 查看回放结果
在运行脚本时,Badboy提供了Summary功能方便我们监控回放结果状态,如下Summary view:以下表格对运行情况的各个维度进行解释:统计点描述Played运行或回放脚本的次数Succeed
2022-06-03 脚本 运行 次数 个子 情况 时间 问题 结果 最长 成功 功能 只是 同时 所属 标题 状态 站点 维度 表单 表格 -
hive的视图
创建视图:create view view_piaofang as select * from t_name;查看视图 :show tables; #既有表又有视图show views #只查看视图查
2022-06-03 视图 支持 查询 信息 只是 方式 时候 语句 逻辑 -
linux安装hadoop之安装jdk
在centos上安装jdk.1、去官网下载安装包。我这里是jdk-7u79-linux-x64.rpm。2、在centos建立usr/java目录。只需要在usr下mkdir java 即可。3、上传
2022-06-03 不用 变量 命令 文件 版本 环境 目录 结果 配置 之安 -
大数据技术学习路线,该怎么学?
如果你看完有信心能坚持学习的话,那就当下开始行动吧!一、大数据技术基础1、linux操作基础linux系统简介与安装linux常用命令-文件操作linux常用命令-用户管理与权限linux常用命令-系
2022-06-03 分析 算法 数据 案例 源码 编程 实战 应用 学习 机制 常用 集群 分类 原理 命令 流程 过程 函数 框架 简介 -
hbase数据写入流程深度解析
2019/3/28 星期四hbase数据写入流程深度解析在看此链接之前,可以写查看 hbase读写请求详细解释 中的写请求流程 https://blog.51cto.com/12445535/2356
2022-06-03 数据 缓存 更新 日志 流程 客户 性能 服务 机制 等级 保证 事务 客户端 线程 文件 服务器 内存 可以通过 大小 用户 -
一、配置GO环境及安装IDE
一、环境准备操作系统:Ubuntu 16.04版本GO版本:1.9.2获取Go安装包$ wget https://www.golangtc.com/static/go/1.9.2/go1.9.2.li
2022-06-03 配置 环境 目录 变量 版本 程序 操作系统 三个 二进制 代码 入口 函数 文件 源代码 系统 经典 准备 -
java实现AES方式加密
import javax.crypto.BadPaddingException;import javax.crypto.Cipher;import javax.crypto.IllegalBlockS
2022-06-03 加密 密钥 编码 方式 数据 模式 算法 张三 北京 北京市 UTF-8 工作 生成 统一 -
Java 嵌入 SPL 轻松实现 Excel 文件合并
大多数JAVA程序猿都选择使用POI或者HSSFWorkbook等第三方类库来实现Excel自动化合并,这样一来不仅需要噼里啪啦的敲好多代码,费事费力,而且用起来灵活度也不高,对Excel的格式要求也
2022-06-03 数据 文件 分组 脚本 字段 工作 结果 多个 处理 代码 例子 效果 循环 统计 过程 内存 函数 序列 方式 销售 -
Ribbon之IRule
IRule是选择服务的一种策略。IRulepublic interface IRule{ /* * choose one alive server from lb.allServers
2022-06-03 服务 实例 选择 权重 时间 方式 方法 核心 计数器 重要 安全 不大 也就是 代码 任务 基础 就是 性能 时候 机制 -
开发人员学Linux(14):CentOS7安装配置大数据平台Hadoop2.9.0
1.前言"大云物移"是当年很火热的一个话题,分别指大数据、云计算、物联网和移动互联网,其中大数据领域谈论得多就是Hadoop。当然Hadoop不代表大数据,而是大数据处理领域的一个比较有名的开源框架而
2022-06-03 文件 命令 目录 配置 用户 数据 登录 环境 输入 内容 系统 运行 变量 密码 交互式 程序 信息 情况 服务 可以通过 -
Hadoop运维记录系列(二十五)
耗时很长时间解决了一个spark in docker的问题,记录一下。这是个非常奇怪的问题,找遍谷歌都找不到答案,与其说是分析出来倒不如说是偶然发现。先介绍一下架构和环境。Z机器是docker的宿主机
2022-06-03 机器 问题 集群 环境 阶段 检查 主机 任务 公网 作业 分析 变量 域名 方式 端口 网络 错误 不同 就是 文件 -
让VS总是编译某个文件
如果想让程序总是能显示构建的时间,通常使用如下方法:const char* LBuildStamp::getBuildDateTime(){return __DATE__ " " __TIME__;}
2022-06-03 文件 编译 方法 时间 不够 再次 只是 源文件 程序 编译器 上一 生成 -
WebStorm 常用功能的使用技巧分享
代码编辑代码跳转: Ctrl + 左键 或者 Ctrl + B,可以跳转到函数或者变量的声明位置调用位置: Alt + F7,查找调用者自动补全: 最好是修改一下响应时间,Settings->Edit
2022-06-03 代码 函数 文件 快捷键 位置 变量 工具 抽取 主流 脚本 静态 控制 检查 测试 功能 内存 包裹 参数 同时 工程