千家信息网

大数据主要学习什么?

发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,学习大数据需要的基础1、java SE、EE(SSM)90%的大数据框架都是Java写的2、MySQLSQL on Hadoop3、Linux大数据的框架安装在Linux操作系统上需要学什么.在入门学
千家信息网最后更新 2025年02月23日大数据主要学习什么?

学习大数据需要的基础

1、java SE、EE(SSM)

90%的大数据框架都是Java写的

2、MySQL

SQL on Hadoop

3、Linux

大数据的框架安装在Linux操作系统上

  • 需要学什么

.在入门学习大数据的过程当中有遇见学习,行业,缺乏系统学习路线,系统学习规划,欢迎你加入我的大数据学习交流裙:251956502 ,裙文件有我这几年整理的大数据学习手册,开发工具,PDF文档书籍,你可以自行下载。

大数据离线分析

一般处理T+1数据(T:可能是1天、一周、一个月、一年)

a、Hadoop :一般不选用最新版本,踩坑难解决

(common、HDES、MapReduce、YARN)

环境搭建、处理数据的思想

b、Hive:大数据的数据仓库

通过写SQL对数据进行操作,类似于MySQL数据库的sql

c、HBase:基于HDFS的NOSQL数据库

面向列存储

d、协作框架:

sqoop(桥梁:HDFS《==》RDBMS)

flume:搜集日志文件中的信息

e、调度框架

anzkaban

了解:crotab(Linux自带)

zeus(Alibaba)

Oozie(cloudera)

f、前沿框架扩展:

kylin、impala、ElasticSearch(ES)

大数据实时分析

以spark框架为主

Scala:OOP(面向对象程序设计)+FP(函数是程序设计)

sparkCore:类比MapReduce

sparkSQL:类比hive

sparkStreaming:实时数据处理

kafka:消息队列

前沿框架扩展:flink

阿里巴巴:blink

大数据机器学习

spark MLlib:机器学习库

pyspark编程:Python和spark的结合

推荐系统

python数据分析

python机器学习


数据 学习 框架 系统 机器 分析 处理 大数 数据库 文件 程序 程序设计 设计 巴巴 操作系统 书籍 仓库 信息 函数 基础 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络技术支持中心解释 无锡市飞博网络技术有限公司 阿里云服务器设备管理器 计算机网络技术课本有哪些 虹口区网络技术开发服务报价表 滨州食品管理软件开发 网络安全事故的处置流程图 5g时代服务器要求 新科娘服务器 长宁区推广数据库系统研发职能 服务器监控平台系统 电脑文件服务器占主机内存吗 山西万美汇网络技术 压缩 虚拟主机 数据库 扬州江苏大容量服务器供应商家 网络安全的八大隐患 网络安全工程师报考年龄 游戏软件开发的市场背景 c 数据库 类型对应 青少网络安全注册解释pdf 2016网络安全和信息化工作 cmd怎么创建数据库 达软件开发 对网络安全建设的意见和建议 新乡网络安全培训中心 客户关系数据库是什么 阿里云如何导入数据库 魔兽世界赛季服务器机制 厦门柏科网络安全科技有限公司 855数据结构与数据库技术
0