千家信息网

导入大量数据,比如300G数据,导出500G数据需要考虑的问题

发表于:2025-01-20 作者:千家信息网编辑
千家信息网最后更新 2025年01月20日,1.假设导入到99%,你花了8个小时,但是最后,你设置表空间数据不够,导入报错,怎么办?这次导入会不会报错?会不会回滚?空间不够,是致命错误。会回滚。但是有个参数,resumable,resumabl
千家信息网最后更新 2025年01月20日导入大量数据,比如300G数据,导出500G数据需要考虑的问题1.假设导入到99%,你花了8个小时,但是最后,你设置表空间数据不够,导入报错,怎么办?
这次导入会不会报错?会不会回滚?
空间不够,是致命错误。会回滚。但是有个参数,resumable,resumable=y resumable_timeout=28800允许我们挂起,等待一段时间。


2.导入大量数据,花的时间很长。我们要知道,进度是怎么样了?是否挂起?是否仍在导入?
第一,设置响应参数feedback=10000000,第二,看插入日志
第三,看资源管理器中相关进程cpu,硬盘是否在使用 ,第四 看写入文件是否有变化
第五,最好的方式是看会话v$session中有个sql_id,这个字段就是记录了当前会话正在进行执行什么sql语句。
3.怎么样导入更快?
设置表nologging.直接路径导入。暂时不导入索引。
insert /*+append*/ into card_trade_detail

4.切割大文件的操作。大文件比如300G,你会遇到这样一些问题,比如,你拷贝一个300G文件从硬盘到移动硬盘,刚开始很快,600M/s,到后面变成30M/s,头疼吧。这样我们导出的时候需要进行文件切割。把大文件切割成小分件,比如切割成5G拷贝,也很慢。




5.以下是一些经验数据
(1)486万 225秒,每个segment 840M 451万:49秒 497万:53 一年的数据文件434G
当前数据量是1.1亿,创建索引为:
create index idx_ctd_card_inner_no_gl on CARD_TRADE_DETAIL(card_inner_no) global tablespace cardidx01;
花去时间为:369秒,索引大小是4G .
(2)1.1亿数据索引 uk_ctd_gl_1 7个字段建立唯一索引,花去时间为253秒,索引大小为6.8G
(3)18亿数据索引 uk_ctd_gl_1 7个字段建立主键索引,索引大小为144G;
(4)导入300G数据,在dellr730机器上上插入花时8个小时。
在dellr730机器,18亿数据索引 uk_ctd_gl_1 7个字段建立主键索引,索引大小为112G,建立52分钟。
(5)最后我说下其中比较坑爹的一次部署:把18亿500G数据导出来,花时40分钟。把225G数据导出到优盘,时间是5小时。从优盘拷贝到客户电脑中转机1小时。从中转机拷贝到aix系统,6小时。导入数据时间是5小时。
数据 索引 文件 小时 时间 大小 字段 拷贝 硬盘 不够 优盘 参数 机器 空间 转机 问题 上上 头疼 从中 客户 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 it算不算数据库相关工作 php 数据库 最大值 软件开发工程师学习中心 什么叫数据库实例 战地一卡在服务器以满 科迅软件开发有限公司 设计一个土木工程数据库 学网络技术被骗了怎么办 java上传图片到服务器流程 互联网金融软件开发最新消息 用自己的电脑做文件下载服务器 中央网络安全和信息化的职责包括 福建省政府网络安全管理办法 天津市服务器采购信息虚拟主机 柠源低配服务器 敏捷软件开发方式xp 教师编制服务器未满可以再考编吗 国内数据库企业 虚拟化网络安全审计 美寓互联网科技 数据库管理技术经过了几个阶段 网络安全内容怎么写的又简单 六界召唤师百度服务器 腾讯云应用服务器是什么 中国最大数据库排名 大渡口区工商软件开发服务特点 怀旧服tbc单独服务器 迪茉互联网科技有限公司 无线路由器软件开发做什么 1328485网络安全建议有
0