千家信息网

Python从不同格式文件中加载数据的速度举例分析

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,这篇文章主要介绍"Python从不同格式文件中加载数据的速度举例分析",在日常操作中,相信很多人在Python从不同格式文件中加载数据的速度举例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的
千家信息网最后更新 2025年01月23日Python从不同格式文件中加载数据的速度举例分析

这篇文章主要介绍"Python从不同格式文件中加载数据的速度举例分析",在日常操作中,相信很多人在Python从不同格式文件中加载数据的速度举例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Python从不同格式文件中加载数据的速度举例分析"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

熟悉Python数据分析和跟各种数据存储文件打交道的人可能都知道,就算是相同的数据内容,但用Python从不同格式的载体中读取数据的速度是不一样的。为了验证这一结论,我特意测试了一下,分别用Python从Excel,MySQL和CSV中读取数据的效率。

工具:

jupyter notebook(Python),

Navicat(MySQL),

Microsoft Excel 2016

CSV(Excel按F12另存为)

接着进入正题,以下就是我的测试结果:

声明:使用的都是同一份数据源(除去表头,总共有159727条数据)!

直接用Python从Excel加载数据(29M),第1次花了48秒,第2次花46.1秒;另外,计算结果只需花费几十到几百毫秒;

处理数据的时间,花了几十到几百毫秒不等:

把Excel的数据(29M)导入到Navicat(可以写MySQL语句的一款编辑器)中,花了28.9秒;

处理数据的时间,花了0.134s

用Python直接从MySQL中获取刚才从Excel中导入的数据,第1次花了1.91秒,第2次花了2.01秒,第3次花了1.99秒,第4次花了1.79秒;

处理数据的时间,花了59ms.

用Python读取把刚才29M的Excel,另存为一个32.1M大小的CSV文件(数据内容相同),才试了一次,居然只花了1.3秒(瞬开!惊奇!)

处理数据的时间,花了19ms

到此,关于"Python从不同格式文件中加载数据的速度举例分析"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

0