如何进行Python 音频的数据扩充
发表于:2024-11-28 作者:千家信息网编辑
千家信息网最后更新 2024年11月28日,今天就跟大家聊聊有关如何进行Python 音频的数据扩充,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。经典的深度学习网络AlexNet使用数据
千家信息网最后更新 2024年11月28日如何进行Python 音频的数据扩充
今天就跟大家聊聊有关如何进行Python 音频的数据扩充,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,通过平移、 翻转、加噪等方法进行数据扩充。但是,在音频(Audio)领域中,如何进行数据扩充呢?
音频的数据扩充,主要有以下四种方式:
音频剪裁(Clip)
音频旋转(Roll)
音频调音(Tune)
音频加噪(Noise)
音频解析基于librosa音频库;矩阵操作基于scipy和numpy科学计算库。
以下是Python的实现方式:
音频剪裁
import librosafrom scipy.io import wavfiley, sr = librosa.load("../data/love_illusion.mp3") # 读取音频print y.shape, srwavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr]) # 写入音频
音频旋转
import librosaimport numpy as npfrom scipy.io import wavfiley, sr = librosa.load("../data/raw/love_illusion_20s.mp3") # 读取音频y = np.roll(y, sr*10)print y.shape, srwavfile.write("../data/raw/xxx_roll.mp3", sr, y) # 写入音频
音频调音,注:cv库的resize函数含有插值功能。
import cv2import librosafrom scipy.io import wavfiley, sr = librosa.load("../data/raw/love_illusion_20s.mp3") # 读取音频ly = len(y)y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze()lc = len(y_tune) - lyy_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, srwavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune) # 写入音频
音频加噪,注:在添加随机噪声时,保留0值,否则刺耳难忍!
import librosafrom scipy.io import wavfileimport numpy as npy, sr = librosa.load("../data/raw/love_illusion_20s.mp3") # 读取音频wn = np.random.randn(len(y))y = np.where(y != 0.0, y + 0.02 * wn, 0.0) # 噪声不要添加到0上!print y.shape, srwavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y) # 写入音频
看完上述内容,你们对如何进行Python 音频的数据扩充有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
音频
数据
内容
方式
噪声
深度
领域
学习
刺耳
函数
功能
图像
学习网络
效果
方法
更多
知识
矩阵
科学
篇文章
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
华云vpn服务器
国三数据库技术考什么
音恋语音软件开发
jsp循环读取数据库数据
一台服务器多少淘宝用户
云服务器修改密码步骤
安卓软件开发路线
三菱服务器回零异常
idata糖尿病数据库
互联网的发展和科技的进步
换域名 数据库
网络安全教育 试卷b
学软件开发我后悔了
网络安全6S什么意思
一张课表的数据库含哪些字段
本地服务器ssh密码
软件开发需要用到哪些算法
数据库类技术要求
服务器时间校准 前端
容错最大的服务器
品牌网络技术咨询怎么样
网络安全人员能力认证考试题
密码学与软件开发
北京联合大学有网络安全专业吗
上海翔联网络技术有限公司
博西 软件开发 待遇
数据库2008匹配密码
南充软件开发招聘
软件开发协议合同模板doc
杭州软件开发多少钱