声纹识别kaldi callhome diarization怎么实现
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,这篇文章主要介绍"声纹识别kaldi callhome diarization怎么实现",在日常操作中,相信很多人在声纹识别kaldi callhome diarization怎么实现问题上存在疑惑,
千家信息网最后更新 2025年01月23日声纹识别kaldi callhome diarization怎么实现
这篇文章主要介绍"声纹识别kaldi callhome diarization怎么实现",在日常操作中,相信很多人在声纹识别kaldi callhome diarization怎么实现问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"声纹识别kaldi callhome diarization怎么实现"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
callhome diarization kaldi 中专门用来进行混合录音文件聚类分别的
学会自己看kaldi中的 指令demo。
个人操作如下:
teps/segmentation/detect_speech_activity.sh --cmd 'run.pl' --nj 1 --mfcc-config ./conf/mfcc_hires.conf --extra-left-context 79 --extra-right-context 21 --extra-left-context-initial 0 --extra-right-context-final 0 --frames-per-chunk 150 data/ljj exp/segmentation_1a/tdnn_stats_asr_sad_1a exp/mfcc_hires exp/segmentation_sad_snr/nnet_tdnn_j_ljj data/ljj steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 1 --cmd "run.pl" --write-utt2num-frames true data/ljj_seg exp/make_mfcc mfcc utils/fix_data_dir.sh data/ljj_seg # 倒谱均值方差归一化(CMVN) local/nnet3/xvector/prepare_feats.sh --nj 1 --cmd "run.pl" data/ljj_seg data/ljj_seg_cmn exp/ljj_seg_cmn cp data/ljj_seg/segments data/ljj_seg_cmn/ utils/fix_data_dir.sh data/ljj_seg_cmn diarization/nnet3/xvector/extract_xvectors.sh --cmd "run.pl" --nj 1 --window 1.5 --period 0.75 --apply-cmn false --min-segment 0.5 exp/xvector_nnet_1a data/ljj_seg_cmn exp/xvectors_ljj_seg diarization/nnet3/xvector/score_plda.sh --cmd "run.pl --mem 4G" --nj 1 --target-energy 0.9 exp/xvector_nnet_1a/xvectors_callhome1 exp/xvectors_ljj_seg exp/xvectors_ljj_seg/plda_scores diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --reco2num-spk data/ljj_seg/reco2num_spk exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_num_speakers # 如果知道有多少人说话 则需要生成 --reco2num-spk data/ljj_seg/reco2num_spk diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --threshold 0 exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_threshold_0 第二列是文件名,第三列是开始时间,第四列是移动时间 第五列是 从移动时间开始 多少时间算一份 第八列是文件的label如下是 已知文件有几个人说话的时候SPEAKER 18642259056-liujinjie.wav 0 0.000 4.5101 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 2 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 如下是 不知文件有几个人说话的时候SPEAKER 18642259056-liujinjie.wav 0 0.000 4.510 1 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 3 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 接下来就是 用pydub 进行语音片段的拼接了
到此,关于"声纹识别kaldi callhome diarization怎么实现"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
文件
时间
学习
个人
接下来
时候
更多
帮助
移动
实用
均值
就是
指令
文件名
文章
方差
方法
片段
理论
知识
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
开福区软件开发专业
蜂行网络技术
做网络安全的公司简介
网络安全的英文看法
院校数据库网
服务器如何转移虚拟机
金山软件开发过的杀毒软件
上海银行 社招软件开发
史上最难的软件开发
delphine数据库建设
黄埔网络安全运维怎么收费
精灵3主控数据库
云服务器一定要选高主频吗
网络安全需要生态治理
装修软件开发
东土科技宜昌工业互联网招工
香橙派做服务器
信用卡网络安全标准
大专计算机网络技术专业特点
可能是网络安全密匙不匹配
坪山区生产服务器机柜厂家
网络安全税收优惠政策
django的查询数据库
软件开发公司怎么联系
利用数据库制作校徽
苏州正规软件开发服务费
合肥丹明网络技术有限公司
软件开发管理类书参考
油墨msds数据库
聊天软件服务器被关闭