声纹识别kaldi callhome diarization怎么实现
发表于:2024-10-25 作者:千家信息网编辑
千家信息网最后更新 2024年10月25日,这篇文章主要介绍"声纹识别kaldi callhome diarization怎么实现",在日常操作中,相信很多人在声纹识别kaldi callhome diarization怎么实现问题上存在疑惑,
千家信息网最后更新 2024年10月25日声纹识别kaldi callhome diarization怎么实现
这篇文章主要介绍"声纹识别kaldi callhome diarization怎么实现",在日常操作中,相信很多人在声纹识别kaldi callhome diarization怎么实现问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"声纹识别kaldi callhome diarization怎么实现"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
callhome diarization kaldi 中专门用来进行混合录音文件聚类分别的
学会自己看kaldi中的 指令demo。
个人操作如下:
teps/segmentation/detect_speech_activity.sh --cmd 'run.pl' --nj 1 --mfcc-config ./conf/mfcc_hires.conf --extra-left-context 79 --extra-right-context 21 --extra-left-context-initial 0 --extra-right-context-final 0 --frames-per-chunk 150 data/ljj exp/segmentation_1a/tdnn_stats_asr_sad_1a exp/mfcc_hires exp/segmentation_sad_snr/nnet_tdnn_j_ljj data/ljj steps/make_mfcc.sh --mfcc-config conf/mfcc.conf --nj 1 --cmd "run.pl" --write-utt2num-frames true data/ljj_seg exp/make_mfcc mfcc utils/fix_data_dir.sh data/ljj_seg # 倒谱均值方差归一化(CMVN) local/nnet3/xvector/prepare_feats.sh --nj 1 --cmd "run.pl" data/ljj_seg data/ljj_seg_cmn exp/ljj_seg_cmn cp data/ljj_seg/segments data/ljj_seg_cmn/ utils/fix_data_dir.sh data/ljj_seg_cmn diarization/nnet3/xvector/extract_xvectors.sh --cmd "run.pl" --nj 1 --window 1.5 --period 0.75 --apply-cmn false --min-segment 0.5 exp/xvector_nnet_1a data/ljj_seg_cmn exp/xvectors_ljj_seg diarization/nnet3/xvector/score_plda.sh --cmd "run.pl --mem 4G" --nj 1 --target-energy 0.9 exp/xvector_nnet_1a/xvectors_callhome1 exp/xvectors_ljj_seg exp/xvectors_ljj_seg/plda_scores diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --reco2num-spk data/ljj_seg/reco2num_spk exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_num_speakers # 如果知道有多少人说话 则需要生成 --reco2num-spk data/ljj_seg/reco2num_spk diarization/cluster.sh --cmd "run.pl --mem 4G" --nj 1 --threshold 0 exp/xvectors_ljj_seg/plda_scores exp/xvectors_ljj_seg/plda_scores_threshold_0 第二列是文件名,第三列是开始时间,第四列是移动时间 第五列是 从移动时间开始 多少时间算一份 第八列是文件的label如下是 已知文件有几个人说话的时候SPEAKER 18642259056-liujinjie.wav 0 0.000 4.5101 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 2 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 如下是 不知文件有几个人说话的时候SPEAKER 18642259056-liujinjie.wav 0 0.000 4.510 1 SPEAKER 18642259056-liujinjie.wav 0 4.530 1.660 3 SPEAKER 18642259056-liujinjie.wav 0 6.210 4.880 2 SPEAKER 18642259056-liujinjie.wav 0 11.090 1.660 1 SPEAKER 18642259056-liujinjie.wav 0 12.800 2.130 1 SPEAKER 18642259056-liujinjie.wav 0 14.950 4.400 2 SPEAKER 18642259056-liujinjie.wav 0 19.390 1.810 2 SPEAKER 18642259056-liujinjie.wav 0 21.220 5.220 2 SPEAKER 18642259056-liujinjie.wav 0 26.440 4.410 1 SPEAKER 18642259056-liujinjie.wav 0 30.850 2.480 2 SPEAKER 18642259056-liujinjie.wav 0 33.340 5.120 2 SPEAKER 18642259056-liujinjie.wav 0 38.460 5.990 1 SPEAKER 18642259056-liujinjie.wav 0 44.480 3.910 1 SPEAKER 18642259056-liujinjie.wav 0 48.460 3.460 1 SPEAKER 18642259056-liujinjie.wav 0 52.060 5.420 1 SPEAKER 18642259056-liujinjie.wav 0 57.530 5.030 1 接下来就是 用pydub 进行语音片段的拼接了
到此,关于"声纹识别kaldi callhome diarization怎么实现"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
文件
时间
学习
个人
接下来
时候
更多
帮助
移动
实用
均值
就是
指令
文件名
文章
方差
方法
片段
理论
知识
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
新世界服务器租用
软件开发呵呵
删除数据库后三条数据
从服务器进去数据库
张家港软件开发公司招聘
计算机及网络安全检查
pc端的软件开发
北京软件开发好的培训
手机邮件收件箱服务器上如何保存
西安有名的软件开发公司
数据库有关的发展
科密指纹 数据库
Win10企业服务器版
服务器链接怎么删除
黄州区司翰网络技术服务中心
sql数据库角度成员
关系逻辑的安全运算数据库
你已从聊天服务器断开
虚拟机需要什么服务器
BMC如何管理服务器背板的
王晓君说网络安全
闵行区生态网络技术哪家好
福建纳百川互联网科技公司
2k22服务器错误代码
acc 教学管理数据库在哪里
钉钉上无法获取服务器数据
普工和软件开发哪个好
七夕节图片素材软件开发
吃鸡手游哪个服务器好玩
p服务器允许匿名登