网站建设全程揭秘 课件下载成都网站建设易维达好

张小明 2025/12/31 19:17:08
网站建设全程揭秘 课件下载,成都网站建设易维达好,深圳外贸公司集中在哪些地方,企业网站公司单位有哪些0. 研究背景 Fun-ASR-Nano-2512 是由阿里巴巴旗下的通义实验室开源的语音识别模型#xff0c;通义实验室之前还开源了 SenseVoiceSmall 和 Paraformer 模型#xff0c;这篇文章使用三种模型对多种方言#xff0c;以及真实电话录音进行对比测试#xff0c;在开源的数据集中…0. 研究背景Fun-ASR-Nano-2512 是由阿里巴巴旗下的通义实验室开源的语音识别模型通义实验室之前还开源了 SenseVoiceSmall 和 Paraformer 模型这篇文章使用三种模型对多种方言以及真实电话录音进行对比测试在开源的数据集中评估的结果官方已经给出这里使用自己的数据测试不同的数据测试的字错率会不一样这篇文章结果仅供大家参考具体以你自己测试的结果为准。同时还对比测试三种模型的转写速度以及转写时资源占用情况。1. 推理代码1.1 Fun-ASR-Nano 的推理代码# !/usr/bin/env python# _*_ coding utf-8 _*_# Time: 2025/12/15 20:18# Author: Luke Ewin# Blog: https://blog.lukeewin.topfrommodelimportFunASRNanoimporttimedefmain():model_dirFunAudioLLM/Fun-ASR-Nano-2512start_modeltime.time()m,kwargsFunASRNano.from_pretrained(modelmodel_dir,devicecpu)end_modeltime.time()load_time_ms(end_model-start_model)*1000print(f加载模型Fun-ASR-Nano-2512耗时{load_time_ms:.2f}毫秒)m.eval()whileTrue:wav_pathinput(f输入音频路径)ifwav_pathexit:breakstarttime.time()resm.inference([wav_path],**kwargs)endtime.time()inference_time_ms(end-start)*1000print(f转写耗时{inference_time_ms:.2f}毫秒)textres[0][0][text]print(text)print(50*-)if__name____main__:main()1.2 SenseVoiceSmall 推理代码# !/usr/bin/env python# _*_ coding utf-8 _*_# Time: 2025/11/8 23:53# Author: Luke Ewin# Blog: https://blog.lukeewin.topfromfunasrimportAutoModelfromfunasr.utils.postprocess_utilsimportrich_transcription_postprocessimporttime model_diriic/SenseVoiceSmallstart_modeltime.time()modelAutoModel(modelmodel_dir,devicecpu,disable_updateTrue,disable_logTrue,disable_pbarTrue,)end_modeltime.time()load_time_ms(end_model-start_model)*1000print(f加载模型SenseVoiceSmall耗时{load_time_ms:.2f}毫秒)whileTrue:audioinput(请输入要处理的音频)ifaudioexit:exit(0)else:starttime.time()resmodel.generate(inputaudio,cache{},languageauto,use_itnTrue,batch_size_s60,)endtime.time()inference_time_ms(end-start)*1000print(f转写耗时{inference_time_ms:.2f}毫秒)textrich_transcription_postprocess(res[0][text])print(text)print(50*-)1.3 Paraformer 推理代码这里使用的 Paraformer 是 seaco-paraformer# !/usr/bin/env python# _*_ coding utf-8 _*_# Time: 2025/12/10 21:51# Author: Luke Ewin# Blog: https://blog.lukeewin.topfromfunasrimportAutoModelimporttime start_modeltime.time()modelAutoModel(modelparaformer-zh,disable_updateTrue,disable_logTrue,disable_pbarTrue,devicecpu)end_modeltime.time()load_time_ms(end_model-start_model)*1000print(f加载模型paraformer-zh耗时{load_time_ms:.2f}毫秒)whileTrue:wav_pathinput(f输入音频路径)ifwav_pathexit:exit(0)starttime.time()resmodel.generate(inputwav_path,batch_size_s300,hotword魔搭)endtime.time()inference_time_ms(end-start)*1000print(f转写耗时{inference_time_ms:.2f}毫秒)print(res)print(50*-)2. 测试环境CPUGPU内存硬盘Intel® Xeon® Platinum 8470QNVIDIA RTX 509090GB80GB25内核32GB显存3. 方言识别测试这里测试客家话四川话莆田话这三种方言的识别情况。3.1 客家话标注文本音频名音频内容音频时长hakka_a你好大家好欢饮大家来到我的视频频道00:00:09.96hakka_b你吃饭了吗今晚你吃什么菜呢00:00:08.48hakka_test现在我来测试一下语音识别看看识别的怎么样00:00:08.66paraformer 测试结果如下音频名转写结果转写耗时显存占用内存占用hakka_a你 以 后 太 敢 后 我 眼 太 敢 来 到 然 后 的 心 频 很 痛1660.61 毫秒1590MiB3GBhakka_b女 sydlijama 你 said mila china124.12 毫秒1590MiB3GBhakka_test上 来 了 克 斯 汉 tae sept 怎 么 样126.03 毫秒1590MiB3GB可以看到转写的结果很不理想全都是错误的。SenseVoiceSmall 测试结果如下音频名转写结果转写耗时显存占用内存占用hakka_a如何太假呵稳人太假来到我的视频平托。1050.31 毫秒1578MiB1.2GBhakka_b儿式花靓忙点呀儿式乜牙菜呢62.43 毫秒1578MiB1.2GBhakka_test地下奶来测试一下二唔识劈替替食劈的怎么样。61.10 毫秒1578MiB1.2GBFun-ASR-Nano 测试结果如下音频名转写结果转写耗时显存占用内存占用hakka_a而后泰甲后阮用泰甲来到了的视频频道。872.05 毫秒3886MiB3.3GBhakka_b儿识巴厘木竟也儿识抹牙菜呢。361.80 毫秒3886MiB3.3GBhakka_test接下来来测试一下语音识别睇睇识别得怎么样319.23 毫秒3886MiB3.3GB3.2 四川话标注文本音频名音频内容音频时长sichuan_segment_017不想搞它了甩在这儿洗了不开等它搁那哦00:00:04.63sichuan_segment_032你又不是找不到我找不到00:00:03.20sichuan_segment_001我认为我老爸是一个非常有主意的人为啥子这么说呢00:00:04.97sichuan_segment_040事情是这样子的我们这个厨房呢它属于农村厨房00:00:03.33sichuan_segment_042它就会飘到这个灶台上面为了防止这个灰尘呢00:00:03.63sichuan_segment_079我老爸的主意他还多得很他还想把我们这个厕所加猪圈拆了00:00:04.60Paraformer 测试结果如下音频名转写结果转写耗时显存占用内存占用sichuan_segment_017想 搞 头 了 乖 着 了 洗 了 不 开 那 可 能 哦1238.11 毫秒1590MiB3GBsichuan_segment_032你 又 不 找 不 到 给 我 找 不 到113.02 毫秒1590MiB3GBsichuan_segment_001我 认 为 我 老 汉 儿 是 一 个 非 常 有 主 意 的 人 为 啥 子 这 么 说 嘞104.00 毫秒1590MiB3GBsichuan_segment_040之 前 是 这 样 子 的 我 们 这 个 厨 房 呢 它 属 于 农 村 厨 房88.34 毫秒1590MiB3GBsichuan_segment_042它 就 会 飘 到 那 个 灶 台 上 面 为 了 防 止 这 个 灰 尘 呢92.38 毫秒1590MiB3GBsichuan_segment_079老 汉 的 主 意 他 还 多 得 很 他 还 想 把 我 们 这 个 厕 所 加 猪 间 拆 了107.24 毫秒1590MiB3GBSenseVoiceSmall 测试结果如下音频名转写结果转写耗时显存占用内存占用sichuan_segment_017洗了不开那可能哦。1068.64 毫秒1578MiB1.3GBsichuan_segment_032你又找不到我找不到。49.76 毫秒1578MiB1.3GBsichuan_segment_001我认为我老汉儿是一个非常有主意的人为啥子这么说呢50.26 毫秒1578MiB1.3GBsichuan_segment_040之前是这样子的我们这个厨房呢它属于农村厨房。46.75 毫秒1578MiB1.3GBsichuan_segment_042它就会飘到那个灶台上面。为了防止这个灰尘呢。61.86 毫秒1578MiB1.3GBsichuan_segment_079老汉儿的主意他还多得很他还想把我们这个厕所加租件拆了。67.45 毫秒1578MiB1.3GBFun-ASR-Nano 测试结果如下音频名转写结果转写耗时显存占用内存占用sichuan_segment_017想搞头啊拐得了啊洗了不开那可能啊。715.69 毫秒3882MiB3.1GBsichuan_segment_032我又不找不到我找不到。201.04 毫秒3882MiB3.1GBsichuan_segment_001我认为我老汉儿是一个非常有主意的人为啥子这么说呢373.36 毫秒3882MiB3.1GBsichuan_segment_040事情是这样子的我们这个厨房呢它属于农村厨房。368.32 毫秒3882MiB3.1GBsichuan_segment_042它就会飘到那个灶台上面为了防止这个灰尘呢。349.89 毫秒3882MiB3.1GBsichuan_segment_079我老汉儿的主意他还多得很他还想把我们这个厕所加猪圈拆了。477.61 毫秒3882MiB3.1GB3.3 莆田话标注音频名音频内容音频时长putian_xiao_2上午好你今天忙不忙呀00:00:04.59putian_xiao_3嗨这么巧碰到你啦00:00:04.65Paraformer 转写结果如下音频名转写结果转写耗时显存占用内存占用putian_xiao_2哦 吼 the 今 我 on 不 on 啊1267.43 毫秒1590MiB3GBputian_xiao_3哎 这 杂 叫 碰 到 的99.52 毫秒1590MiB3GBSenseVoiceSmall 转写结果如下音频名转写结果转写耗时显存占用内存占用putian_xiao_2哦吼汝今晚红毋旺啊。1059.76 毫秒1578MiB1.3GBputian_xiao_3唉即系左只碰够嘟。50.68 毫秒1578MiB1.3GBFun-ASR-Nano 转写结果如下音频名转写结果转写耗时显存占用内存占用putian_xiao_2好好啊汝今晚安毋安啊597.70 毫秒3880MiB3.1GBputian_xiao_3诶即作者有碰到著。230.47 毫秒3880MiB3.1GB4. 带噪音的录音转写测试Paraformer 模型转写音频名音频时长标注文本转写结果转写耗时显存占用内存占用telephone_100:00:06.64最近这块资金有需要了解咨询的吗最近最近后面我也听不清您 这 块 最 近 有 需 要 了 解 事 情 的 吗 啊 最 近 最 近 是 有 需 要 你 不 是 那 个 哪 哪 边 的 嗯1250.00 毫秒1590MiB3GBtelephone_200:00:04.42嗯嗯时间蛮长的你平时有时间开票交税吗啊 啊 是 这 样 蛮 长 的 嗯 平 时 有 开 票 交 税 吗96.50 毫秒1590MiB3GBtelephone_short00:00:20.10你好12306有什么可以帮您。欸你好我要咨询一下你 好 幺 二 三 零 六 请 问 什 么 可 以 帮 您 哎 你 好 我 要 咨 询 下196.79 毫秒1590MiB3GBtelephone_long00:11:16.86…哦 对 登 话 是 企 个 企 业 营 户 证 不 我 我 我 我 办 办 办 在 企 业 业 户 营 办 户 户 户 不 我 我 我 话 现 在 企 办 的 账 话…5804.39 毫秒1592MiB3GBSenseVoiceSmall 模型转写音频名音频时长标注文本转写结果转写耗时显存占用内存占用telephone_100:00:06.64最近这块资金有需要了解咨询的吗最近最近后面我也听不清最近这块最近有需要了解事情的吗最近最近是有需啊你不是那个哪哪辆吗啊。1043.98 毫秒1578MiB1.2GBtelephone_200:00:04.42嗯嗯时间蛮长的你平时有时间开票交税吗啊哦是这样蛮长的。嗯平时有开票交税吗53.67 毫秒1578MiB1.2GBtelephone_short00:00:20.10你好12306有什么可以帮您。欸你好我要咨询一下你好12366请问什么可以帮您哎你好我要咨询下。70.44 毫秒1578MiB1.2GBtelephone_long00:11:16.86…个公税务业执照个工商个记了没有税务的问题的直接描述个工户务搞不懂个发票用需有个搜功能个能有个申请代的是企业业务还是自然业务呢录电子税务的登录是企业业务是自然业务呢登录营业执照户中心户中心户中心去过后有个份换接个工企企业开了个子。2304.22 毫秒1578MiB1.2GBFun-ASR-Nano 模型转写音频名音频时长标注文本转写结果转写耗时显存占用内存占用telephone_100:00:06.64最近这块资金有需要了解咨询的吗最近最近后面我也听不清最近这块最近有需要了解事情的吗最近最近是有需要你不是那个哪哪边呢828.42 毫秒3894MiB3.1GBtelephone_200:00:04.42嗯嗯时间蛮长的你平时有时间开票交税吗啊啊时间蛮长的。嗯平时有开票交税吗402.94 毫秒3894MiB3.1GBtelephone_short00:00:20.10你好12306有什么可以帮您。欸你好我要咨询一下你好幺二三零六请问什么可以帮您哎你好我想咨询一下。485.07 毫秒3894MiB3.1GBtelephone_long00:11:16.86…等。等等等。等。等等等。等等。等。等等等。等。等。等等。等等等等。等。等。等等。等。等。等等等。等等等等等等。等等等。等。等等等等多。等多等。多11641.66 毫秒27460MiB3.1GB这里发现一个问题当输入长音频的时候比如上面输入了11分钟多的音频这个 Fun-ASR-Nano 的显存会涨很多并且转写结束之后不会恢复到之前的显存占用大小。并且这个输出的结果是完成不对的如果使用的是 SenseVoiceSmall 则会进行截断不会出现完全错误的结果如果使用的 Paraformer 就会出现大量的重叠字。5. 总结准确率由高到低排序转写速度由快到慢排序资源占用由多到少排序Fun-ASR-NanoSenseVoiceSmallFun-ASR-NanoSenseVoiceSmallFun-ASR-NanoParaformerParaformerParaformerSenseVoiceSmall6. 其它Paraformer、SenseVoiceSmall、Fun-ASR-Nano 深度对比测试演示视频可以点击这观看。基于 205 小时四川话数据集训练的 Paraformer 模型可点击这里获取。基于 2231 条客家话数据集训练的 SenseVoiceSmall 模型可点击这里获取。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

湖北荆门建设银行网站做网站需要什么设备

FreeBSD Ports使用指南与社区交流规范 1. FreeBSD Ports编译与make Targets 在FreeBSD系统中,编译一个端口(port)非常简单。只需进入其所在的子目录,然后输入 make 命令。等待命令执行完毕,如果一切顺利,你将在没有任何错误的情况下回到命令提示符。 为了更好地理解…

张小明 2025/12/31 19:16:37 网站建设

个人博客网站搭建国内网站绕过备案方法

如何快速部署AI大模型:CPU环境下的完整实践指南 【免费下载链接】T-pro-it-2.0-GGUF 项目地址: https://ai.gitcode.com/hf_mirrors/t-tech/T-pro-it-2.0-GGUF 在人工智能技术飞速发展的今天,本地部署大语言模型已成为技术爱好者和开发者的重要需…

张小明 2025/12/31 19:15:33 网站建设

广东建设工程备案网站android系统开发教程

清华镜像站如何保障 PyTorch 包及时更新 在深度学习项目开发中,最让人头疼的往往不是模型调参,而是环境配置——尤其是当你凌晨两点准备开始训练一个新模型时,发现 pip install torch 卡在 40%,或者 Docker 拉取镜像反复超时。这…

张小明 2025/12/31 19:14:29 网站建设

互联网营销 网站 推荐郑州知名做网站公司

Chaos Mesh实战宝典:从零构建K8s高可用系统的混沌工程体系 【免费下载链接】chaos-mesh 项目地址: https://gitcode.com/gh_mirrors/cha/chaos-mesh 当你的Kubernetes应用在生产环境中突然遭遇网络抖动、Pod意外重启或存储异常时,系统是否真的如…

张小明 2025/12/31 19:12:54 网站建设

官网的网站开发费用从化建网站

Shell脚本编写与Bash安装指南 1. Shell脚本编写最佳实践 在编写Shell脚本时,我们不仅要让代码完成任务,还要确保其具有可维护性,遵循良好的编程实践。 1.1 代码可读性 编写脚本时,代码的可读性至关重要。例如,六个月前编写的100行脚本,现在可能自己都难以理解其功能。…

张小明 2025/12/31 19:12:21 网站建设