距离上一次发布 音频文本识别脚本 已经一年多了,也得到很多反馈
最近看到由阿里达摩院发布的FunASR项目,试用了一下,相比之前百度的PaddleSpeech,不仅识别速度快了,而且还能识别到每个字出现和结束的时间戳,让我萌生了利用它来做一整套语音识别脚本的想法
语音识别
脚本名字:DSY_音频文本识别2_zh.lua
和之前一样的效果,但是你可以看到这是一整个语音,标记会在语音停顿的时候切分,而不是像之前那样全部字连在一起。另外这一次不再限制语音长度,从几秒钟到几小时都一样能识别
生成字幕
脚本名字:DSY_一键生成字幕.lua
语音识别生成音频块标记
脚本名字:DSY_音频文本识别2 音频块标记_zh.lua
标记写到音频块上,就能跟随音频块移动
导出SRT字幕
脚本名字:DSY_导出SRT字幕.lua
选中刚刚生成的字幕item,运行就能导出成标准的SRT格式字幕,当然你也可以自己建立item然后把字幕填进去名字里,也能生成SRT字幕。注意光标要放到起点位置
导入SRT字幕
脚本名字:DSY_导入SRT字幕.lua
跟上面这个反过来,把SRT字幕导进工程里,并在视频窗口里显示
导入SRT字幕 形成空白item
脚本名字:DSY_导入SRT字幕 空白.lua
这个可以给 Heda 的 Note Reader 脚本使用,它是使用空白item作为字幕来源的
下载地址
更新
之前分割用的脚本有点小问题,请用以下这个文件覆盖掉原来的同名文件
DSY_AutoTrim_for_ASR.lua (8.5 KB)
针对部分使用中文版的用户,解决生成或导入字幕后无法显示的问题,解决部分用户由于设置原因会弹出很多效果器窗口的问题
DSY_一键生成字幕.lua (3.0 KB)
DSY_导入SRT字幕.lua (3.4 KB)
解决遇到无法识别的语音导致出错的问题,需要放在funasr文件夹里
main.py (2.2 KB)
依赖包
JS_ReaScriptAPI 安装方式:win用户下载以下文件,解压后放到安装路径下的userplugins文件夹里,重启reaper(其他系统用户请到他Github主页下载 Github)
reaper_js_ReaScriptAPI64.zip (388.2 KB)
注意事项
- 只支持Windows
- 脚本这次没有加密,免费开源分享,可随意分发和使用,分发请保留作者信息。不得商用,当然你真的商用我也阻止不了
- 是否切分句子取决于语句之间的停顿长度,只有大于0.2秒才会切分
- 目前只支持中文语音识别,虽然原项目有提供英文模型,但识别英文会出错,反馈了也暂时没有跟进,只能暂不提供英文支持
- 请别用于非语音的音频上,没有意义也可能会导致出错
Donation
毕竟用爱发电不易,如果我的脚本给你带来了便利,不妨buy me a coffee
如果有需要订制个人化的脚本,请添加以下QQ联系:86989558