【免费脚本】语音识别套件

距离上一次发布 音频文本识别脚本 已经一年多了,也得到很多反馈

最近看到由阿里达摩院发布的FunASR项目,试用了一下,相比之前百度的PaddleSpeech,不仅识别速度快了,而且还能识别到每个字出现和结束的时间戳,让我萌生了利用它来做一整套语音识别脚本的想法

语音识别

image
脚本名字:DSY_音频文本识别2_zh.lua
和之前一样的效果,但是你可以看到这是一整个语音,标记会在语音停顿的时候切分,而不是像之前那样全部字连在一起。另外这一次不再限制语音长度,从几秒钟到几小时都一样能识别

生成字幕

wyddpjJL2N
脚本名字:DSY_一键生成字幕.lua

语音识别生成音频块标记


脚本名字:DSY_音频文本识别2 音频块标记_zh.lua
标记写到音频块上,就能跟随音频块移动

导出SRT字幕

脚本名字:DSY_导出SRT字幕.lua
选中刚刚生成的字幕item,运行就能导出成标准的SRT格式字幕,当然你也可以自己建立item然后把字幕填进去名字里,也能生成SRT字幕。注意光标要放到起点位置

导入SRT字幕

脚本名字:DSY_导入SRT字幕.lua
跟上面这个反过来,把SRT字幕导进工程里,并在视频窗口里显示

导入SRT字幕 形成空白item

脚本名字:DSY_导入SRT字幕 空白.lua
这个可以给 Heda 的 Note Reader 脚本使用,它是使用空白item作为字幕来源的

下载地址

更新

之前分割用的脚本有点小问题,请用以下这个文件覆盖掉原来的同名文件
DSY_AutoTrim_for_ASR.lua (8.5 KB)

针对部分使用中文版的用户,解决生成或导入字幕后无法显示的问题,解决部分用户由于设置原因会弹出很多效果器窗口的问题
DSY_一键生成字幕.lua (3.0 KB)
DSY_导入SRT字幕.lua (3.4 KB)

解决遇到无法识别的语音导致出错的问题,需要放在funasr文件夹里
main.py (2.2 KB)

依赖包

JS_ReaScriptAPI 安装方式:win用户下载以下文件,解压后放到安装路径下的userplugins文件夹里,重启reaper(其他系统用户请到他Github主页下载 Github)
reaper_js_ReaScriptAPI64.zip (388.2 KB)

注意事项

  • 只支持Windows
  • 脚本这次没有加密,免费开源分享,可随意分发和使用,分发请保留作者信息。不得商用,当然你真的商用我也阻止不了
  • 是否切分句子取决于语句之间的停顿长度,只有大于0.2秒才会切分
  • 目前只支持中文语音识别,虽然原项目有提供英文模型,但识别英文会出错,反馈了也暂时没有跟进,只能暂不提供英文支持
  • 请别用于非语音的音频上,没有意义也可能会导致出错

Donation

毕竟用爱发电不易,如果我的脚本给你带来了便利,不妨buy me a coffee

如果有需要订制个人化的脚本,请添加以下QQ联系:86989558

6 Likes

这个太强了

非常牛逼,下载试试。

这个厉害了。。走起走起!!

赞,牛逼。

这个厉害了。~!!!牛逼

语音item太多了是不是会报错?我这个工程因为剪辑切割了很多碎片的item。如果要生成挂载Video FX的动作应该用哪个?

用“一键生成字幕”

是已经报错了吗?item多少也是一样处理的,碎片也没关系,只要是语音就行。如果有报错的话麻烦截图告诉我一下

大佬 解压后的文件夹应该放到哪里 才能使用脚本阿

放到哪里都行,只要所有文件一个不漏地放在一起就可以

大佬,我一键生成字幕,用视频窗口,无法播放出字体,这是哪里的原因?

你截一下生成出来的那些item看看

大佬你给看下,问题出在哪?

方便把这条音频私发给我吗?

选中其中一个,打开这个窗口


点击下面的Take FX,然后把弹出来的窗口,参数截图看一下

2月3日更新:修复了之前部分用户反映过的问题,如果不想整包下载的,可以下载一楼的几个更新文件替换掉旧的

非常感谢楼主的无私分享!


一键识别。会大量弹出,如何设置不弹出呢?

你应该在FX添加的选项中,把自动浮动新的FX窗口这个选项取消掉。

感谢,解决了

感谢反馈,我一直都设置不弹出,都没意识到有这个问题,迟些可以在脚本上也优化一下

1 Like