如何利用VideoSrt语雀进行免费的语音识别和字幕制作?

新知榜官方账号

2023-07-08 08:32:51

如何利用VideoSrt语雀进行免费的语音识别和字幕制作?

AI语音识别是很大的应用场景,而针对我们个人的立场出发,又有自媒体从业者,相关论文科研报表,电子商务语音协助,开发翻译产品,语音控制应用,语音输入方向的应用衍生,如果您对这方面感兴趣或者是其中的从业者,建议看完这次的内容,可以一劳永逸的免费解决问题。

VideoSrt语雀0.3.3是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量地为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。

打开阿里云我们一共需要开通设置三个服务,分别是“访问控制”、“对象存储OSS”、“智能语音交互”。请开通设置前,先自行注册阿里云账号,并完成账号的(个人/企业)实名认证。

开通访问控制

大体流程是“创建用户”→“设置用户权限”→记录”用户ID“+”Secret密钥”。

按照以下的辅助箭头信息的流程开通“访问控制”即可。

控制台→左上角三横图标(产品与服务)→访问控制(RAM)→2-3次的确认立即开通→管理控制台→人员管理-用户→创建用户(任意自定义名称)-(√)编程访问→开通并且找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。

AccessKeyID:【访问控制ID】******************

AccessKeySecret:【访问控制密码】******************

然后回到用户界面,针对创建好的用户,最右边有“添加权限”点击“添加权限”→增加“对象存储OSS”、“智能语音交互2.0”这两项服务的权限,让该服务可以在后续的使用过程中,可以管理控制这两项服务的正常工作。

开通对象存储OSS

按照以下的辅助箭头信息的流程开通“对象存储”即可。

控制台→左上角三横图标(产品与服务)→对象存储OSS→2-3次的确认立即开通→管理控制台→创建Bucket(任意自定义名称)、区域选择就近原则、读写权限设置为“公共读”、其他默认→选择确定(创建)之后找到以下信息,把相匹配的信息复制黏贴替换*号并且记录下来,后续要用。

BucketName【对象存储的名称】******************

Endpoint【对象存储的地域节点】******************

BucketDomain【对象存储的Bucket域名】******************

开通智能语音交互

按照以下的辅助箭头信息的流程开通“智能语音交互”即可。

控制台→左上角三横图标(产品与服务)→智能语音交互→开通→录音文件识别(试用)-每天两小时免费识别时间(√)协议→立即开通

按照以下的辅助箭头信息的流程配置“智能语音交互”即可。

管理控制台→全部项目→创建项目→语音识别+语音合成→任意自定义名称→确定→基于场景选择模型→非电话-[中文普通话(识音石V1-端到端模型)][识别输入项]→确认使用→自定义选择语音合成模型[输出项]→确认使用之后找到以下信息,把相匹配的信息复制黏贴替换*号并且记录下来,后续要用。

Appkey:【智能语音交互的Appkey】******************

配置VideoSrt语雀

打开软件界面,按照下面的流程操作,并且把相匹配的信息,复制黏贴进输入框内,并保存。

新建→语音引擎(阿里云)名称别名:任意自定义名称【1软件显示名称,与阿里云无关】【2智能语音交互的Appkey】【3访问控制ID】【4访问控制Secret】设置→OSS对象存储设置【1对象存储的地域节点】【2访问控制ID】【3访问控制密码】【4对象存储的名称】【5对象存储的Bucket域名】设置→软件设置文件输出目录:自定义设置文件夹路径

至此,后续就可以打开(拖动)媒体文件,正常自动AI识别字幕啦!

备注:翻译功能不建议使用,因为涉及翻译过都会有后词不达意的问题,还是有必要先利用翻译系统,逐一校对中文内容的准确性,再合成内容,这样才是错误率最低的方案。毕竟对自己内容负责,是每个自媒体人的基本技能。

好了,以上就是本期的所有内容。希望我分享的能给大家带来帮助,也别忘记点赞关注订阅分享转发,我们下次再见,啊忠感谢了。

本页网址:https://www.xinzhibang.net/article_detail-6837.html

寻求报道,请 点击这里 微信扫码咨询

关键词

语音识别 字幕制作 VideoSrt语雀

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯