百度推出转录工具SwiftScribe,利用人工智能快速将音频转成文字

新知榜官方账号

2023-09-20 09:40:22

百度美国于昨天推出转录工具SwiftScribe,一个利用人工智能,让用户能快速将音频转成文字的免费网页工具。百度在近年一直在持续改善其新一代深度语音识别系统DeepSpeech2。DeepSpeech2系统由百度硅谷人工智能实验室(SVAIL)研发,并在去年被麻省理工科技评论评为2016年十大突破技术。

国际科技巨头如微软、亚马逊、苹果以及谷歌同样在语音识别领域投入大量精力,但在长段语音识别转录上仍不及百度。SwiftScribe支持上传转录wav和mp3格式的音频文件。一段30秒左右的音频转录成文本时间大概为10秒,而一段1分钟左右的文件大致需要30秒的转录时间。SwiftScribe最大支持用户上传1小时长的音频文件,1小时的音频则需要20分钟左右的处理时间,百度的项目管理人武田介绍道。

SwiftScribe的开发灵感源于武田在加州大学圣芭芭拉分校读研期间的采访经历。武田的团队认为SwiftScribe能给速记员带来1.67倍的效率提升,能缩短40%的工作时间,这也意味着他们能花同样的时间赚到更多的钱。显而易见,SwiftScribe并不只是单单面向于速记员,它基于网页,并免费为用户提供服务,对于其他如记者等需要经常整理音频文件的职业,SwiftScribe可谓是提高效率的神器。

“我们希望在未来能够将其商业化,”武田说道,透露在技术成熟后增加收费服务的打算。武田的团队计划未来给SwiftScribe加入音频自动转录文字、为视频上字幕等功能,以及增加支持文件格式,并加入自动添加标点符号的功能。

本页网址:https://www.xinzhibang.net/article_detail-12576.html

寻求报道,请 点击这里 微信扫码咨询

关键词

百度 SwiftScribe 转录工具

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯