AI技术在音频审核中的应用

新知榜官方账号

2023-07-10 11:44:32

背景

随着各种各样的内容类产品发展，当内容管理不到位时，就容易触犯到国家对内容监管的政策。因此，对内容的管理，都需要进行审核到位，但是如果纯靠人工审核，估计像头条号这样的资讯平台，一天得有上万人审核了。目前各家对内容都会接入内容审核平台，基于人工智能技术实现内容审核。

关键技术

关于音频审核中的关键技术，可以从有语义和无语义两个方面进行理解。

有语义类型

有语义类型是指待审核的内容中有明确的语义信息。这里文本审核一般可以先经过ASR识别后，转成文本信息进行审核，所以会涉及到以下技术。

语音识别：通过ASR技术将音频转换为文本信息；
语种识别：针对部分小语种或者方言进行判别，识别后，再经过语音识别转换为文字信息；
NLP技术：针对语音识别后的文字信息进行处理，识别违规内容；具体的可以包括广告词文本识别、违禁词识别、辱骂词汇识别等。

无语音类型

无语义类型识别是指音频内容中不含语义信息，所以无法通过ASR+NLP进行识别处理。主要包括娇喘、呻吟、ASMR等没有明确语言含义的音频内容。直接提供提取音频的声纹特征进行分类识别，判断是否违规。

特殊的类型

这里主要是指违禁歌曲识别，一般这样的违规内容虽然包含了语义信息，但是可能直接从内容信息上是无法判断的。所以需要结合声纹识别+音频检索的技术进行来识别，首先构建违禁歌曲库，然后再根据音频声纹特征进行识别并检索。如果出现在曲库中则判断违规，否则放过。

产品设计

一个比较完备的音频审核产品可以从功能接口、可视化界面、业务流程等方面进行设计。

功能接口

提供好用的API和SDK能力，包括数据请求分析、数据结果查询、规则定义接口等接口。在设计时，需要设定好字段的支持力度，比如对于请求时要支持URL，同时是否需要支持音频审核模板。

可视化界面

建议同步提供可视化界面便于接入的用户进行数据查看，可视化界面不仅可以提高用户体验，也可以辅助用户进行产品使用。

业务流程

源数据+预处理：通过接入待审核的内容，再进一步做预处理，包括分段等操作；模型处理：审核的核心，通过输入预处理后的数据，进行AI分析，输出机器审核结果，包括确认违规、疑似违规和未违规；人工复审：对疑似违规内容进行复审。

评估指标

评估指标需要考核两个方面：违规识别准确率和违规识别召回率。

本页网址：https://www.xinzhibang.net/article_detail-7386.html

寻求报道，请

关键词

分享至微信：

扎心文案+AI插画=爆款！揭秘8万赞视频的制作全流程

又一个爆款诞生！今天拆解一个账号——@尴尬的老男人，内容很简单，最高一条近8万赞，但平均每条视频都有几百赞！他的视频看似就是几张图片配上一段音乐，却精准狙击用户对“生活氛围感”和“情绪价值”的深层渴望，再加上温暖色调、治愈配乐——每一帧都让人忍不住驻足回味。其实，这种视频的关键就是2个：扎心文案

分类标签

08-12 10:08

三个国外专业免费的调色网站

三个国外专业免费的调色网站无论制作视频、编辑图片，合适的色彩会让你的作品增加视觉冲击力，所以专业的调色技术价值非凡，一部电影或一部好的视频、图片海报，专业调色耗费少则上万，多则上百万，只是大家对专业调色这个行业知之甚少，今天网玩君就为大家分享三个国外专业免费的调色网站，记得收藏好，以后编辑视频、图片

分类标签调色网站免费

04-18 16:42

第六届中国国际工业设计博览会盛况空前

第六届中国国际工业设计博览会于11月30日至12月2日在武汉举行。本届博览会展览面积达2万平方米，参展企业超过300家，其中，参展国家级工业设计中心数量为历届最多。众多国内外行业龙头企业展示了多项“首台套”的硬核实力，为中国制造业向高端化、智能化、绿色化转型升级赋能。中铁宝桥集团展示了多个“国内首条

分类标签中国国际工业设计博览会工业设计创新成果中国制造业

04-18 16:42

知识分享查理芒格思考的独立性与决策的准确性

知识分享查理芒格思考的独立性与决策的准确性本文介绍了成功投资者必须具备独立思考和决策准确性，同时保持谦逊低调的心态，以及成功的关键因素之一——运气。同时，本文还分享了下周市场关注的行业和概念。一、知识分享查理芒格思考的独立性成功的投资者必须具备独立思考的能力，因为只有独立思考才能避免盲目跟风和投资决

分类标签独立思考决策准确性谦逊低调

04-18 16:42

阿里国际发布三款AI设计工具助力中国制造走向全球

阿里国际发布三款AI设计工具助力中国制造走向全球12月1日，在第六届中国国际工业设计博览会上，阿里国际数字商业集团（简称“阿里国际”）发布了3款设计生态工具：堆友、PicCopilot、鹿班AI。这3款产品具有AI绘画、AI模型创作、AI图像和视频处理等功能，用AI设计服务全球商家更轻松的做好本地市

分类标签 AI设计阿里国际数字商业集团

04-18 16:42

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway