AI技术在音频审核中的应用

新知榜官方账号

2023-07-10 11:44:32

背景

随着各种各样的内容类产品发展,当内容管理不到位时,就容易触犯到国家对内容监管的政策。因此,对内容的管理,都需要进行审核到位,但是如果纯靠人工审核,估计像头条号这样的资讯平台,一天得有上万人审核了。目前各家对内容都会接入内容审核平台,基于人工智能技术实现内容审核。

关键技术

关于音频审核中的关键技术,可以从有语义和无语义两个方面进行理解。

有语义类型

有语义类型是指待审核的内容中有明确的语义信息。这里文本审核一般可以先经过ASR识别后,转成文本信息进行审核,所以会涉及到以下技术。

  • 语音识别:通过ASR技术将音频转换为文本信息;
  • 语种识别:针对部分小语种或者方言进行判别,识别后,再经过语音识别转换为文字信息;
  • NLP技术:针对语音识别后的文字信息进行处理,识别违规内容;具体的可以包括广告词文本识别、违禁词识别、辱骂词汇识别等。

无语音类型

无语义类型识别是指音频内容中不含语义信息,所以无法通过ASR+NLP进行识别处理。主要包括娇喘、呻吟、ASMR等没有明确语言含义的音频内容。直接提供提取音频的声纹特征进行分类识别,判断是否违规。

特殊的类型

这里主要是指违禁歌曲识别,一般这样的违规内容虽然包含了语义信息,但是可能直接从内容信息上是无法判断的。所以需要结合声纹识别+音频检索的技术进行来识别,首先构建违禁歌曲库,然后再根据音频声纹特征进行识别并检索。如果出现在曲库中则判断违规,否则放过。

产品设计

一个比较完备的音频审核产品可以从功能接口、可视化界面、业务流程等方面进行设计。

功能接口

提供好用的API和SDK能力,包括数据请求分析、数据结果查询、规则定义接口等接口。在设计时,需要设定好字段的支持力度,比如对于请求时要支持URL,同时是否需要支持音频审核模板。

可视化界面

建议同步提供可视化界面便于接入的用户进行数据查看,可视化界面不仅可以提高用户体验,也可以辅助用户进行产品使用。

业务流程

源数据+预处理:通过接入待审核的内容,再进一步做预处理,包括分段等操作;模型处理:审核的核心,通过输入预处理后的数据,进行AI分析,输出机器审核结果,包括确认违规、疑似违规和未违规;人工复审:对疑似违规内容进行复审。

评估指标

评估指标需要考核两个方面:违规识别准确率和违规识别召回率。

本页网址:https://www.xinzhibang.net/article_detail-7386.html

寻求报道,请 点击这里 微信扫码咨询

关键词

音频审核 AI技术 内容安全

分享至微信: 微信扫码阅读

相关文章