今日头条发布“灵犬”3.0,可识别标题党和图片健康指数

新知榜官方账号

2023-10-24 02:36:22

男默女泪、不看不是中国人、看完惊呆、身份惊人、不看吃亏、癌症凶手……这些标题党文章的惯用词汇,还熟悉吗。今日头条发布内容健康度检测工具“灵犬”,不仅能够识别低俗内容、暴力内容和标题党,还能支持图片识别功能。灵犬3.0的检测准确率从此前的85%,上升至91%。新系统可识别图片,上传图片或其连接,就能一键检测图片的健康指数。

灵犬可以从微信小程序“灵犬反低俗助手”或今日头条内打开。先是界面有变。此前的检测界面,分为反色情低俗、反暴力谩骂和反标题党三类,新版将这三者合为一体,统一成了文本识别。用户只需输入一段文字或文章链接,就能检测内容健康指数,系统返回一个鉴定结果。包括是否可以获得算法推荐,是否需要引入人工判断等。

灵犬采用NLP技术,相比于上一代,灵犬每更新一次,就进化一次。3.0版灵犬同时应用了BERT和半监督技术,并且在此基础上使用了专门的中文语料,在不牺牲效果的情况调整了模型结构,使得计算效率能达到实用水平。这一代“灵犬”训练数据集总量是1.2个T,相当于20倍百度百科或100倍维基百科的数据总量,包含920万个样本,准确率提升至91%。

灵犬不仅可以识别文本内容,还可以识别图片内容。王长虎表示,最新图片识别和检测功能的推出,背后也曾面临3个技术难点。一个图像多尺寸问题,解决方式就是多桶模型,每个桶的模型处理不同尺寸的数据。这样,既不会增加模型运算的耗时,还能提升准确率。二是图像多尺度问题,图片中的人像的尺寸和比例不同,因此研究人员构建了特征金字塔。三是小目标问题,也就是说低俗内容只有一点点。今日头条采用分割辅助分类网络方案,把低俗位置抠出来,结合区域信息整体分析,解决小目标问题。

不仅今日头条,其他内容平台也都推出过类似产品。今年6月,微信上线了一款叫“珊瑚内容安全助手”的小程序,只要面向公众号内容运营者和小程序开发者,任何人可一键识别内容和产品是否安全,是否可以通过检测。再比如想用AI打造智能社区的知乎,去年4月上线了一款专治“答非所问”的机器人瓦力,用机器学习去理解问题下的内容,以快速处理答非所问和辱骂、贴标签等不友善内容,还能识别阴阳怪气(反讽)的回答。不过效果也得两面看,上线一年多,已经有不少用户觉得瓦力的检测效果略感智障,出现了识别不准、莫名折叠回答的情况。

AI已经开始大面积内容监管人员,节约了大量人力,但又何尝不是另外一场由人力堆砌的工作呢?“灵犬”们还需进化,直到不再需要这么多人的那天。

本页网址:https://www.xinzhibang.net/article_detail-17833.html

寻求报道,请 点击这里 微信扫码咨询

关键词

灵犬 健康指数 标题党

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯