数据标注工:AI时代的新岗位

新知榜官方账号

2023-08-15 01:36:47

数据标注工:AI时代的新岗位

今年5月,24岁的张娟开始做大模型数据标注的工作。她是甘肃积石山县的一位95后,大专毕业。积石山县位于甘肃西南部与青海的交界处,经济欠发达。2022年,该县城镇居民人均可支配收入为26258.5元/年,每月平均才2188.2元,农村就更低。但做数据标注的张娟,月薪平均已到7000元,时而上万。

大模型数据标注是国内今年一个热门职业。它的工作内容是,人们为万事万物打上标签,AI通过标签来进行深度学习,从而训练自己的智能。数据标注工,做的就是打标签的工作。一些简单的标注,技术含量不会那么高。比如张娟做的就是标注照片中是否包含鸟类或者汽车、录音中有哪些词的发音、医学影像中有没有肿瘤等等,大专毕业的她完全能胜任。

毕业后的张娟本来先是入职了兰州一家测绘公司,但由于心里牵挂母亲和年迈的爷爷奶奶,加上测绘经常要到野外作业,她觉得并不适合自己,更想回到家乡工作。但老家的工作机会,除了考公就是服务业,工资不高,张娟很犹豫。直到遇到数据标注工作,它属于AI行业的一种新岗位,既解决了年轻人赚钱储蓄的心理,也能够照顾家里。

今年,随着大模型热潮,中国包括阿里、百度、腾讯、字节在内的互联网大厂纷纷投入这个被称为“移动互联网时代最后一个机会”的领域。蚂蚁相关负责人告诉《真故研究室》,做这样的发包,本质是一个与地方政府合作的名为“数字木兰|AI豆计划”的公益项目。蚂蚁在集团内部匀出部分工作需求,与欠发达地区进行合作,希望让新技术普惠到更广泛的人群。

若追溯数据标注工种的诞生,并不是今年才开始,而是可以追到2011年。当年,随着大数据、云计算、互联网和物联网等信息技术发展,针对AI的数据标注外包市场随之开启,2017年数据标注市场进入爆发阶段。而今年对话大模型的爆火,使得数据标注员的需求量节节攀升,人才供需缺口被迅速放大,这一职业逐渐被人们所熟知。

AI给普通人带来机会,不只发生在中国,在国际上也正在进行一些国际分工。OpenAI的一家外包数据标注公司Sama,员工就来自乌干达、肯尼亚、印度等工资水平相对较低的国家。在肯尼亚,Sama最初级的数据标注员每月工资有2.1万肯尼亚先令(约合1057元),虽然低于国内数据标注员的工资水平,但无疑对人均GDP只有2000美元的当地而言,这工作不算差。同时,数据标注也给聪明人带来了新的创业机会。如OpenAI的另一家外包数据标注公司ScaleAI(提供数据标注服务的公司,创始人为华裔AlexandrWang),位于旧金山,靠承包数据标注这一工作起家和得势,估值已达73亿美元。

值得关注的是,该公司比较推行让AI给AI标注数据,也就是自动化标注。这给人们又带来了另一层隐忧,即:未来数据标注是否会全部由模型代劳,不再需要人工标注工?目前行业的判断是不会,认为没有任何数据标注公司、能够完全摆脱人工参与,毕竟AI没办法识别它没见过的东西。综合种种,从数据标注的行业现状来看,该行业还能出现外包企业的创业机会。广西科技大学计算机学院院长李春贵判断,国内的数据标注行业将会涌现大批初创企业,其中,为科技、医学等专业领域进行数据标准的、这样小而精的公司更有希望在行业中拔得头筹。

本文来自微信公众号“真故研究室”(ID:zhengulab),作者:林秋艺,编辑:龚正,36氪经授权发布。

本页网址:https://www.xinzhibang.net/article_detail-9846.html

寻求报道,请 点击这里 微信扫码咨询

关键词

数据标注 AI 职业 创业 人工智能

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯