新知榜官方账号
2023-08-15 01:36:47
今年5月,24岁的张娟开始做大模型数据标注的工作。她是甘肃积石山县的一位95后,大专毕业。积石山县位于甘肃西南部与青海的交界处,经济欠发达。2022年,该县城镇居民人均可支配收入为26258.5元/年,每月平均才2188.2元,农村就更低。但做数据标注的张娟,月薪平均已到7000元,时而上万。
大模型数据标注是国内今年一个热门职业。它的工作内容是,人们为万事万物打上标签,AI通过标签来进行深度学习,从而训练自己的智能。数据标注工,做的就是打标签的工作。一些简单的标注,技术含量不会那么高。比如张娟做的就是标注照片中是否包含鸟类或者汽车、录音中有哪些词的发音、医学影像中有没有肿瘤等等,大专毕业的她完全能胜任。
毕业后的张娟本来先是入职了兰州一家测绘公司,但由于心里牵挂母亲和年迈的爷爷奶奶,加上测绘经常要到野外作业,她觉得并不适合自己,更想回到家乡工作。但老家的工作机会,除了考公就是服务业,工资不高,张娟很犹豫。直到遇到数据标注工作,它属于AI行业的一种新岗位,既解决了年轻人赚钱储蓄的心理,也能够照顾家里。
今年,随着大模型热潮,中国包括阿里、百度、腾讯、字节在内的互联网大厂纷纷投入这个被称为“移动互联网时代最后一个机会”的领域。蚂蚁相关负责人告诉《真故研究室》,做这样的发包,本质是一个与地方政府合作的名为“数字木兰|AI豆计划”的公益项目。蚂蚁在集团内部匀出部分工作需求,与欠发达地区进行合作,希望让新技术普惠到更广泛的人群。
若追溯数据标注工种的诞生,并不是今年才开始,而是可以追到2011年。当年,随着大数据、云计算、互联网和物联网等信息技术发展,针对AI的数据标注外包市场随之开启,2017年数据标注市场进入爆发阶段。而今年对话大模型的爆火,使得数据标注员的需求量节节攀升,人才供需缺口被迅速放大,这一职业逐渐被人们所熟知。
AI给普通人带来机会,不只发生在中国,在国际上也正在进行一些国际分工。OpenAI的一家外包数据标注公司Sama,员工就来自乌干达、肯尼亚、印度等工资水平相对较低的国家。在肯尼亚,Sama最初级的数据标注员每月工资有2.1万肯尼亚先令(约合1057元),虽然低于国内数据标注员的工资水平,但无疑对人均GDP只有2000美元的当地而言,这工作不算差。同时,数据标注也给聪明人带来了新的创业机会。如OpenAI的另一家外包数据标注公司ScaleAI(提供数据标注服务的公司,创始人为华裔AlexandrWang),位于旧金山,靠承包数据标注这一工作起家和得势,估值已达73亿美元。
值得关注的是,该公司比较推行让AI给AI标注数据,也就是自动化标注。这给人们又带来了另一层隐忧,即:未来数据标注是否会全部由模型代劳,不再需要人工标注工?目前行业的判断是不会,认为没有任何数据标注公司、能够完全摆脱人工参与,毕竟AI没办法识别它没见过的东西。综合种种,从数据标注的行业现状来看,该行业还能出现外包企业的创业机会。广西科技大学计算机学院院长李春贵判断,国内的数据标注行业将会涌现大批初创企业,其中,为科技、医学等专业领域进行数据标准的、这样小而精的公司更有希望在行业中拔得头筹。
本文来自微信公众号“真故研究室”(ID:zhengulab),作者:林秋艺,编辑:龚正,36氪经授权发布。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49