AI数据标注员招聘火热,背后是大厂的大模型棋局

新知榜官方账号

2023-11-30 06:03:32

AI数据标注员招聘火热,背后是大厂的大模型棋局

近期,一大批“AI数据标注员”的岗位突然冒出,工资月薪十分亮眼,都在1万到2万元之间,且发布时间很短,都在1周到1个月之间。据「自象限」观察,“AI数据标注员”招聘不是由这些大厂直接操办,而是通过猎头公司来负责招聘。岗位的名字也是五花八门,有“数据标注”、“AI话术编辑”、“数据标注分析师”、“标注员”、“AI训练师”等等。虽然叫法不同,但关于这些岗位的职能描述却大差不差,其中很大一部分岗位跟现下大热的大模型有关,入职的数据标注员们的日常工作包含,大模型的编辑校对、大模型的数据标注管理、大模型的内容质量评估等。

AI数据标注员岗位要求严格,但市场需求旺盛

虽然这些岗位的工资待遇非常高,但要求却并不算低,基本学历要求本科起步,985、211优先本科和硕士优先,在具备语言学、中文信息处理、计算语言学、文学等相关专业背景的同时,还得对一些AI技术的原理有了解。面试的基本流程是,“简历初筛-发笔试题-笔试题通过一轮面试-直接发offer-培训”,在学历方面,猎头强调“必须得是一本才行,211/985优先”。虽然要求严格,但市场需求却非常旺盛。招聘软件上,HR们都异常活跃,一天24小时几乎全程在线,日均回复次数在十次以上,隔几分钟就回复一次。据招聘软件显示,这些岗位不仅有百度、字节、京东、滴滴、美团等“梦中情厂”,还有很多其他公司和猎头公司在招聘。有求职者看到了机会,“大模型的风,要带动新一批大厂人扎根了,普通人的机会来了吗?”

AI数据标注员的日常工作是什么?

据招聘软件信息显示,入职的数据标注员们的日常工作包含,大模型的编辑校对、大模型的数据标注管理、大模型的内容质量评估等。具体来说,数据标注员需要对大模型的回答结果进行分析和判断,还要进行大模型的数据标注管理和内容质量评估。数据标注员的主要任务有两项:一是做题,直接给大模型进行“填鸭式”教育;二是给大模型当“判官”,评判给出的答案对不对、好不好。若遇到诸如作文一类没有标准化答案且开放性的问题时,则需要评判答案的好坏,比如,系统会随机给一组数据,包含1个问题和3个回答。数据标注员需要先标注出这个问题属于什么类型,随后给3个回答分别打分并排序。数据标注员需要严格按照标准进行数据标注,以提高大模型的训练效果。

数据标注乱象:粗标“割韭菜”

数据标注并不是新鲜事儿,早已有之。以前的形式是粗标,主要表现为“拉框”,但现在粗标发展得乱了套:一是此前大厂粗标多为众包标注平台,工单分散,人员不专业,导致标注质量不行;二是随着大模型的精进,粗标变得越来越不够用,精标的地位由此直线上升。针对粗标和精标的差异,某大厂员工解释道:“一般厂商的外包团队,能做标注,但他们就是按照框定的规则标注,如果出现规则之外的数据,标注就会存在通过率不高的情况来回反复,但是由工程师团队来做,特别是针对自动驾驶辅助驾驶等回传的数据,他们知道背后的原理,可能不会按照常规的思路标注,会带解决问题的思路来标注,可能需要跳出之前制定的标注规则,这样标注数据的质量会更高。”大模型爆火,也为粗标刮起了一阵“新钱风”。目前,粗标求职阵地已经从招聘软件转移到了快手等短视频平台。在招聘时候,宣传之词毫无遮拦,“无需学历,上手即会,小学生都能做”,“拉一个框,打一个标签,就是半个毛”,“拉3000个150元,6000个300元,月入7000-8000洒洒水,只要手速够快”,极尽夸张之词。但事实究竟如何呢?一些投诉用户的经历与我们相吻合。投诉主要集中在以下几个问题:不会拉框需要先缴纳2580元费用,一年做拉框任务满一万元,但是出现了拒不退款的问题;培训内容非常简单,且耗时长,耽误用户上岗;不给通过和达标,总是卡拉框的合格率,最终影响收入;态度豪横,无视用户的诉求,不处理、不退款。

本页网址:https://www.xinzhibang.net/article_detail-21502.html

寻求报道,请 点击这里 微信扫码咨询

关键词

AI 数据标注员 招聘

分享至微信: 微信扫码阅读

相关工具

相关文章