您当前位置:首页 - 攻略资讯 - 详情

什么叫标客(人工智能背后的“人工”:时薪缩水一半,欠薪高发)

2025-02-13 18:11:04|网友 |来源:互联网整理

什么叫标客

标客是指在互联网或电子商务领域中,以标注、分类、整理信息为主要工作内容的一类工作者。

他们通过对大量数据进行处理,为机器学习和人工智能技术的应用提供基础数据支持。

在详细解释标客之前,我们先来了解一下背景信息。

随着大数据和人工智能技术的飞速发展,越来越多的企业和研究机构开始利用这些数据技术来优化业务流程、提升产品性能或开发新的服务模式。

然而,这些技术的应用需要大量的标注数据作为训练基础,这时候就需要标客来发挥作用了。

标客的工作内容主要包括对文本、图像、音频、视频等各种类型的数据进行标注和分类。

例如,在图像识别项目中,标客需要对大量图片进行标注,指出其中的物体、场景、颜色等信息,以帮助机器学习模型学习如何识别这些元素。

在自然语言处理项目中,标客则需要对文本数据进行分词、词性标注、实体识别等工作,以提升文本处理算法的准确性。

标客的工作对于人工智能技术的发展具有重要意义。

他们的工作不仅为机器学习模型提供了必要的数据支持,还帮助提高了模型的训练效率和准确性。

同时,随着技术的不断进步,标客的工作也在逐渐变得自动化和智能化,例如通过使用半自动标注工具或预训练模型来减轻人工负担,提高工作效率。

总的来说,标客是互联网和电子商务领域中不可或缺的一类工作者。

他们的工作为人工智能技术的发展提供了坚实的数据基础,推动了技术进步和应用创新。

在未来,随着技术的不断发展,标客的工作内容和形式也将不断更新和变化。

什么叫标客(人工智能背后的“人工”:时薪缩水一半,欠薪高发)-第1张图片-拓城游

人工智能背后的“人工”:时薪缩水一半,欠薪高发

“我感觉兼职标注会越来越容易被替代掉。

”来自广东河源的27岁宝妈西梅(化名)对自己数据标注兼职有一种淡淡的悲观。

从2018年兼职数据标注,西梅的收入已经大不如前。

生活在贵州百鸟河小镇上的杜珉旭,是数据服务商梦动科技公司的项目组组长,除了每天协同组员完成数据标注项目,他还会抽出时间自学python语言。

西梅和杜珉旭都是AI数据标注员,这是一个需求庞大却又曾备受争议的职业。

标注行业给算法提供大量的训练数据。

据IDC统计,全球每年生产的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%~90%是非结构化数据,这些数据经过清洗与标注变成了结构化数据,才能被人工智能所理解。

2020年2月,“人工智能训练师”已正式成为新职业并纳入国家职业分类目录。

业内往往说,“有多少智能,背后就有多少人工”。

门槛较低,又需要大量重复的工作,这一行业生来就属于劳动密集型产业。

为了降低人工成本,它多数存在于一些偏远的地区,因而往往与产业扶贫联系起来。

而重复枯燥的劳动,加之过低的工资,又被人称“AI富士康”。

机器智能发展到一定阶段后,人工是否会面临淘汰,如果淘汰那相关的劳动力又何处安放?自数据标注行业诞生,担忧与争议就没停过。

如今,随着数据标注行业迭代升级,这些不同工作形式的数据标注员,都面临着能力升级的考验。

入行门槛低

前数据标注销售人员黄明(化名)对第一财经记者表示,作为劳动密集型产业,标注基地的员工实际上与在工厂上班的人毫无区别。

在他看来,一天下来坐在电脑前标注,既繁琐重复,又给人体尤其是眼睛造成较大损伤,工资还不高。

对于仍然从事数据标注的受访者来说,他们看法和黄明不尽相同。

尽管这份工作在很多人眼里看似枯燥乏味,他们还是能找到和自己生活、喜好的结合点。

两年前,西梅由于怀孕而不方便正常上班。

她不愿跟随丈夫从事养殖业,辞去淘宝客服的工作后,在网络。

黄明后来跳槽到了一家做激光雷达的创业公司做销售。

在他看来,数据标注行业好处之一,是能对接到许多高端企业,以最低门槛接触到人工智能领域。

他们的共识是,对于带孩子的宝妈、农村待业人士,甚至一些残障人士,数据标注员不失为一份可以接受的工作。

众包模式下质量与权益问题俱增

中国的数据标注行业最早可追溯到2005年,著名计算机视觉专家、人工智能专家朱纯松从美国回到了故乡湖北鄂州,创办了莲花山研究院,筹建据称是当时世界上最早的大数据标注团队。

2015年,随着人工智能巨头的崛起,数据标注和采集需求激增,市场真正意义上开始形成。

许多数据服务公司作为乙方进入到日益扩大的市场,为百度、阿里等大型互联网公司,以及AI独角兽企业等服务。

截至目前,数据标注产业已经遍布全国,以第三方数据服务商、巨头布置基地和众包模式呈现,例如百度山西的AI数据标注基地、贵州百鸟河的梦动科技、河北和安徽的数据堂基地,以及河南的千机数据、睿金科技,河北涞源县东团堡村等。

梦动科技数据服务事业部总监曾芸对第一财经记者介绍,梦动属于独立的数据服务商,联动贵州盛华职业学院,对学生以产教融合的方式进行数据标注的教学和培养,从大量的实习生开始,逐渐选拔出能够适应数据标注员工作的正式员工与管理人员。

而如同西梅的“兼职工作”,数据标注最开始的蛮荒发展,由“众包”模式而兴起。

这些众包平台上一端对接项目需求公司,另一端对接大量有空余时间的志愿者(兼职人员)。

这种众包结构的优点是可以组织社会上的大量兼职人员进行标注,节省公司的运营成本。

众包存在的弊端也较为明显,分散的兼职人员,专业背景和工作能力参差不齐,沟通成本高昂,数据保密也相对困难。

一旦需求公司要调整原有标注需求,兼职人员流动性大,无法灵活服务需求公司。

西梅告诉第一财经,今年3月份疫情高峰时,她曾约到一家外包公司,据称当时一天大约数据产值能达200元,算下来一个月五六千左右工资。

但真正开始测试时对方就在不停地催产量,后来由于数据验收不及格打回来返工,一个半月的时间返工了两次,最后西梅仅拿到了400多元。

据了解,众包模式的资源对接往往通过一些微信群或QQ群。

记者在QQ上数据标注行业的大量讨论。

来源: 第一财经

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。 E-MAIL:admin@bb1314.com