浙江在线11月28日讯(记者 陈卓妤)“小亮,这张文物图的数据标注,还能再精准些哦。你看这些残断的细节,咱们得用鼠标仔细‘圈’出完整轮廓,这样电脑才能精准识别文物的原始形态。”11月底,在杭州市杨绫子学校的数据标注课堂上,老师袁圆正耐心细致地指导着孤独症孩子。

数据标注老师袁圆耐心指导孤独症孩子 记者 陈卓妤 摄
数据标注,是将原始数据转化为机器学习算法可识别形式的过程,就像是给人工智能“投喂”带“说明书”的数据——比如一张图里有自行车、行人,标注员就用鼠标框出每辆车、每个人,再贴上“自行车”“行人”的标签;一件文物中有破损的地方,就用鼠标给破损的地方画上“圈”。这么一番人工处理后,原本AI看不懂的图片、文字,就变成了它能“认得出”的信息,后续才能训练AI学会自己识别这些内容。早在2020年,“人工智能训练师”正式被纳入国家职业分类目录,成为备受瞩目的新职业,这其中数据标注员就是人工智能训练师的重要工种之一。
“我们学校主要招收智力障碍学生,学生群体涵盖纯智力障碍、脑瘫伴随智力障碍、孤独症伴随智力障碍等多种类型。而数据标注这门职业教育课,是我们专门为孤独症孩子量身打造的。”袁圆向记者介绍。
孤独症(又称自闭症,也被人们亲切地称为“来自星星的孩子”)学生有着十分鲜明的特质:陌生环境、社交密集等不确定因素较强的场景,容易让他们产生不安全感,因此他们更倾向于参与可重复、有明确规律的活动。“在普通人看来,数据标注或许略显‘枯燥’‘呆板’,需要在电脑上进行重复性操作,但恰恰是这种高度规律、流程可预期的工作特性,与孤独症孩子的行为偏好高度契合。”袁圆说,这门课程也因此成为了适配孩子们特质的职业实践载体之一。

标注车型 受访者提供
数据标注与孤独症孩子们的缘分,要从两年前的一个偶然提议说起。
2023年末,杭州市杨绫子学校与读懂科技有限公司围绕课程平台开发展开交流时,公司联合创始人郭斌从一个新的视角提出构想:部分孤独症人士表现出专注、注重细节等特质,是否可以让这一类孩子尝试数据标注工作?
这一提议迅速得到学校响应,校方先对孤独症学生开展了普选筛查,再结合数据标注所需的认知能力进行针对性测试,最终选拔出7名潜力学生,组建起首个孤独症学生数据标注“实验班”。令人鼓舞的是,在首次实践中,7名学生均顺利完成了任务。他们在细节处理与流程遵循方面的表现,超出了项目团队的初步预期。
首次尝试成功,坚定了学校深耕数据标注教学的决心。经过半年多的实践打磨,学校逐步构建起一套适配孤独症学生认知特点和能力发展的专属课程体系,为他们开辟了一条兼具专业性与可行性的职业新赛道。
2024年2月,该校在职业高中阶段正式设立“数据标注”专业,首批10名学生开启系统化训练阶段。课程设置聚焦市场实用需求,涵盖表格标注、车牌标注、人脸标注等核心方向:以表格标注为例,学生需精准识别图片中表格顶点、交叉点等关键结构并完成标准化标注,为纸质档案电子化、数据数字化处理等领域提供基础支撑。
记者了解到,为了给孩子们提供多元的职业教育选择,学校开设了数据标注、中西面点等8个必修专业和8个选修专业,允许学生每年更换一门主修课和一门选修课。但令人意外的是,选择数据标注的学生们始终坚定地“锁定”这门课,没想过更换。

杭州市杨绫子学校智慧树数据标注中心,孩子们正在上数据标注课 记者 陈卓妤 摄
杭州市杨绫子学校副书记蔡晓凌介绍:“数据标注其实是‘人工智能训练师’这一职业的核心领域之一,要成为专业的人工智能训练师,还需要掌握更多复合技能。咱们日常接触的人脸识别、高速公路实线识别、车辆检测等人工智能应用,背后都离不开大量人工数据标注的基础支撑。”
她提到,目前已有许多专业的第三方服务公司、大型科技公司自营团队以及通过众包平台承接任务的自由职业者参与数据标注工作,但针对特殊教育学生开设职业课程与培养体系,仍处于初步探索阶段。“特殊学生在数据标注领域的职业发展,还有很长的路要走,需要更多社会力量的关注、支持与资源对接,才能为他们搭建起从校园到职场的完整通道。”
版权和免责申明
凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。
