您当前的位置 :浙江在线 > 浙江新闻 > 浙江纵横 正文

潮声丨1.5万人报名6400小时录音,让AI读懂“加密语言”温州话

字体:
—2026—
04/28
08:11:27
2026-04-28 08:11:27 来源:潮新闻 执笔 黄心怡 项锐

  “天光喫何乜(早上吃什么)?”

  “訾哪能啊(怎么样啊)。”

  “乐事险(很合适)。”

  ……

  通过这些汉字,你能猜到这是哪里的“加密通话”吗?没错,这就是被广大网友称为“最难懂方言”的温州话!

  据温州地方统计,全域日常使用温州话(瓯语)的人口约520万。这门留存古百越语底层、主体承继中古吴语、受闽语深度影响的方言,因调类繁复、缺乏全民通用的标准化注音体系,渐渐有了代际传承断层的迹象。

  为了让难学难懂的温州话更好地传承下去,在浙江大学文学院指导、阿里巴巴AI data团队与国家语言文字推广基地(温州大学)的联合支持下,浙大城市学院于3月底发起了“温州方言系统化采集工程”,全网招募会说地道温州话的网友参与录音,用AI技术将千年乡音定格为永久的“数字声音档案”。

  这是全国范围内“方言系统化采集工程”的一部分。该工程是由全国多地高校、科研机构与科技企业联合推动的‌大规模、数字化、AI导向的方言保护行动‌,于2026年2月启动,旨在通过现代语音技术为濒危方言建立永久“数字声音档案”,并训练人工智能模型实现地道方言识别与合成。

  目前,在浙江,杭州和温州方言系统化采集工程已完成采集,处于数据分析阶段;宁波方言采集工程正在进行中。在全国,西安、太原、开封、长沙、漳州等地也在陆续推进方言系统化采集。

  跨越代际的“方言接力”,高峰期每天3000位温州人在线录音

  “太感谢家乡人民的热情发声了!项目刚启动几天就已经超预期完成目标。”作为温州籍学者,温州方言系统化采集工程首席专家、浙大城市学院外国语学院教授‌姜淑珍已经忙碌多时。

  在这一项目启动前,浙江大学文学院副院长、教授史文磊和姜淑珍就已在今年2月牵头完成了杭州方言系统化采集工程的语料收集。不到10人的主创团队,连春节假期都持续推进项目,全程在线审核录音,最终在3000名热心市民的贡献下,收获了总时长2500小时的杭州话语料。

  团队把麦克风对准杭州老城区及西湖周边龙井、梅家坞一带,尽量收集原汁原味的杭州腔。参与对象也十分广泛,在初筛环节中,年纪最大的市民超过85岁,最小的只有11岁。

  温州方言系统化采集工程首席专家、浙大城市学院外国语学院教授‌姜淑珍。记者 黄心怡 摄

  珠玉在前,姜淑珍团队在温州话的项目设计阶段就更有经验。考虑到温州市域范围内方言差异大,为保证录音采集质量,姜淑珍团队建立起一套规范、严谨的采集与审核体系,将录音者招募范围限定在鹿城、瓯海、龙湾、瑞安、永嘉五个县(市、区),按照鹿城区的表达习惯来设计录制文本。

  团队梳理了近10万条语料用于录制,包括但不限于生活用品、日常对话、俗语等。“写字眼”(写字)、“糯柿”(柿子)、“钞票进来”(赚到钱)、“手机买来新几日就逿逿爻”(手机刚买了几天就丢了)……这些和老百姓生活息息相关的词句,每一条都须经过“人工初筛+算法初审+人工复核”的三重检测,才能进入最终的语料库,用于AI训练。

  项目组成员在后台复核录音。记者 黄心怡 摄

  项目一经公布,便引起温州市民的广泛关注。1999年出生的温州瓯海姑娘小千(化名)于4月1日晚通过录音初审,之后的半个月里每天都花两三个小时参与线上录音:“我从小到大都生活在温州话的语言环境里,在说方言这一块可谓是‘吾辈楷模’!”小千还将报名链接推给了外婆、妈妈和表妹,一家子都投入其中,甚至“PK”起过审录音数。

  “到4月14日项目收官为止,我已经完成了15984条音频的录制。”小千骄傲地展示自己收到的电子版荣誉证书,“通过此次录音,我更加坚定了自己要在生活中多说温州话的想法。”

  参与项目的市民收到荣誉证书。受访者供图

  姜淑珍介绍,20岁以下人群试录音过关率还不到30%,报名人数也是最少的,大部分优秀录音的贡献者还是30—60岁的中青年人。有一位60多岁的市民潘阿婆,从3月底就主动报名录音,总时长近20小时的录音里,她一句话都没读错,让项目组成员肃然起敬。

  还有一位80多岁的市民朱老伯,听闻有机会参与温州话保护,他将自己多年来梳理的厚厚一沓温州俚语资料,带到温州市新闻传媒中心转交给项目组。“这些话再不记下来,可能再过十年就没人知道了。”朱老伯感叹,自己能帮一点是一点。

  截至4月15日,项目共收到1.5万市民报名,51%的市民贡献了有效录音。在4月中旬的推进高峰期,每天最高有3000人在线上传录音。原定2000小时的采集目标,因市民热情一路提升至超6400小时,工作量远超预期,项目组成员笑称“肝不动了”,但看着越来越多的语料入库,大家心里也越来越有底气。

  温州市民在线参与录音。受访者供图

  由点及面,让方言“活”在数字时代

  在招募录音市民的过程中,项目组还发起了问卷调查,其中有一些“扎心”的数据,将温州话代际传承的困境摆到了台面上。对于20—30岁的受访者来说,超过六成人群表示几乎全程和家里长辈说温州话;但在回答“是否会和你的平辈说温州话”时,只有不到四成的人选择了“是”;并且,仅有13%的人会和自己的晚辈说温州话。

  “温州话中‘菜肴’一词和‘蔬菜’一词使用的是两个不同的词形,分别是‘配’和‘菜’,但是普通话中无此区分,统一说‘菜’。在试录音环节中,我们发现很多年轻人把‘买配’(买菜肴)说成‘买菜’,这体现了普通话对方言词汇的影响。”项目组核心成员、北京大学中文系博士生蔡浩昌深有感触:“足见这些温州话固有词已经慢慢从年轻人的语言系统里消失了。”

  蔡浩昌是来自温州鹿城的“00后”,说着一口流利的温州话,这在同龄人中并不多见。他至今记得初中时的一次经历。当时,他和同学在街头开展宣传活动,面对上了年纪、不会普通话的温州人,同学们无法用方言沟通,甚至听不太懂对方的意思。

  这种现象不是偶然。专注通过温州方言传播温州传统文化的自媒体博主叶一戈告诉记者,从上世纪九十年代开始,许多温州人为了让孩子学好普通话,主动改成普通话交流,以致把方言传承最核心的家庭土壤给丢了。“并且,现在小家庭生活越来越普遍,孩子很少和长辈同住,俚语谚语口耳相传的语境越来越少;再加上电视网络普及,年轻人从小泡在普通话的视听语言里,温州话的生存空间被一点点挤没了。”

  叶一戈并不想就这样看着温州话渐渐被年轻人淡忘,在自己的自媒体工作之外,他还在温州市瓯海区新桥街道党群服务中心做起了温州方言学习班的讲师。这里的学员,有不熟悉准确发音的温州人,有在温州工作的天津人、重庆人,还有来自湖南的温州女婿。

  “刚才我听见有朋友翘舌音了,记住,温州话不翘舌,也不分前后鼻音,但是有普通话里没有的浊音。”叶一戈讲解道,以“医”和“夜”为例,这两个字在鹿城都读平调、韵母完全一样,唯一能区分两个字的核心,就是声母的清浊差别:前者是清声母,读〔ʔi〕,音节开头喉咙收紧、声带不振动,有紧喉感;后者是全浊声母,读〔ɦi〕,音节开头就带声带持续振动的摩擦感。二者听感差别虽细微,却是温州话里区分字义的关键,对应完全不同的意思。

  新桥党群中心的温州话学习班。记者 项锐 摄

  讲师叶一戈讲解温州话日常词汇。记者 项锐 摄

  在项目推进过程中,叶一戈不仅提供了将近一万字的温州方言文本,还在自己的账号“大蒙讲温州”上推广,手动给六百多个感兴趣的粉丝发了链接,连家里75岁的姑奶奶和90多岁的奶奶都被拉来参与。

  放到AI时代背景看,温州方言系统化采集工程还有更深远的价值。国家语言文字推广基地(温州大学)副主任、温州大学人文学院副教授骆锤炼认为,温州话保留了大量古汉语特征,还有古百越语的底层词汇,补充这样的方言语料,能帮AI更好理解汉语的多样性,甚至能发现更多之前没注意到的汉语演化规律,这是单纯的学术保护工程做不到的。

  不过,亦有市民不舍得“加密”温州话被AI破解。还有人抛出疑问:“口耳相传都难了,数字保存还有意义吗?”温州大学人文学院副教授蔡嵘表示,方言保护不一定非要让所有人日常都用温州话,核心是留住文化根脉——所有的俚语、谚语、民间故事、地方戏,都依托方言存在。一旦方言陨落,这些文化记忆也就跟着没了。因此,用数字技术将方言定格下来,哪怕几十年后活态使用没了,后代还能与AI对话,听到地道的乡音,还能找到自己的文化根。

  一些常见字在温州话里的读音。记者 黄心怡 摄

  或许在不久的将来,我们会看到越来越多的AI应用、智能设备、教育工具、公共服务设施等支持方言使用场景,让丰富多彩的方言真正实现活态传承。

版权和免责申明

凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。

标签:潮声;温州话责任编辑:吴珂珺
融媒产品
浙江宣传
小新说
群众工作室
90早新闻
精品专题
更多资讯

据温州地方统计,全域日常使用温州话(瓯语)的人口约520万。这门留存古百越语底层、主体承继中古吴语、受闽语深度影响的方言,因调类繁复、缺乏全民通用的标准化注音体系,渐渐有了代际传承断层的迹象。