一段网上流传的尬聊截屏
浙江在线4月5日讯(浙江在线记者 章咪佳 通讯员 周炜)1995年出生的浙江大学计算机科学与技术学院大四学生焦云皓,因一次出言不慎,在微信上被同窗了16年的好友拉黑,友谊的小船说翻就翻。
他由此想到两个问题:什么人是聊天终结者?怎样对话能避免尬聊?
工科男解决问题的方式是:用大数据说话,让人工智能想办法。
焦云皓开发出一套ConverNet人工智能系统,它在分析一段对话后能作出判断:这一段聊天,是否要终结了。这套AI系统还通过大数据驱动的深度学习方法告诉人类:什么样的语言和聊天方式,有被冠上“尬聊”的风险。
而这项研究的相关论文《找到对话终结者:一个终结聊天回复预测模型的研究》,已被互联网领域的高水平国际会议——国际万维网大会(简称WWW会议)录用。
本月22日,焦云皓将赴会议举办地法国里昂,向学界分享他的研究成果。
AI自学10万组对话
总结聊天是怎么聊死的
焦云皓研究的是社交网络上的聊天,“人们在网络上聊天,会更加自由,一旦觉得没意思了,或者不愉快了,就不再理会。”
他的ConverNet系统,能不厌其烦地“自学”一组一组对话,洞悉人类聊天过程中的细枝末节,学得越多,它就越智能。
在合作导师、美国密歇根大学计算机学院终身教授梅俏竹老师的指点下,焦云皓找到了两个公开的海量数据库,让系统开始“刷题”。
焦云皓说,ConverNe这次学习的都是英文文本。相比中文,英文的语法容易一些,单词量也少一些,人工智能容易分析。“当然,英语语境下的很多尬聊情境,和中文聊天有相似之处,所以一些基本原则,对我们讲中文的人来说,也可以借鉴。”
“社交网络上的聊天,主要分群聊和单聊,这两种都会出现尬聊,但是情况是不一样的。一个数据库类似于中国的‘知乎’,很多人围绕一个话题讨论并且能够相互点评,接近于社交媒体中的群聊模式;而另一个提供的是海量的电影里的对白,接近于单聊。”焦云皓开发的人工智能,对这两种场景都进行了分析。
ConverNet花了半小时,自学了共10万组对话。“通过这半小时的学习,ConverNet自行掌握了一些聊天终结者的特点,接下来,它就可以随机对一组新的对话是否存在终结隐患进行预判。”焦云皓说。
经过海量“自学”之后,ConverNet选择了一个数据库进行自我测试,成绩不错——它的预测准确率达到80%左右,各项指标也优于传统方法。
大段大段的发言
群聊会冷场,单聊受欢迎
今年2月8日下午3点多,焦云皓的微信“叮咚”一响,一个集合了402名北美校友的朋友群里,一位校友发来一条“重型猎鹰火箭发射成功”的消息。
紧随其后的,还是这位校友——从“马斯克发射火箭的壮举”,到火箭上装载的一辆特斯拉上播放大卫·鲍伊的音乐,从车里有一本《银河系漫游指南》,到对人类未来的畅想,洋洋洒洒273个字,像写了一篇热情澎湃的小作文。
可惜的是,从这条消息发出之后的两天里,这个400多人的大群里,无一回复,表情也没有一个。
这正是人工智能分析出的典型“聊天终结者”表现之一:在群聊场合,简短的句子更受欢迎。如果某人突然说了一大段的发言,后面易出现冷场的状况。
“群聊中,没有特别针对性的情况下,大家一般都不会看完这么长的一段发言,不看那也就没有什么可回复的了。”焦云皓说,“日常生活需要高效的聊天。微信里,大家说话一般比较简短,才容易接下去,你一言我一语。”
焦云皓的老爸,也是儿子这项研究的受益者之一。以前,他在微信的各种聊天群中,也爱大段大段地发言,这在一堆短句当中显得格格不入。
“老爸看完论文,微信上发长篇大论比以前少了许多,改发表情包,发短句子,真的不像以前那么容易冷场了。”
但是ConverNet同时分析出来,群聊里,发长文不受待见,但在个聊时,情况正相反。所以另外一条建议是:单聊场合,句子越长,谈话越可能持续,因为双方能够进行深度的交流。
知乎上有个帖子,叫“把天聊死,是一种怎样的体验”,最有人气的回复是这样一段:哥哥弟弟坡前坐,坡上坐着一只鹅,坡下流着一条河,哥哥说:“宽宽的河”,弟弟说:“嗯”。
在一对一的聊天中,“嗯”“哦”这种回答,“杀死”一场聊天事小,可能“杀”出一条单身狗来——女孩子最不喜欢男朋友这样的回应。
最后,焦云皓总结出一些避免成为对话终结者的要义:内容不跑题,快速作回复,阐述要详细,情绪要积极,并注意你的语气,文字表达不到的地方,多用表情包。
焦云皓的本科设计指导老师、计算机学院吴飞教授认为,焦云皓的研究关注到之前没有人关注到的有趣现象,并尝试用人工智能的方式去解答,很有价值。“希望将来有人能够进一步改进我们提出的方法,或者等这个系统学习到更海量的数据,会变得越来越聪明。”
可以期待的是,将来,人们聊天时会有一个智能聊天助手,当你出语不妥,AI会弹出一条提示送你“给你一次重新组织语言的机会”。
正如焦云皓所说,如果这个聊天助手早点出现,说不定他就不会被同学拉黑了。那次他带着同学玩过“王者荣耀”后说:“就你这水平,换作其他人,我才不带他玩呢。”结果,他被拉黑了,后来虽然又加回好友,但再也没一起玩过王者荣耀。
新闻+
ConverNet的小总结
怎样会把天聊死
1、 分享。当对话中出现heard(我听说),seen(我看到过)等词语时,聊天易持续长久,这些词汇体现了分享的愿望;而当出现Christ(天呐),but(但是),ass(屁)等词语时,聊天终结的概率会明显增大。
2、 回合。在单聊场合,聊天的回合越多,越可能终止对话;而在群聊过程中,回合越多代表话题越热烈,越有可能持续。
3、 时间。如果你发起对话时间在诸如深夜、清晨等休息时间,容易引起对方反感,也有可能造成尬聊。
4、 情绪。群聊中,负面情绪有可能会引发新一轮的共鸣与探讨,但在单聊中,负面情绪可能会倾向于终结对话。
看浙江新闻,关注浙江在线微信
凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。