微信近期向部分用户推出“方言采集”返现活动,邀请用户录制各地方言语音并换取现金奖励;报道说,活动目前仍处于邀请阶段,尚未全面开放。 [1]

参与者按提示朗读日常用语,完成语音录入后可领取奖励。根据活动规则,每录满3句可得约1元,每录满20句可得5元。受访者称,单日录制量多在100至200句之间,有人累计拿到数百元,也有人称单日收入约40元。 [1]

微信方面表示,这一项目用于“提升语音识别体验”。有参与者和受访者认为,平台是在收集方言声纹,用于补充语音模型数据。黄一鸣说,方言语音数据“比较缺”,差异也大,补充这类资料可以提高模型在复杂语音环境下的识别能力。 [1]

围绕数据用途,部分网民表达担忧。他们担心方言语音数据可能被用于更广泛的识别或审核场景,涉及个人隐私。余文天表示,如果方言数据只用于把语音转成文字,可以接受;但如果被用于审核方言内容、干预批评言论,就“不好”。 [1]

另一名受访者齐先生说,方言在不同地区差异很大,语音输入若无法识别,平台就难以直接使用。他认为,平台目前主要是在收集声音数据,并可能有助于语音识别和监控。 [1]

中国语言和方言种类超过130种,其中人口不足万人的有68种,人口不足五千人的有48种,人口不足千人的有25种。随着方言样本更分散,相关数据采集和标注也更为困难。 [1]

极目新闻4月10日报道称,微信通过邀请方式向部分用户推送“方言采集”任务。RFA中文4月14日报道后,这一活动引发隐私与语音识别边界讨论。微信目前尚未全面开放该活动。 [1]