打开网易新闻 查看精彩图片

作者 | 蒋宝尚

编辑 | 陈大鑫

自今年年初疫情爆发以来,中国话题一直成为国际媒体领域的热门话题,有好有坏;这些话题内容也让我们见识到了国外媒体的无底线、无节操。

那么,自然而来一个问题:如何用数据来理解国际社会中的“中国形象”?

清华大学计算机系自然语言处理与社会人物计算实验室与新闻与传播学院金兼斌教授课题组,近期合作完成了一篇相关研究: “以中国为例的COVID-19疫情期间国家形象” (Country Image in COVID-19 Pandemic: A Case Study of China)。

这篇文章收集了Twitter平台上关于中国的相关文本,并对之进行了属性级别的情感分析,进而探索了疫情期间英文推特上不同群体视角下的中国形象。除此之外,他们还进一步阐释了这些现象背后的机理以及发展趋势。

1

所谓国家形象,即公众对一个国家的看法,涉及政治、经济、外交、文化等多个方面。

正如个人形象影响个人前途,国家形象对一个国家的国际关系和经济发展也有着十分重要的影响。

近些年来,随着中国的快速发展及其在全球影响力的不断提升,中国的国家形象不断发生改变,而2020年的新型冠状肺炎疫情爆发进一步在全球范围内改变了中国形象。

因此,深入了解疫情期间中国形象的特点与变化,对于应对后疫情时代我国对外传播的新形势具有至关重要的作用。

此前的国家形象研究,大多数基于新闻媒体数据,以新闻报道的框架作为国家形象的体现。随着社交媒体的发展,研究者们开始直接从社交媒体平台中的公众言论分析国家形象。

然而,他们往往只关注到了,国家形象相关的总体议题分布或总体情感分布。而实际的国家形象纷繁复杂,涉及到政治、经济、外交等多种属性,因此,对国家形象采取更细粒度的属性级别情感分析是十分必要的。

在此次新冠疫情全球化爆发背景下,来自清华大学计算机系和新闻与传播学院的陈慧敏、朱泽宇等人,利用推特平台疫情相关数据,构建了一个包含细粒度属性级别情感标注的中国形象数据集。他们随后用 BERT 模型实现了属性级别的情感分析,从而实现细粒度的国家形象挖掘。

2

从研究结果总体来看,疫情期间推特平台上的公众,对中国的整体情感经历了由“非负面为主”向“负面为主”的转变。

换句话说,推特上的中国话题越来越负面。

打开网易新闻 查看精彩图片

图1:疫情期间,Twitter平台上公众对中国的整体情感

研究者分析认为,有两点主要原因:

(1)推特上,以非负面情感为主的有关中国疫情及抗疫行为的信息,比例在不断减少;

(2)而以负面情感为主的有关中国政治、外交以及种族主义等意识形态的讨论,在不断增加。

研究者分别从 5 个方面分析了造成这一局面的具体原因,包括政治、外交、疫情状况、检测和种族主义

1.、疫情信息整体不错,政治外交很彻底地负向

打开网易新闻 查看精彩图片

图 2:1~5月期间,5个方面整体上的负面/非负面情感

如上图所示,从今年1月份到5月份,期间疫情信息整体来说为非负面情感,但涉及到政治、外交和种族主义,则显得绝对负面。

2、 疫情信息在消失,政治却是永恒话题

打开网易新闻 查看精彩图片

图 3:各属性推文比例变化曲线

从上图中可以看出,随着中国疫情的逐渐转好,关于中国疫情及检测的信息逐渐下降;而与之对比,政治问题是永恒话题,外交热度则不断提升,种族主义则是一波接着一波。这也解释了为什么总体情感由非负面转向负面。

3、政治,完全负面;新冠检测,好就是好

图 4:五个方面的负面/非负面情感变化
打开网易新闻 查看精彩图片
图 4:五个方面的负面/非负面情感变化

如上图所示,在五个属性方面,政治方面的信息全部为负面,从未改变;外交上也是类似,负面占据了绝大多数,且基本没有起伏。而作为对比,我国疫情防控,基本上让世界范围内的群众都感到了满意。

研究团队还进一步细分,探究了不同类型的推特用户对中国形象的呈现,包括美国两党议员、英美媒体以及社交机器人。

4、 共和党情感更为负面

从下图中可以看出,美国两党议员均比较关注中国的政治与外交。民主党人对种族主义问题非常偏爱;而共和党则主打政治与外交。

打开网易新闻 查看精彩图片

图 5:美国两大政党的国会议员每天在各属性方面的推文数量。

就情感而言,民主党人一度以非负面情感占上风,但随着大选的临近,负面情感开始逐渐增多。

相比于民主党人,共和党人表达的情感是非常鲜明的负面。而且是从3月上旬突然飙升。

打开网易新闻 查看精彩图片

图 6:美国两大政党的国会议员每日情绪统计。

5、英美媒体,还行

从下图中可以看出,英美媒体在关注议题上,基本相同。

打开网易新闻 查看精彩图片

图 7:在五个属性方面,媒体的每日推特计数

在情感上,英美媒体以非负面情感为主。但值得注意的是,随着时间的推进,非负面情感越来越少,而负面情感所占比例相应增加。媒体理应保持理性客观,因此这一现象值得警惕。

打开网易新闻 查看精彩图片

图 8:媒体发布推特的情感变化

6、媒体难以影响公众,预示民粹主义盛行

从下表中可以看出,公众在六个方面都能影响媒体的关注焦点。

反过来,媒体在疫情、新冠检测以及种族主义等方面也能或多或少影响公众对中国的讨论,但在政治和外交这两个方面却无能为力。

打开网易新闻 查看精彩图片

图 9:美国媒体推特与公众推特的格兰杰因果关系检验结果。F 统计量越大,p值越小,效果越显著。

而在情感上,媒体和公众则更不能相互影响,如下表所示。一个重要原因可能是,西方世界民粹主义逐渐盛行。

打开网易新闻 查看精彩图片

图 10:媒体与公众之间在负面/非负面的相互影响

7、社交机器人比真人更负面,引人深思

社交机器人比普通用户更倾向于发表有关中国政治与抗疫行为相关内容,且其情感在疫情信息、抗疫行为与种族主义等属性上更为负面。

图 11:机器人发推与一般用户发推数量的百分比
打开网易新闻 查看精彩图片
图 11:机器人发推与一般用户发推数量的百分比
打开网易新闻 查看精彩图片

图 12:相比来说,社交机器人在中国形象各方面的发推情感更为负面。这里以负面为“1”,非负面为“2”。

3

以上研究结果从深层次揭示了过去数月中,国际上(以Twitter为主)对中国情感的变化。如果我们日常关注国际事件,那么对于每个变化背后的原因,我们应该都能够猜到相应的事件和原因。

除此之外,更重要的是, 在学术层面上,这项研究是首次将计算机科学中的“属性级别情感分析”技术应用到社会科学研究中,为计算机科学和社会科学的深度交叉融合提供了案例。

据了解,研究中构建的有关中国形象的属性级别情感分析数据集目前已经公开。

目前该研究已经发表在《美国电气工程师学会大数据学报》(IEEE Transactions on Big Data)上。

论文链接:https://ieeexplore.ieee.org/document/9195107/

这篇文章的通讯作者为清华大学计算机系刘知远副教授。新闻与传播学院博士后陈慧敏、硕士生朱泽宇为共同第一作者。共同作者包括计算机系博士生岂凡超、本科生叶奕宁、孙茂松教授与新闻与传播学院金兼斌教授等。

打开网易新闻 查看精彩图片

刘知远是清华大学计算机科学与技术系长聘副教授。他分别于2006年和2011年从清华大学计算机科学与技术系获得工学学士学位和博士学位。他的研究兴趣包括自然语言处理与社会计算。他已经在国际期刊与会议上发表了超过80篇论文,包括ACM Transactions、IJCAI、AAAI、ACL和EMNLP等。

打开网易新闻 查看精彩图片

陈慧敏是清华大学新闻与传播学院博士后,她从清华大学计算机科学与技术系取得博士学位。她的研究兴趣包括自然语言处理与社会计算。她已在ACL、EMNLP、IJCAI等国际学术会议上发表了数篇论文。

打开网易新闻 查看精彩图片

朱泽宇是清华大学新闻与传播学院硕士生。他的研究兴趣包括计算社会科学、传播效果研究以及国际传播。