计算社会学并非新生事物,世纪之初西方学界就有过热烈的讨论。近年来,随着计算机算力和算法的提高以及互联网资源的爆炸式增长,其对主流社会学发展的想象力助推和疆域拓展,开始加速呈现出实质性的作用。和传统的依赖调查数据和回归模型的定量分析范式不同,计算社会学聚焦宏观经济社会现象和复杂网络现象与复杂社会过程,其主要方法手段包括网络分析、仿真建模、机器学习以及高级计量模型,主要数据来源则是大数据和其他多来源非调查问卷数据以及各种数据的组合。

我国社会学界近年来利用计算方法开展的研究日益增多。较之西方社会学界,中国的计算社会学的发展并不显落后。相反,在部分领域还初步形成了中国特色的分析模式和数据挖掘渠道。中国计算社会学的发展,充分证明中国社会学家具有当代学科交叉融合的视野和格局,以及引领全球社会科学发展的潜力。

中国计算社会学发展,呈现出理论关怀、本土化自觉和实证导向高度统一的特征。人们对于计算社会科学的刻板印象在于,使用计算社会科学方法的学者,似乎容易对理论关心不够,或忽视本土范式,或仅重视数据挖掘,或仅醉心于模型因果推断。但实际上,从定量社会学研究的传统走出的一刹那开始,从事计算社会学的学者们,就保有对传统定量研究方法的高度反思。这也使得新学科发展伊始,就能够始终立足于理论、立足中国,实现计算社会学的理论—数据二元驱动。

这种具有强烈理论关怀和本土化自觉的计算社会研究特征,表现在三个方面:

第一,中国的计算社会学研究既对国外计算社会学最新理论和成果进行及时引介和学习,更对计算社会学的本土化发展方向和实现路径进行了高度自觉的思考。一批社会学者从西方计算社会学的既有研究成果以及发展历程、互联网对社会学研究对象和范式带来的变化,以及计算社会学的应用、价值和本土化实现路径展开了广泛的理论讨论。随着讨论的不断深入,中国计算社会学在方法论层面的意义以及其与社会理论、本土化的关系日益清晰,并形成了相当多的共识。总体上,学者们一致认识到,当代中国的“计算社会学”,在发展时空和情境中具有天时地利人和的诸多优势,从一开始就不是对西方社会学的亦步亦趋,更不是用西方理论、概念来生硬解释、模仿套用中国社会现象和社会过程。计算社会学者的学科自信,既来自于对数据和方法的娴熟掌握,更来自于对传统社会学定性定量之争、理论实证之争、国际化本土化之争的深刻反思。

第二,中国的计算社会学研究既充分挖掘本土各类大时空跨度的数据,更具备了主动剖析世界、研究异国的视野格局。除了利用计算方法分析中国的社会互动、社会治理、文化传播、文化史、城市史、学科发展史等之外,国内社会学者主动将研究目光聚焦于其他国家的历史与现实,对一些重大理论和现实问题进行了探索。其中,南京大学、清华大学、武汉大学团队利用大数据对美国的宏观经济和社会心态、自杀行为、全球政治话语等的研究,都以中国学者的方法和视野,剖析了当代全球复杂社会过程与现象。尽管目前这批研究成果数量还不够多,但已经开始改变以往西方研究中国多、中国研究西方少的现象,让中国社会学走出习惯聚焦本土而忽略不同文化、经济和政治体制下社会研究的旧有模式,探索出了一条用中国话语和中国理论来解释世界的学术新路。

第三,中国计算社会学研究既高度倚重大数据和复杂数据的信息量,更具有贯穿始终的强烈和彻底的理论关怀。在近年来现有的对中国、美国等社会的历史和当代研究之中,学者充分发挥大数据对于大时间跨度、大空间跨度和海量、准确的信息优势,对社会学中广为人知的诸多经典理论、经典假说和当代理论进行了充分的实证检验。从研究构思看,检验、批判和拓展传统大理论,构成了计算社会学者的理论思考出发点。例如,基于百年书籍大数据,学者对马克思阶级理论在20世纪发达资本主义国家的指导意义进行了有力验证;对自杀模仿现象也即“维特效应”是否仍然能够通过书籍在20世纪社会继续发挥作用进行批判。类似地,基于互联网搜索大数据,学者对20世纪“文化反哺”现象发展为当代互联网“代内文化反授”现象进行了系统理论阐述和理论驱动的定量研究。

除了理论关怀、本土化自觉和实证导向高度统一的特征,当代中国计算社会学的发展,还给我们带来了一个惊喜:宏观定量社会学。长期以来,社会学定量研究均基于个体调查数据样本,而对宏观层次往往绝少问津。其原因有二:第一,巧妇难为无米之炊。宏观分析往往关注较长的历史跨度、较大的地理跨度。而社会学基于“人”和“人群”的宏观指标,既难有客观测度,更难以像经济学基于“经济现象”的宏观指标那样,有专业的国家机构来统计梳理。反观宏观经济学者,则常常能够利用多国、全国各省市的经济统计数据进行时间序列或面板数据分析。第二,生态谬误的矫枉过正。塞尔文(Hanan C. Selvin)于1958年提出生态谬误的概念之后,社会学家总是担忧汇总数据可能带来和个体层次数据不同的结论。加之入户问卷调查技术的成熟,使得社会学家自20世纪50年代开始就投入到聚焦个体的微观数据中去。这个社会学的调查革命,使得社会学领域的定量学者在微观数据搜集和分析方面突飞猛进,但付出的代价则是逐渐失去对宏观层次社会现象的关注,导致定量社会分析的视野进一步窄化而不自知。

但大数据和计算社会方法的出现,为宏观层次的社会学定量分析,提供了重要的数据资源。从各种大数据以及计算社会方法(如网络分析、监督学习、无监督学习等)中生成的各类宏观地域指标,能够为拓展社会学分析视野、提升社会学想象力和检验各类宏观假说和大理论带来空前的机遇。在这方面,中国的计算社会学研究者对公共健康、舆情与经济、历史知名度与投资等领域进行的县级、市级、省级和国家级的量化分析,多使用了时间序列模型、面板数据模型等以往定量社会学分析较少使用的模型工具,以从大数据中构建出的社会指标作为因变量或自变量,为宏观定量社会分析模式的确立,进行了大量的探索。与此形成反差的则是西方社会学界,缺乏对这一独特领域的关注。

除了本土化的独特意义,中国学者所进行的这类研究,实际上是在传统定量社会学分析的回归模型模式和计算社会学的复杂分析模式之间,构筑起一个“桥接过渡”的重要领域。也因此,宏观定量社会学的特征可以用“两部曲”来概括:首先,从海量数据中利用计算社会方法,提取或构建出可以用传统计量回归模型直接加以使用的宏观社会指标。其次,利用传统计量回归模型,特别是面板模型和时间序列模型,实现宏观层次的关联分析和因果推断,从而进一步实现理论观照与定量分析特别是计算社会分析方法的高度融合。这个“大一统”式的融合,意味着计算社会方法和大数据,同样可以为具有传统定量社会分析训练的广大学者所使用和驾驭,同样具有从海量信息和复杂过程中发现、识别因果规律的巨大潜力。

中国计算社会学的发展势头可喜,但仍待在教学体系打造、学术团队培养、学术阵地打造和跨学科深度合作等方面取得更为实质性的突破。尽管计算社会学的发展和中国计算社会学的突破还远远不够成熟,但计算社会学研究体现出的理论和实证、中国和全球、方法和视野的大一统、大融合优势,已经逐渐凸显。无论是社会学理论工作者、实证研究者,都应该以开放、包容的眼光来研读和期待这一新领域。

(作者单位:南京大学中美文化研究中心)