大数据时代的计算舆论学在智媒时代带你看“透”大数据的真相

来源:bob体肓官网入口 发布时间:2024-03-31 11:46:31 阅读: 1

  在互联网流行初期,有这样一句很流行的话:你永远都不可能知道,与你聊天的对面,是一个人还是一只会打字的狗。

  随着社交与智能媒体的发展,“和你聊天的,是人还是机器人?”这一问题更具有现实性。

  在政治、经济、文化生活等领域都有社交机器人的行迹。各类政治团体出于其政治目的,在社会化媒体平台上大规模地开发并部署社交机器人,传播有利于己方的信息,其中不乏营造虚假民意支持的信息,借以操纵舆论并影响政治走向。

  英国脱欧在英国脱欧的讨论中,最活跃的脱欧派与留欧派账号都是机械转发新闻的机器人。

  2017年德国大选七个党派Twitter账号的关注者中,社交机器人的数量所占比例从7.1%增加到9.9%。

  除此之外,社交机器人也被用于实现良善的目的,例如,科学家曾设计个性化社交机器人用于科普,以期对吸烟者进行个性化干预,提升公共健康意识。

  在众声喧哗的今天,在“人与社交机器人”共生的状态下,舆论变得更纷繁复杂,舆论是怎么产生?如何被利用?计算舆论学的兴起有着什么特殊意义?计算舆论研究的进展如何?

  周葆华,复旦大学新闻学院教授、博士生导师、副院长,新媒体传播专业硕士项目主任,兼任复旦大学信息与传播研究中心研究员、复旦大学国家发展与智能治理综合实验室研究员。主要研究兴趣为新媒体传播、计算与智能传播、受众与传播效果、舆论研究等。在New Media & Society、International Journal of Communication、《传播与社会学刊》、《新闻与传播研究》等国内外核心期刊发表论文数十篇。获教育部人文社会科学优秀成果二等奖、上海市哲学社会科学优秀成果一等奖等数十项科研奖励,以及复旦大学本科生“我心目中的好老师”等荣誉。

  大数据和计算方式的出现正在影响和改变着社会科学的版图,这中间还包括舆论研究。计算舆论学既是舆论研究的前沿领域,也是计算社会科学及倡导文理交叉融合的“新文科”发展的重要组成部分。

  17位计算舆论研究代表性学者,围绕12个计算舆论学主题,抽丝剥茧、层层深入地再现专题研究的全过程。为了让初学者更快更好地“进入”计算舆论学,本书做了很多“友好”的努力和独树一帜的尝试:理论背景、研究设计、延伸阅读、数据代码、思维导图等,都是体现。

  面向研究领域,本书将为舆论学研究者提供最新的理论和方法;面向计算方式,本书将为大数据研究者提供理论与方法结合的示例和真正“上手”的实践指引;面向专题研究,本书将为有志于量化实证和计算社会科学研究的人员提供严谨范本。

  何谓舆论?舆论是公众针对公共议题、事件或人物的意见表达过程与结果。针对舆论研究侧重“过程”还是“结果”,在舆论研究的历史传统与现实实践上,存在两条不同的“河流”。

  其中一条偏向静态“结果”,可称之为大众意见式的舆论研究。它所关注的是在特定时间点上的意见分布,即基于个体的意见表达(通过民意调查等方法)获得聚合层面的结果,呈现为针对舆论议题、事件或人物的意见分布(例如多少人赞成某种政治观点或支持某个政治人物),而并不关心这些意见及其分布是基于何种过程所生成与演变。

  大众意见式的舆论研究自20世纪以来获得长足发展,专注这一取向的舆论学者们通过持续不断的发展和优化抽样调查方法与统计技术,增进大众意见调查的精度。以美国芝加哥大学民意调查中心(NORC)、皮尤基金会(PEW)、盖洛普(Gallup)、零点等著名民意调查机构为代表,积累了大量关于舆论调查的成果,成为舆论研究在公众认知中的主要“意象”。

  将舆论作为特定时间点的大众意见分布只是舆论研究的一条“河流”,另一条则是将舆论视为一种动态的社会过程。这一传统所关心的不仅是民意在特定时间点的分布,而且聚焦舆论生成与演变的过程,即舆论因何而生、何以变化、直至最终的消亡(议题结束或被取代)或稳定(意见保持均衡不变状态)。

  互联网等新媒介技术的发展,特别是社会化媒体、移动媒体、智能媒体的兴起,深刻改变了舆论生态。舆论表达的主体更多元,空间更广阔,过程更可见,机制更复杂。可以说,舆论研究,特别是网络舆论研究也进入了数据量更大、形态更复杂的大数据时代。与传统依赖问卷调查、小样本控制实验、焦点小组访谈等方法不同,大数据时代在数据、方法和模型三方面都为计算舆论学的兴起与发展提供了契机与条件。

  数据大数据时代,人类的舆论表达在网络上留下了大量的“自然”数据,即关于态度、意见和情绪表达的数字足迹。相对于传统舆论研究所采用的问卷调查法,大数据不依赖标准化问卷的询问和被访者的自我报告,而是意见表达主体日常化、“自下而上”的表达行为记录。

  方法对于计算舆论学的发展,与数据同等重要的是计算方式的发展。计算社会科学中的主要方法均应用于舆论研究领域,包括文本挖掘、行为挖掘、在线实验、在线档案等。

  模型“计算舆论学”主要指向的是计算方式的运用,但由于它文理交叉的跨学科特性,也可为传统社会科学视域下的舆论研究带来理论资源与视野的拓宽。传统社会科学取向的舆论研究主要在传播学及其相近的社会科学理论层面发展其概念与理论,计算舆论学则将物理学、计算机、复杂系统科学等不同学科关涉舆论的研究模型带入。

  基于计算方式的舆论研究不仅有助于理解网络“大众意见”,还能够极大地促进作为社会与传播过程的舆论研究。

  刻度之变传统上长时段追踪式的舆论研究,例如盖洛普的MIP调查数据刻度以月为单位,已属相当不易,由于大数据记录格式是自然式地采集,可以更为容易地获取不同时间点,并且时间刻度可以精准到天,甚至更小的时间单位,从而能够精确刻画议题、意见或情绪演化的过程。

  在线讨论网络及其动态演化社会过程式的计算舆论研究的另一个重点是,打破大众意见式舆论研究分割看待意见表达主体的思路,强调公众之间的交往、讨论与辩论过程,致力于考察在线交互、讨论的网络结构及其动态演化。

  舆论过程的跨层次动力机制舆论是一个跨越微观、中观、宏观的多层次社会过程。这方面的理论代表之一是“沉默的螺旋”。虽然该理论勾画了从个体到整体的舆论动态过程,但传统研究只是进行局部性研究。随着多主体模型仿真模拟等计算方式的兴起,为理解沉默的螺旋这一跨层次模型的舆论动力机制提供了新的契机。