首页 >> 跨学科 >> 社会与人文
第四研究范式:大数据驱动的社会科学研究转型
2020年05月15日 17:00 来源:《学海》 作者:米加宁等 字号

内容摘要:

关键词:

作者简介:

Fourth Research Paradigm:Transformation of Social Science Research Driven by Big Data

  作 者:米加宁/章昌平/李大宇/林涛

  作者简介:米加宁,哈尔滨工业大学管理学院教授;章昌平,哈尔滨工业大学管理学院博士研究生,桂林理工大学人文社会科学学院副教授;李大宇(通讯作者),哈尔滨商业大学财政与公共管理学院讲师;林涛,哈尔滨工业大学高等教育研究所、哈尔滨工业大学发展战略研究中心讲师,哈尔滨 264209

  原发信息:《学海》第20182期

  内容提要:大数据在社会科学研究领域的应用使社会科学研究正在经历从定性研究、定量研究、仿真研究向大数据研究的第四研究范式转型。第四研究范式缓解了已有社会科学研究用通则理论和简单数量关系来解释复杂社会现象,用小数据小样本来外推复杂的社会因果关系,用有限数据来模拟复杂信息条件下的宏观涌现等问题。这样第四研究范式就突破了传统社会科学研究目标弱化、学科学派对立、有限数据质量和统计偏误等的局限性。大数据通过对个体化、全样本的研究,为社会科学提供了精准的数据和计算实验平台,重建了社会科学预测的可能性,推动了社会科学宏观理论研究的发展,促进了社会科学内外部学科之间的融合,形成了社会科学知识体系多元化集成和拓展,是社会科学方法论的革命和认识论的跃迁。社会科学四个研究范式之间并非是相互替代的关系,它们都是我们进行社会科学研究的有效工具,但第四研究范式将为已有社会科学研究提供更高的数据起点和更广阔的方法论视角,同时也要求我们加速数据开放,注意数据伦理问题,构建跨学科合作网络,缔结基于大数据研究的科学共同体。

  关键词:社会科学/大数据/第四研究范式/方法论

  标题注释:本文系国家社会科学基金重大项目“数据科学对社会科学转型的重大影响研究”(项目号:17ZDA030)的阶段性成果。

 

  随着互联网、云计算和物联网技术的发展,社会信息化和智能化程度不断加深,数据充斥着整个世界并“渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素”。①由此大数据(Big Data)发展得到全球性的广泛关注,并深刻地“变革我们的生活、工作和思维”。②作为新的流行语,大数据存续时间并不久远,也没有形成统一、明确的概念,但从近几年出现的大量文献来看,已经成为当前哲学、自然科学和社会科学领域关注的重要问题。目前,对大数据的研究主要集中在“技术”“资源”和“应用”三个方面:(1)从技术上分析大数据获取、存储、分析、处理、管理和应用等技术手段;(2)从资源上分析国家或企业战略、商业利益、产业发展、产权和法律问题;(3)从应用上分析其在商业、金融、医疗、社交、科研等领域的集约型、智慧型转变和创造新的价值。

  在大数据时代,人们需要借助专门的思想和手段,从大量看似杂乱、繁复的数据中,收集、整理和分析“数据足迹”,以支撑对社会的预测和规划,以及进行商业决策等。“‘大数据’之‘大’,并不仅仅指‘容量大’,更大的意义在于通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来‘大知识’‘大科技’‘大利润’和‘大发展’”。③其中科学研究领域的应用既是大数据的重要来源,也是大数据发展的主要方向,更在认识论、方法论、伦理学等层面深刻地改变着科学哲学和技术哲学。

  从科学哲学的层面来讲,大数据的出现正在促进科学研究范式的转变。吉姆·格雷(Jim Gray)总结认为,人类科学研究经历了实验、理论和仿真三种范式,目前正在进入“数据密集型科学发现”的第四研究范式。④在今后的科学发展中,基于“数据探索”的研究范式不仅能够模拟仿真,还能分析总结并得到理论。与格雷的立场相似,美国国家科学基金委员会(NSF)等6部门联合推出的大数据计划也旨在提升从大量复杂数据中获取知识和洞见的能力。马克·普林斯基(Marc Prensky)⑤、伊安·斯特德曼(Ian Steadman)⑥、罗伯·基钦(Rob Kitchin)⑦等也认为第四研究范式已经出现,对现有的科学研究范式构成挑战,科学研究正在进入基于大数据发现的新的研究实践。雷·常(R.M.Chang)等则认为大数据的出现为科学研究范式的转换提供了可能,与格雷等观点相异的是,他们认为科学范式的转向是可计算社会科学而不是探索性科学。⑧

  在社会科学研究领域,推动变革的重要因素同样是“每一个研究领域拥有大量信息化的数据”,这将促使“大部分人文社会科学走向具有自然科学的特征”。⑨这是在社会科学研究领域对大数据将会带来革命性变革的重要预言,必然会对传统社会科学的研究产生巨大冲击。尽管大数据能够弥补社会科学产出不足的诟病,推进其“科学性”“计量性”的发展,但社会科学界对是否接受这项挑战似乎还在犹豫不决。从社会科学的“小数据辅助”研究传统向对“大数据发现”研究范式的转换,是否提供了一种新的研究框架?是否将“产生理解个体、群体、社会如何思考和行为”新的研究方法?大数据在“认识论层面如何影响社会科学”,“能否重塑社会科学”?这些问题目前还没有得到系统和深入的回答。

  社会科学研究的四种范式

  吉姆·格雷提出的四种研究范式包括用来描述自然现象的实验科学、使用模型或归纳法进行研究的理论科学、通过计算机模拟复杂现象的仿真科学和基于数据探索,实现实验、理论、仿真融合的数据科学。但格雷的四种研究范式主要是基于自然科学的发展历史而言的,对于社会科学来讲,人类对社会领域的认知要更为久远和复杂,大致经历了(1)与自然科学浑然一体的自然哲学阶段、(2)向自然科学学习却又不断分化的阶段、(3)对第二阶段进行反思与批判和(4)基于复杂性科学的重新融合阶段。这样看来,各阶段的社会科学研究范式与格雷的自然科学发展范式存在差异,其中(2)、(3)两个阶段基于实证主义和诠释主义的定量与定性研究方法甚至形成了社会科学研究范式的对立,这在自然科学研究中是没有出现的。因此,根据社会科学四个研究阶段的主要方法论,可将(1)(3)阶段的哲学思辨和定性研究称为社会科学研究第一范式,将(2)阶段基于实证主义传统形成的定量研究称为第二范式,将(4)阶段重新走向融合后的自然科学和社会科学研究范式统一,划分为基于仿真研究的第三范式和基于数据科学的大数据研究第四范式。故此,在社会科学领域,研究范式的演化与格雷总结的自然科学研究范式演化有所不同。(参见图1)

  

  图1 自然科学与社会科学研究范式的演化比较

  (一)第一研究范式:社会科学的定性分析

  人类对社会的定性分析分为两个阶段:17世纪以前社会科学思想萌芽和综合累积阶段,以及20世纪60年代以来对实证主义和定量研究程序的反抗阶段。

  第一阶段,从人类脱离动物界进入共同体文明时期,有关社会认识的思想萌芽就开始诞生。原始人类用宗教和神话的感性形象(有灵论)凝缩关于自然和社会的情绪联想。⑩对人类社会的自我认识和理解以“集体表象”“互渗律”的思维特征和“身体参与”“讲故事”的形式传播。进入奴隶社会后哲学从神话中分化出来,通过“思辨”建立理性“概念”,在强调逻辑严谨性和崇尚理性思维的前提下,对人与自然和社会的关系、社会现象以及人类社会发展美好图景的想象加以描述。建立了诸如“礼”“仁”“法”“正义”“民主”等社会科学范畴,形成了政治、伦理、军事、法律等社会科学思想。这一阶段的研究不区分自然科学与社会科学,对社会现象的观察也是笼统的,把所有知识大一统于“自然哲学”的体系之内,为自然和社会现象提供同一套解释系统。封建社会时期,早期的西方社会科学经历了漫长的停滞,导致狂热的宗教崇拜和盲目的虚无主义,经院哲学只负责对基督教信仰进行辩证,成为宗教神学的附庸。古代中国对社会的认知经历了汉、唐、宋三次发展高潮,以“文史哲浑然一体”的形态发展繁荣,并形成了“有机自然观”。(11)

  这一阶段社会领域的研究方法主要是类比和推理,以个人情感外推法、经院哲学论证法和经学注释法为主流。对社会的认识往往夹杂着学者的个人感受、经验、猜测、思辨或愿景,具有一厢情愿式的片面性、非客观性和前科学性,在经院哲学和经学注释中,甚至推崇抽象、空洞的推理和无限重复的正名考据与注解。这一阶段我们可以称之为对社会认知的哲学思辨,建立了朴素的唯物主义和唯心主义理念论、早期辩证法、演绎法、三段论与归纳证明、有机论的自然观和经验论等。这种早期的形而上学的探讨对推动后来的科学发展起到了巨大的作用,许多知识至今仍然是我们认识社会的出发点和基本准则,被誉为“在希腊哲学的多种多样的形式中,几乎可以发现以后的所有看法的胚胎、萌芽”,(12)“希腊人对各门社会科学首先做出了分析性和逻辑性的贡献”。(13)

  第二阶段,即现代社会科学的定性分析。通常涉及(1)观察和记录事实,(2)分析、比较和分类,(3)归纳概括事实间的关系,(4)接受进一步检验四个步骤,是“自下而上”的研究路径。定性分析起源于19世纪,随着人类学、民族学和心理学等学科的发展而建立起来。其早期渊源也可追溯到古希腊时期的诡辩论者,其在实在、真理和知识等问题上持相对主义立场,并认为真理取决于情境、语境和目的。后在吸收维科“想象科学”和法国浪漫主义对现代理性科学的批判、狄尔泰“生命哲学”与“理解”方法论和社会科学领域对“社会行为”(14)、“社会交往形式”研究(15)等内容的基础上,在20世纪20年代与符号互动理论相结合,产生了定性研究方法。早期的定性研究主要凭主观经验和理论思辨进行,一度因社会调查运动而引人注目。但由于缺乏统一的方法论原则和规范性操作,随意性较大,在实证主义和定量研究占主导地位的社会科学研究领域中处于边缘地位。

  20世纪中期以后,随着证伪主义、科学范式、精致证伪主义和知识无政府主义对定量研究哲学根基提出的挑战,自然科学研究不断发展产生的系统论、信息论、控制论、耗散结构、协同论、突变论、模糊数学、混沌理论和复杂性科学对传统机械决定论的动摇,以及人类社会发生的巨大变革,挑战了实证主义在社会科学研究领域至高无上的地位。科学意义上的定性研究在对定量研究的批判中逐渐发展起来。此后,在经历“语言转向”和“定性与定量方法论范式战”后,在计算机科学和信息技术的推动下,定性研究在20世纪80年代逐步成熟,形成了独特的概念体系、具体方法和理论,开发了规范化的操作程序和研究工具,个案研究、扎根理论和叙事探究等定性研究设计类型也得以开发,并出现了“参与”和“倡导”实践。这一认识社会的范式认为并不存在所谓的真实外部世界,现实世界就在“我们之中”,它由多重事实构成,是一种社会建构或话语建构,研究者和被研究者之间的关系是主观的,不可能进行客观分析,也不存在客观真理。要求研究者“移情式理解”行为的意义,用文字阐释社会环境,而不是简单接受环境。研究者重视实践和行动取向,强调将意义赋予经验或现实并做出不同的诠释,在持续互动中建构社会生活。

作者简介

姓名:米加宁等 工作单位:

转载请注明来源:中国社会科学网 (责编:李秀伟)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们