赵超越:本体性意义与学科反思:大数据时代社会学研究的回应

选择字号:   本文共阅读 194 次 更新时间:2020-01-01 23:50:10

进入专题: 大数据   理论终结   本体性意义   学科反思  

赵超越  

   内容提要:大数据应用对社会学的研究产生了巨大的影响,以至于出现方法学转向乃至“理论终结说”的主张。但是,从本体论角度来说,大数据的局限性在于它过度简单化了社会生活,因而忽略抑或悬置了社会生活所具有的历史特殊意义。www.950058.com_【官方首页】-永利贵宾会而大数据推崇者所宣称的意义指的是客观、普遍的意义,这无疑是一种曲解。此外,如果越来越多的学者热衷于“计算社会学”“新计算社会学”的研究,那么很可能会导致学科的分支化倾向。因而在大数据时代,我们更要秉持学科中的重要内容,即理论的意义以及人文的关怀。简言之,在学科反思的层面上,“溯洄涵泳”式的回应必要且紧迫。

   关 键 词:大数据/理论终结/本体性意义/学科反思

   作者简介:赵超越(1990- ),男,上海人,南京大学社会学院博士研究生,研究方向:当代中国研究、社会学理论、文化社会学,南京 210023

   从社会学学科总体发展的情况来看,定性与量化研究是两条并驾齐驱的方法学路径。但由于涉及主客观主义、事实与价值、理解与规律等诸多方法学的问题,两种研究方法在一系列的研究问题上又处于长期的纷争状态。而自大数据(Big Data)一词被提出并迅速成为当代最热门的研究主题之一,加上随之而来的全球性的时代浪潮,传统的量化研究方式受到了猛烈的冲击。

www.950058.com_【官方首页】-永利贵宾会   大数据因其巨大的数据库存(在量上正趋向于全体数据)使得量化研究方法不再完全依赖于过去传统的抽样、假设检验,并为其研究的目的和内容提供了前所未有的便利。由此,大数据社会学研究应运而生。至此,量化研究在一些(暂且称之为)定量极端主义论者的鼓吹下逐渐占据了社会科学方法论领域的“霸权”地位;而与人文主义、建构主义相关联的理论研究、定性研究则逐步落入学科的“边缘化”处境。因而,本文的写作目的在于两方面:其一,从人类社会生活意义的视角对大数据时代下的方法学转向(以新计算社会学为主要形式)进行回应。www.950058.com_【官方首页】-永利贵宾会因为方法手段上的纷争并非是大数据的根本局限性所在,而超越两种研究中的方法手段并站在人类社会历史生活层面上来看,其所具有的意义、意义的历史性与多样性才是大数据研究的软肋。也基于此意义,社会学等学科的自然科学化趋势才能被合理地反对。其二,大数据的到来和以此为基础的生活方式及全球格局的变化,绝不意味着传统研究的方法学和理论的终结。

  

   一、学科量化研究的来源与发展简述

   17世纪甚至更早,人们普遍受到自然科学的逻辑思维模式的影响,尝试去了解自然界乃至人类生活世界运行的规律,从而找出能够放之四海而皆准的普遍法则,同时,人们普遍追求一种可以计算和分类的方式来探求其中的知识体系。但是,即便研究对象是自然界,自然科学仍然受到人类主观因素或者其他非自然条件的影响,更不用说更为复杂的人类生活。所以,克服社会生活中诸多不可控因素的尝试,使得社会科学或者道德科学逐步发展起来。

   就社会研究中的统计而言,在三百多年前就已开始初步呈现。大致来说,在17世纪,这种尤其关注到规范、治理层面的技术同欧美当时所谓的统治理性是密切相关的。从词源学上来看,国家一词“state”就是统计一词“statistics”的原初形式,同样印证了统计的定量技术本身同国家统治的关系。www.950058.com_【官方首页】-永利贵宾会而统计学(die Statistik)概念则由时任哥廷根大学的哥特弗里德·阿亨瓦尔(Gottfried Achenwall)正式提出。[1]19当时的目的无非是要寻求一个系统,在这个系统中政府能够更方便地记住其中人口数量及其各种社会事实,以便为其所用。英国、法国在这一方面大同小异,统计学最初的运用,是国家的领导者为了方便掌握其国家中人员的状况(人口容量、人口流动规模等),以便更好地实行统治政策和相关治理术。[1]16其中值得一提的是,当时国家的领导者和学者都或多或少地接触过类型学的思想,通过对所谓子民的数量以及活动轨迹的量化研究,实施对其不同职业、层级的划分,以便于对其监控。这个由统治者所构建的、社会成员受监控的社会,在很大程度上可以看作福柯所称的全景监狱(prison de panoramique)或者戈夫曼所说的“精神病院”(Asylum)的管理机制,统治者通过一系列的治理技术和设施对社会成员进行肉体和精神的规训,以至于他们终将成为温顺的受控者。www.950058.com_【官方首页】-永利贵宾会[2][3]而随着社会形态的转变,尤其是从17世纪中叶伊始,“特别是资产阶级日渐掌握到社会的导引权,而市民社会(civil society)也日益成熟之后,其社会属性有了改变”,[4]统计研究不再纯粹为统治理性所服务,社会变迁过程中的诸多问题使得其研究目的发生改变:一方面为确信某个事实或某物提供理由(或支持涉及未来的决定);另一方面通过误差的理论(theory of errors)来评估科学知识的确定性程度(degrees of certainty)。[1]17由此,近代意义上的社会科学从之前统治理性主导时期的边缘地位脱离出来,朝更大的研究范围(自身研究逐步占主导)进行量化统计研究。

   而到19世纪末20世纪初,随着概率论的发展和成熟,量化研究逐步趋于数理化、公式复杂化以及模型化,并“展现成为一个具有自我组织、自我再制与自我衍生能力的语言体系”。[5]由于社会属性的根本改变,研究无法从绝对宰制的层面上获取所需的大规模数据,所以,与之前大规模的记录方式不同,近现代的量化研究以一个或多个研究假设为前提,通过对有限的样本规模进行梳理统计以建构不同的模型,从而凭借所得出的因果或相关关系来对当前假设进行验证。一方面,研究者尝试用量化的统计公式和统计模型来实现所谓的学科精确化;另一方面,由于自古以来一直有着对普遍主义的追求,使得量化研究愈发趋向于对人类行动乃至现象的发生进行预测。换言之,量化研究者从事社会学研究时已经采取了两种预设,即客观性预设和规律性预设。[6]95但问题在于,试图用上述两种去囊括所有的社会学研究是徒劳的。就前一个预设而言,所能获取的也只是表面上的外在行动(行动的频次、问卷上的信息等),这些外在数据只是社会学研究领域的冰山一角;后一个预设则更不可能实现,因为规律“只是在近似的情况下以及一定的限制条件下成立”。[7][8]在人类历史的多样化情形下,诸多自然科学中的定律和假说都是相对且不确定的。因此,利用量化的统计分析必须要对社会生活的诸多因素进行过滤和限定,才勉强能在“理想类型”的范围内着手进行。这样一种受限的量化研究,由于社会生活复杂性质的影响,“无法独自承担起社会学研究的重任”,[6]96它必须依靠定性研究进入意义世界的理论能力,方可更深入地解释和看待社会,同时它也能在定性研究的理论基础上呈现数字化的精确证明。所以,作为社会学研究的方法路径之一,量化研究不仅无法单独研究社会,更要时刻“向新的经验证据和反思的目光敞开”。[6]96

   但是,大数据以及相关新型数据采集手段的引入,似乎给传统的量化统计研究注入了一剂强心剂。在很多量化研究者看来,大数据在很大程度上意味着对传统的数据采集方法软肋的一种拯救,从而使其从原本诸多的手段限制中抽离出来。这样一来,社会学研究中新的重要问题便产生了:大数据研究究竟何为?既然量化研究和定性研究都有各自的本职工作,并分担研究社会的使命,那么大数据的到来在何种程度上影响这一格局?又在多大的程度上左右了定性、理论研究的作用?

  

   二、大数据、方法学转向与理论终结说

   大数据的正式概念始于2011年麦肯锡的报告《大数据:革新、竞争和生产力的下一个“前沿”》:“大数据——能够获取、交流、整合、储存乃至分析的海量数据——如今已成为全球经济里每一部门和功能的组成部分。就像其他的生产要素,比如硬资产和人力资本。数据越来越成为现代经济活动、革新和增长中不可或缺的要素。”[9]报告中强调运用大数据的科学技术将被广泛地应用到统计学、计算科学、应用数学乃至经济学中,同时,这也意味着从大数据中获取信息的组织等需要面临的是一个更为灵活性的、多重规则的方法手段。正是由于大数据量的庞大,因而如何驾驭这个庞然大物(Riding the Juggernaut)[10]来为人们服务越发受到重视。由于大数据应用领域的扩大,因而当今它甚至可以囊括“环境卫星、基因数据、GPS和地图数据、数字图像,以及诸如社交媒体数据之类的人们有意识产生的数据,等等”。[11]所以,《大数据时代:生活、工作与思维的大变革》一书的两位作者舍恩伯格(Viktor Mayer-)和库克耶(Kenneth Cukier)亦将大数据视为“社会以新的方法手段处理信息的一种能力,以生产出具有巨大价值的商品和服务或者产生有用的洞见”。[12]20

   相较于传统数据采集及统计分析,大数据最为突出的特点是舍恩伯格和库克耶所强调的三大特性:模糊性、相关性和大样本性。首先,是模糊性代替精确性。对于传统数据采集而建立的数据库而言,收集的数据信息是相对有限的。在有限样本量的情况下,对于数据采集以及建构模型精确性具有很高的要求。但是,在大数据的前提下,“允许不精确的出现已经成为一个新的亮点,而非缺点”。[12]63这种所谓的“非缺点”表现为两个方面:一方面,对于小型数据过多的各种统计方法的计算倒不如从大数据出发的简单运算来得实际,从而在效率层面上完全可以省下更多时间来收集更大的数据,使得手头的数据库存累积起来以便获取更多有用的价值信息;另一方面,大数据之所以被提出乃至风靡全球,是因为它能够满足人类的追求,即掌握现在和预知未来,尤其是后者。预测代表着一种概率逻辑,而非事实的确定性,所以数据的海量采集为预测大方向的追求而不得不或者主动地丧失其精确性,并“拥抱混乱”。其次,是相关性代替因果性。舍恩伯格和库克耶认为,因果关系存在的前提在于人们的主观直觉,“在小数据时代,很难证明由直觉而来的因果联系是错误的。……大数据之间的相关关系,将经常会用来证明直觉的因果关系是错误的”,[12]103而相关关系则代表着客观的事实,且后者作用更为明显。例如,将预测作为最终目的的评估机构和企业,只需要知道用户的目前状况和需求,就能够为其提供相应的产品和服务;他们无须也不想去了解用户之所以会有某类需求的原因。最后,是大样本性代替小样本性。当数据的收集量越来越庞大乃至可以称为海量时,以至于可以直接采用这一超大型样本量而无须顾及小样本所带来的一系列代表性问题。如果说传统统计方法下的抽样研究是为了描述或解决即时的、有限的、特定的社会现象或问题,那么,在大数据时代运用更为先进的信息技术对任何与研究旨趣相关的海量数据分析则可能着眼于更长远的、更为庞杂的事件和趋势。

大数据对于社会科学的影响如此巨大,以至于其研究方式的转变使得社会学成为大数据时代下方法学被撼动得最厉害的学科之一。典型的例子是“新计算社会学”的诞生及其研究应用。20世纪90年代,拉策尔、加里·金等学者在《科学》上提出了“计算社会科学”的概念,[13]721即通过计算机软件作为媒介对社交关系进行测量的一种应用方法。这一新型学科的研究主要涉及社会网络理论与研究方法的发展、基于行动者模拟方法(agent-based modeling)以及互联网研究等。从研究范围来看,这一新兴领域是一种社会世界诸多方面的跨学科研究,通过计算的媒介可以从个体的行动者一直到群体。[14]2它主要利用计算机中的“自动化信息提取”(Automated Information Extraction)技术进行信息搜集。例如,我们可以将谷歌图书语料库的书本大数据、新浪微博、百度搜索等巨大库存作为数据来源,以所需相关变量(关键词)作为指标,从不同维度进行统计分析。[15][16][17]因为这是一门相对较新的领域,所以,计算社会科学需要同其他的跨学科研究领域之间建立起一个新的范式和系统,(点击此处阅读下一页)

    进入专题: 大数据   理论终结   本体性意义   学科反思  

本文责编:陈冬冬
发信站:江苏快3_[官网首页](http://yjzj365.com),栏目:天益学术 > 社会学 > 社会研究方法
本文链接:http://yjzj365.com/data/119686.html
文章来源:《上海大学学报:社会科学版》2019年第1期

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

江苏快3_[官网首页](yjzj365.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非江苏快3_[官网首页]网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by yjzj365.com Copyright © 2020 by yjzj365.com All Rights Reserved 江苏快3_[官网首页] 京ICP备12007865号 京公网安备11010602120014号.
易康网

页面底部区域 foot.htm