欢迎访问中国人民大学性社会学研究所!
您的位置:首页>>定量研究
全文检索
定量研究
“大数据崇拜”批判:1.有什么用?
作者:潘绥铭  时间:2015年10月13日
来源:作者投稿

 

大数据崇拜批判:1.有什么用?

潘绥铭

最近以来,所谓的“大数据”来势汹汹,甚嚣尘上,不可一世。

但是,鼓吹者们,究竟有没有一点点做研究的起码常识呢?

 

无论在自然科学里,还是社会科学里,还是文本分析中,凡是进行数据分析,只有两种办法:

 

第一种方法是:研究者自己首先提出某个或者某些假设,然后去收集数据,然后进行统计检验,以便对于自己的假设做出适当的评价,主要结论应该是:该假设是否得以成立。也就是说,“没有假设,就没有研究”,这对于任何一种遵循“科学主义”的研究来说,不但是金科玉律,而且根本就是底裤啊。

可是,所谓的“大数据”,在收集数据之前,可曾有过任何一个假设吗?甚至,研究者究竟有没有猜测到:那些数据之间,可能存在着某种联系呢?例如,如果您把让人们在网上购物时留下的痕迹,与他们在医院就诊时留下的记录,强行放在同一个数据库进行分析;那么,您就等于在假设:购物与生病之间,可能存在着某种联系。这并不是说,根本不可以提出这个假设,而是说,您事先是这么想的吗?如果没有,那么跟盲人摸象有什么区别呢?您究竟有什么根据,才敢如此胡思乱想呢?

尤其是,无论您从这样的“大数据”中分析出什么,都只能是忽悠人而已。例如,早在上个世纪,美国的统计学家就发现,股市的涨落,与女人裙子的长短,存在着相关关系。可是一直以来,在任何一个国外大学里,这都被用来说明“没有假设的统计,就是胡说八道”这一常识。可是天啊,现在却被某些人又翻出来,作为“大数据之所以伟大”的证据啦。

刘中一说得好:“这和去垃圾堆里翻安全套,本质上一致吧?”我再引申一下:没有假设,大数据就是垃圾堆!

这么玩儿下去,还要科学干什么?煮着吃啊?

 

第二种研究方法,是从定性研究(质性研究)里的“求异法”中借鉴来的,就是:不去寻找数据的“规律性”,而是通过分析,去发现“特定事物(现象)内部的多样化的存在”,或者“同一事物(现象)在不同载体中的多样化存在”。也就是说,研究者的假设是:任何事物(现象)都不可能是浑然一体,必定存在着万紫千红甚至千奇百怪的存在形式。研究者的目标,就是去发现和揭示这一点。因此,研究者全神贯注的,恰恰是数据中那些小概率的、奇异的、甚至缺失的情况。

正是在这个意义上,而且仅仅在这个意义上,大数据才会有用。例如,哪怕只有万分之一的人,确实是在网上购物之后才有病,或者有病之后才上网购物;那么也可以提示我们:为什么仅仅是这些人才会出现这样的联系呢?其中是不是蕴含着我们现在还不知道的某种学理呢?

所以说:这种“沙里澄金”的研究方法,主要是为了“发现”,而不是为了“检验”。但是只有这种方法,才能实现理论的独辟蹊径,而不仅仅是既有成果的“层层叠加”。

 

可是,我真的很好奇:那些靠鼓吹“大数据”骗钱的人们,有一丝丝可能性,听说过这样的研究方法论吗?

 

就此打住,否则,就要出粗话啦。



Copyright © 2002 .Institute for Research on Sexuality and Gender , Renmin University of China
中国人民大学性社会学研究所版权所有   电话:(010)6251 4498    京ICP备12030030号
潘绥铭教授:  pansuiming@sex-study.org    黄盈盈副教授:huang.y.y@sex-study.org 
给本网站投稿:tg@sex-study.org 管理员邮箱:admin@sex-study.org