大数据质疑述评(2)
二是大数据并不大,“全数据”只是神话。英国大数据学家维克托·迈尔-舍恩伯格所提出的“全数据而不是样本”的观点将大数据的“大”引向“超大”与“最大”。然而,理论上的“全数据”是不可能实现的,尽管互联网与各种社交媒体每时每刻都提供巨量的数据,但是这些数据有可能掺杂着大量冗余的、混乱的、虚假的甚至是有害的内容,价值密度较低。大数据号称要“拥抱混乱”,但数据分析不可能不经过筛选而维持其完全原始的状态,真正需要的数据可能被更多混乱的海量“大”数据所掩盖和淹没,因此,“全数据”只是一种理想状态。
三是大数据决策或预测有缺憾,不能完全依靠大数据推出客观规律。维克托·迈尔-舍恩伯格认为,“人通过探求‘是什么’而不是‘为什么’,相关关系帮助我们更好地了解了这个世界”。[5]这个观点解构和颠覆了我们长期以来对科学原理的探寻,似乎一切都应听从大数据科学家们的猜测。事实上,大数据分析出来的事物变化规律或者说是相关关系,只能说相对于“小数据”(过去的抽样分析)要准确一些,并不会比人类长期实践探索得到的经验更准确。因为,规律是不断变化的,再“大”的数据也不能完全准确地推出客观规律。更为重要的是,不是你想得到多大数据就能得到多大,对于一些社会问题大数据的收集,有些“沉默”的群体(弱势群体)可能不会提供任何数据。曾利用大数据成功预测了2012年美国总统选举结果的专家 Nate Silver警告说,企业决策者应该对大数据应用保持谨慎,否则很可能导致一些错误的决策。
2.3 大数据分析有违社会公平——大数据分析的伦理悖论。EDventure Holding公司董事长埃丝特·戴森(Esther Dyson)认为,大数据的个性化定制有悖公平,引发社会政治难题。她反问道,民主国家的每名公民都有投票权,那么每人得到的福利是否应该相同?大数据如果能够预测个体结果,那么个人责任和集体任务究竟是什么?她认为,这种不公平现象在教育等领域将变得尤为严重,比如我们根据大数据个性化定制所得到的学生的潜能区别对待这些学生,但如果帮助了某些孩子“发展潜能”,是否会因此限制其他人的潜能?[6]
无独有偶,凯特·克劳福德认为,数据在生成或采集的过程并不都是平等的。大数据由于其所号称的“大”而使得其比小数据似乎更具有客观性,由于数据分析可以在整体水平上进行,似乎可以避免对少数或者弱势群体的歧视。然而,由于大数据能够做出有关群体不同行为方式的论断,其使用通常恰恰就是为了实现一个目的——即把不同的个体归入不同的群体中。[7]这样原本等级森严的社会阶层将会分化得更加严重,社会不公正现象愈加明显,社会矛盾日趋激化。
尽管大数据分析是基于理性的数据而不是感性的直觉和经验,但是人的权利、尊严、平等和自由是大数据分析的基础,当我们利用大数据分析某些社会问题时,仍然要考虑社会伦理与社会公平。
2.4 大数据存在着安全与信任隐忧——大数据风险论。技术的进步与安全一直是一对矛盾,然而,大数据分析却面临着除了传统的物理安全、网络安全、数据安全等之外的新的隐私保护和信任安全等问题。例如无处不在、无所不能的数据化——“一切皆可量化”,意味着只要你想,就可以从任何事物汲取你所想要的任何信息,甚至包括很多我们认为和“数据”关系不大的事情,比如一个人所处的位置,一个人坐在汽车座椅上的姿势与受力趋势,等等,都是可以被监控、被数据化的。风险论者认为大数据存在着诸多风险,如技术风险、决策风险、安全风险、信任风险等,其中安全风险与信任风险尤为突出。
安全风险中最突出的就是大数据中隐含的个人隐私的暴露。尽管许多大数据的提供者尽力消除数据中的个人信息,但还是可以从大量的公共数据集中推断出个人隐私,如出售给大数据分析公司的医疗、旅行、位置等数据都有可能追查到个人身份,更令人担忧的是,这些隐含了很多个人隐私的大数据信息将因被黑客或泄露者觊觎而变得风险陡增。“数据的安全性及给个人隐私带来的威胁,让本是机会的‘大数据’,也同时成为了‘大风险’。”[8]
信任风险和安全风险有相似之处,都是涉及个人隐私的暴露,但二者不完全相同。安全风险的着重点在于信息或隐私可能被非法窃取或利用,而信任风险中最突出的问题则是公众可能在不知情的情况下,被“监视”、被“预测”。大数据推崇的数据获取中包括诸多侵犯他人隐私权、生存权和精神健康权的文字、声音与图像,大数据标榜的是完全让数据来说话,做决策的是机器而不是人。然而,大数据有关预测的功能会使得一个当下正常的人被预测为将来可能犯罪,从而使得其人身自由被监控,如果让这种预测合法化,公众会感觉一直有个“第三只眼”在监视着自己,不信任感如影随形。
另外,大数据之中可能会隐藏着的一个人的习惯、价值观,甚至人生痕迹和人生规律(事实上,从社交媒体就很容易获得),如果这些涉及个人隐私的信息在公众不知情的情况下被大数据使用者和开发者不恰当地使用,就有可能给具体人生或公共利益带来侵扰或损害;如果一个人的人生受到数据独裁行为的干扰,那么其在大数据方面的权利将受到侵害。[9]
2.5 大数据增加了治理难度——大数据治理障碍论。大数据治理有广义与狭义之分,狭义的大数据治理是基于在大数据处理的过程中,CDO 们面临的一些问题,如数据散落在不同的系统中,哪些数据是可信的?数据是否面临更大的风险?如何从海量数据中获得洞察? [10]大数据治理就是要确保数据本身可用性和可靠性。而广义上的大数据治理则指向数据政策、数据所有权、数据监控、数据标准以及指导方针,甚至包括“社会治理、国家治理和全球治理水平的提升”。[11]大数据治理将会涉及相应的法律法规。
因此,有专家认为大数据加大了数据治理、确保数据质量和访问控制方面的难度,因为它既涉及 IT 技术,又与业务部门密切相关,是一个复杂的系统工程。埃森哲的Michael 说:“共享整个企业的数据未必是件容易的事,很难让整个企业共同来解决这个问题。”[12]
对大数据的质疑还有诸如大数据生态环境问题、政府大数据开放的可行性问题,等等,限于篇幅,本文不再赘述。
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ: 913775405(普刊)
蒋老师联系QQ: 867306987(核心)
刘老师联系QQ: 271374912(核心)
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《课程教育研究》 旬刊 国家级
- 《网络空间安全》(信息安全与技术)月刊 国
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《高教论坛》 月刊 省级
- 《法制与社会》旬刊 省级
- 《中国教育学刊》月刊 14版北大核心
- 《语文建设》 旬刊 14版北大核心
- 《中国绿色画报》 月刊 国家级
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《财会月刊》旬刊 14版北大核心
- 《艺术品鉴》 月刊 省级
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《教学与管理》旬刊 北大核心
- 《当代经济》 旬刊 省级
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《文教资料》 旬刊 省级
- 《学术界》 月刊 双核心
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《中国农业资源与区划》 月刊 14版北大核心
- 《继续教育研究》月刊 北大核心期刊
- 《财经界(学术版)》半月刊 国家级
- 《电影评介》半月刊 14版北大核心
- 《公路交通科技》 月刊 北大核心
- 《新闻传播》月刊 省级 新闻类优秀期刊