大数据质量除精确性、实时性、完好性、合用性和经济性等要素,还包罗可得性和可阐发性等要素,但精确性仍然是最枢纽的要素
大数据质量除精确性、实时性、完好性、合用性和经济性等要素,还包罗可得性和可阐发性等要素,但精确性仍然是最枢纽的要素。有别于传统数据,其质量成绩具有两个较着特性:(1)大数据作为副产物,其各类质量成绩是难以事前预感和防备的;(2)险些一切的大数据都具有极好的实时性天下财产经济、部分的完好性、相对的精确性(生物医学大数据等)和较差的合用性。
为此,大数据使用能够存在以下一些质量成绩:(1)与数据利用目标的符合度能够比力差;(2)发生体系性偏差的能够性更大;(3)数据的可比性成绩能够更加凸起;(4)难以追踪考核等其他相干质量隐患。
China Economist (中文刊名:《中国经济学人》)是由中国社会科学院主管、中国社会科学院产业经济研讨所主理的面向环球刊行的中英文学术期刊。China Economist创刊于2006年3月,一直努力于向环球通报中国经济学与办理学最前沿研讨停顿,搭建中外学者互相交换的学术平台和研讨阵地,向全天下宣扬可以代表中国群众底子长处诉求的研讨功效,增进外洋读者更好天文解中国,不竭加强我国的国际影响力和国际话语权。《中国经济学人》前后被EconLit、EBSCO、ProQuest、SCOPUS等环球支流、威望数据库及索引体系收录天下财产经济,当选中国社会科学院中国人文社会科学期刊(AMI),是“代表我国人文社会科学英文刊最高程度”的期刊地区经济批评官网。
与传统数据比拟地区经济批评官网地区经济批评官网,影响大数据质量的身分还包罗:(1)不管是其滥觞仍是组成或是形状,都是各式百般的;(2)快速变革性使得停止至任何一个时点的大数据都只是一个样本;而且大数据所表现的特性与未笼盖到部门的特性常常有较着的差别;(3)大数据的非尺度化和寄义的非单一性,给大数据的使用形成了艰难;(4)大数据是由小数据组成的,小数据能否实在可托很难加以分辩、也很难加以核实。
怎样掌握大数据使用的质量?一是做好相干实际筹办天下财产经济。除进一步加深了解大数据的内在和“4V”特性外,重点有三:(1)改动对数据及其滥觞的熟悉。统统可记载的究竟都是数据,要建立从大数据中有用、充实挑选利用数据的认识;(2)改动对整体、个别、变量等的熟悉。大数据是先无数据后有整体,原本的关于整体天下财产经济、个别和变量的界说方法不再合用;(3)改动对数据阐发思绪的熟悉。大数据阐发是基于数学运算与发掘算法相分离的阐发,其成果并不是都能表现为传统意义上的定量成果,偶然候是直接定量或隐性定量的。二是成立大数据使用质量掌握计划。(1)事前要对数据利用目标与可供挑选利用的数据源停止对应性研讨;(2)事中要做好详细的大数据尺度化及其与其他数据的跟尾等事情;要对数据停止考核与修补;要边利用数据边比力、考证;(3)过后实时评价,包罗逻辑性查抄和公道性天下财产经济、有用性评价天下财产经济。三是正视对小数据的研讨。四是指导大数据企业做好根底性事情。五是加壮大数据人材的培育培训。六是成立与大数据使用有关的法令法例。
大数据使用还要留意以下几点:一是不要自觉在路灯上面找钥匙;二是不要随便信赖“样本就是整体”;三是不要忘了事物的原来纪律;四是不要过火依靠纯定量成果;五是不要科学数据量越大越好;六是不要堕入“测禁绝”失路。
现在,操纵大数据改动消费糊口和效劳方法、利用大数据开掘贸易代价、使用大数据停止科学研讨等,都获得了本质性的停顿。可是,怎样包管大数据使用的质量,是一个主要的根底性成绩。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186