手机看中经经济日报微信中经网微信

链接:热点名词大数据

2013年12月17日 11:30    来源: 新华网    

  按照业界比较普遍的看法,大数据具有海量、多种类、需要大规模处理和快速响应等特点。

  根据IDC(国际数据公司)的跟踪分析,全球产生的数据总量2010年首次突破1泽(10的21次方)字节,2012年达到约2.8泽字节,2020年有望达到40泽字节。2012年,全球产生的数据中仅有约0.5%得到分析。到2020年,全球数据总量中有22%将来自中国。

  从内容来看,这些海量数据可分为结构化和非结构化数据。问卷调查、产品评论、信用卡记录和实验结果等属于结构化数据,仅占数据总量的5%左右;大数据时代的数据量爆炸多来自非结构化数据,例如在社交网站上发布的照片和视频,在搜索引擎中输入的搜索词,手机产生的即时位置信息等,约占数据量的95%。

  在大数据的处理上,舍恩伯格所著《大数据时代》一书指出,大数据处理分析面对的不是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。

  比如,世界上第一部“先拍照后对焦”光场相机Lytro,就运用了大数据处理分析理念。与传统相机只记录一束光不同,Lytro可以记录整个光场里所有的光,也就是用总体数据取代了随机样本。用户没必要一开始就对焦,想要什么样的照片可以在拍摄之后再决定。

  数据量大幅增加对人们注重精确性的习惯等提出了挑战,大数据需要技术和思维上的变革才能利用。谷歌公司人工智能专家说,谷歌翻译在语料库使用庞杂的网络内容后取得了飞跃发展,不完整的句子、拼写错误、语法错误等各种错误,让谷歌翻译可以正确地推算出英文词汇搭配在一起的可能性,混杂性和谬误反而让谷歌翻译在同类产品中更为突出。


(责任编辑: 邢晓宇 )

    中国经济网声明:股市资讯来源于合作媒体及机构,属作者个人观点,仅供投资者参考,并不构成投资建议。投资者据此操作,风险自担。
上市全观察