<address id="drvvf"><nobr id="drvvf"><meter id="drvvf"></meter></nobr></address>

                  <address id="drvvf"><nobr id="drvvf"><meter id="drvvf"></meter></nobr></address>
                  <form id="drvvf"><nobr id="drvvf"><meter id="drvvf"></meter></nobr></form>

                    大數據發展遭遇瓶頸 如何突破壁壘迎新生?

                    大數據發展遭遇瓶頸 如何突破壁壘迎新生? 2016年09月19日11:06 來源:中國智能制造網|

                       已經上升成為國家戰略,社會各界對大數據的期待上升到了前所未有的高度。如何務實推動大數據戰略落地,成為接下來的政策重點。

                     1、引言

                     2015年,我國《促進大數據發展行動綱要》出臺,十八屆五中全會進一步提出要在“十三五”期間實施國家大數據戰略,大數據一路上升成為國家戰略,社會各界對大數據的期待上升到了前所未有的高度。如何推動大數據戰略落地成為未來幾年的政策重點。本文重溫了大數據的內涵,分析了大數據的局限性,結合國內大數據發展面臨的瓶頸,提出了相關的策略建議。

                     2、把握概念本質,深刻認識大數據的戰略價值

                     大數據是新資源、新技術和新理念的綜合體。從資源視角來看,大數據是新資源,體現了一種全新的資源觀。摩爾定律仍然有效,計算存儲和傳輸數據的能力在以指數速度增長,分布式計算、存儲和數據技術的革新不斷涌現,互聯網企業對“數據廢氣”(DataExhaust)的挖掘利用大獲成功,引發全社會開始重新審視“數據廢氣”的價值,開始把數據當作一種獨特的戰略資源對待。

                     從技術視角看,大數據代表了新一代數據管理技術。傳統的數據管理與分析技術以數據為對象、在小數據集上進行分析、以集中式架構為主,成本高昂。與“貴族化”的數據分析技術相比,源于互聯網的,面向多源異構數據、在超大規模數據集上進行分析、以分布式架構為主的新一代數據管理技術與開源軟件潮流疊加,在大幅提高處理效率的同時(數據分析從T1到T0甚至實時),成百倍地降低了數據存儲和管理成本。底層技術的變革釋放了上層應用的創新活力。

                     從理念的視角看,大數據提供了一種全新的思維角度。大數據的應用,賦予了“實事求是”新的內涵,其一是“數據驅動”,即經營管理決策可以自下而上地由數據來驅動,甚至像量化股票交易、實時競價廣告等場景中那樣,可以由機器根據數據直接決策;其二是“數據閉環”,觀察互聯網行業大數據案例,它們往往能夠構造起包括數據采集、建模分析、效果評估到反饋修正各個環節在內的完整“數據閉環”,從而能夠不斷地自我升級,螺旋上升。

                     大數據本身既能形成新興產業,也能推動其他產業發展和社會進步,戰略重要性毋庸置疑。從狹義看,圍繞大數據采集、存儲、管理和挖掘,正在逐漸形成一個小的產業生態(狹義大數據產業)。2015年,全球的大數據產業規模約為200~300億美元。據中國信息通信研究院調查[1],2015年我國大數據市場規模達到115.9億元,增速達38%,預計2016-2018年還將維持40%左右的高速增長。

                     從廣義看,大數據具有通用技術的屬性,能夠提升運作效率,提高決策水平,從而形成由數據驅動經濟發展的大生態。據華沙經濟研究所測算,歐盟27國因大數據的引進,至2020年將獲得1.9%的額外GDP增長[2]。美國麥肯錫預計到2020年美國大數據應用帶來的增加值將占2020年GDP的2%~4%。中國信息通信研究院采用華沙經濟研究所相同的模型測算,2014年大數據對我國GDP的增量貢獻約為0.53%~1.25%,2020年的增量貢獻最高將達到1.9%。大數據的應用對社會治理水平的提升也能起到明顯的推動作用。

                     3、避免盲目跟風,大數據熱潮還需冷思考

                     身處大數據熱潮中,既要充分認識大數據的潛力,積極把握技術進步帶來的機遇,也要認清大數據的局限性,警惕大數據萬能論。一些被廣泛傳播的經典案例現在被證明是子虛烏有的,比如,啤酒與尿布的故事實際上是Teradata公司的工程師ThomasBlischok在1992年杜撰的,從來沒發生過;而Netflix號稱用大數據分析幫助自制劇《紙牌屋》取得成功,而實際上是把大數據作為公關活動的噱頭。筆者認為,至少有以下幾點值得思考:

                     第一,大數據尚難對人的行為做出精確預測。在大數據是否能準確預測人類行為的問題上,還存在重大分歧。《黑天鵝》指出人類的行為不可預測,而《爆發》一書則根據對以往歷史經驗的總結,指出人類行為93%可預測。麻省理工學院教授羅伯特·萊格伯恩(RobertoRigobon)稱,雖然華爾街一直重視數據分析,但基于海量數據分析的對沖基金在全球都是失敗的?!皩τ谌撕褪录绻诺皆酱蟮目臻g和時間范圍,則是越可以精確預測的。如果放到越小的空間和時間范圍,則是越不可以精確預測的。例如,我們幾乎可以在100%的程度上預測一個人在24小時的時間范圍內會吃飯;但若精確到某一分鐘,則幾乎不可能預測準確。”大數據無法預測人類行為,歸根結底還是因為人具有“自由意志”,人會根據預測結果(如下個月的股票價格、明天的交通擁堵情況)改變自身行為,從而使得預測失效。

                     第二,大數據相關關系不能替代因果關系。舍恩伯格在《大數據時代》[9]中說:“我們沒有必要非得知道現象背后的原因,而是要讓數據自己發聲”,“相關關系能夠幫助我們更好地了解這個世界”。追尋相關關系和因果關系,是人類思維的兩種重要方式,而用大數據進行預測往往依靠相關性,也就是說,很多情況下知道“是什么”即可,不必知道“為什么”。相關關系的運用在互聯網推薦、精準廣告等方面得到了實際應用。然而,在很多時候,如疾病診斷、工廠故障分析等場景下,需要根據確定的(或置信度非常高的)結論來決策,僅憑相關關系是遠遠不夠的。換言之,大數據中的相關關系應用,需要區分場景,有時候數據無法自己說話,需要追本溯源。

                     第三,大數據來源不均衡會讓數據“說謊”。有人說數據不會撒謊。實際上,如果忽視數據來源的不均衡性,數據分析結果就會“騙人”。中國互聯中心2015年的統計數據顯示,我國網民城鄉分布嚴重不均,農村網民雖然迅猛增長,但仍不及城市新增網民數量的1/10。社交網絡用戶的性別分布也同樣有很嚴重的傾斜,騰訊公司2015年年初的報告顯示,微信用戶的男女比例為1.8:1,男性用戶約占了64.3%,而女性用戶則只有35.7%。如果利用網絡大數據進行民意調查,卻不把樣本分布的不均衡性考慮進去,就可能使得某些群體未得到充分代表,而某些群體因使用率高,其意見或特征被過分放大。這種不均勻的數據來源會導致分析結果存在偏見和盲區。

                     第四,大數據無法消滅信息不對稱現象。有人說,大數據有助于消滅信息不對稱。雖然從全社會看,大數據的全面采集和融合應用有望在局部緩和信息不對稱程度,但是在互聯網世界中,馬太效應很顯著,擁有大數據資源和掌握大數據分析能力的企業,往往會在大數據時代占據更加有利的地位、占有更多數據,從而更容易形成一批數據寡頭,產生新的不平等,造成新的信息不對稱。因此,大數據無法消滅信息不對稱,反而更有可能助推數據寡頭的出現。如果這種數據壟斷地位被企業濫用,將會威脅個人、企業甚至國家利益。因此,在大數據時代,如何進一步彌合數據鴻溝、防止數據“霸權”的濫用,將會成為一個重要的新課題。熱潮之下,對大數據的反思,還需要不斷深入,才能讓我們保持清醒的頭腦。

                    責任編輯:姚泓澤

                    上一頁1

                    国产做无码视频在线观看_国产成人精选视频在线观看_打桩机和他宝贝124是哪一对_国产三级欧美

                        <address id="drvvf"><nobr id="drvvf"><meter id="drvvf"></meter></nobr></address>

                                    <address id="drvvf"><nobr id="drvvf"><meter id="drvvf"></meter></nobr></address>
                                    <form id="drvvf"><nobr id="drvvf"><meter id="drvvf"></meter></nobr></form>
                                      >