激战的后厨2观看完整版,強姦亂倫強姦在线观看,国产无套内射普通话对白,老头呻吟喘息硕大撞击,他扒开我小泬添我三男一女视频

廈門服務器租用>業界新聞>評論(lun):關于大數據的常(chang)見(jian)誤解

評論:關于大數據的常見誤解

發布時間:2013/3/6 14:59:38    來源: 縱橫數據

我時常聽創業者說(shuo)自己的(de)公司(si)每天(tian)會生(sheng)產(chan)/記錄(lu)很多的(de)數據,雖(sui)然他(ta)們(men)暫時還沒(mei)想明(ming)白怎么用這(zhe)些(xie)數據,但(dan)把這(zhe)些(xie)數據都先(xian)存起來了。他(ta)們(men)經常還說(shuo),通過這(zhe)些(xie)數據他(ta)們(men)的(de)產(chan)品/服務將得到很大的(de)提升,仿佛這(zhe)些(xie)數據就(jiu)是公司(si)的(de)救世主一樣。我不想討論這(zhe)種觀(guan)點(dian)正確(que)與否,但(dan)想在(zai)這(zhe)里(li)解(jie)釋兩個(ge)關于大數據的(de)常見(jian)誤解(jie):

一、數據不等于信息

經常(chang)有人(ren)把(ba)數(shu)據(ju)和信息(xi)當作同義詞來(lai)用。其實(shi)不然(ran),數(shu)據(ju)指的(de)(de)是一個原(yuan)始(shi)的(de)(de)數(shu)據(ju)點(無論(lun)是通過數(shu)字,文(wen)字,圖片(pian)還是視頻等等),信息(xi)則直接(jie)與內容掛鉤,需(xu)要(yao)有資訊性(informative)。數(shu)據(ju)越多(duo)(duo),不一定就(jiu)能代(dai)表信息(xi)越多(duo)(duo),更能不能代(dai)表信息(xi)就(jiu)會(hui)成比例增(zeng)多(duo)(duo)。我們來(lai)看(kan)兩個簡單的(de)(de)例子:

備(bei)份(fen)。很多(duo)(duo)人如今已(yi)經會(hui)(hui)定期(qi)的(de)對自己(ji)的(de)硬盤進行備(bei)份(fen)。這(zhe)個沒什么(me)好(hao)多(duo)(duo)解釋的(de),每次(ci)備(bei)份(fen)都會(hui)(hui)創(chuang)造出(chu)一(yi)組新的(de)數據,但信息(xi)并沒有增(zeng)多(duo)(duo)。

多(duo)個(ge)社(she)交網(wang)站(zhan)上(shang)(shang)的(de)(de)信息(xi)。我們當中的(de)(de)很(hen)多(duo)人在多(duo)個(ge)社(she)交網(wang)站(zhan)上(shang)(shang)活躍,隨著我們上(shang)(shang)的(de)(de)社(she)交網(wang)站(zhan)越多(duo),我們獲(huo)得的(de)(de)數據就會(hui)(hui)(hui)成比(bi)例的(de)(de)增(zeng)多(duo),我們獲(huo)得的(de)(de)信息(xi)雖然也會(hui)(hui)(hui)增(zeng)多(duo),但卻不會(hui)(hui)(hui)成比(bi)例的(de)(de)增(zeng)多(duo)。不單單因為我們會(hui)(hui)(hui)互相轉發好(hao)友的(de)(de)微(wei)博(或(huo)者其他社(she)交網(wang)站(zhan)上(shang)(shang)的(de)(de)內容),更因為很(hen)多(duo)內容會(hui)(hui)(hui)十(shi)(shi)分(fen)(fen)類似,有些微(wei)博雖然具體文字不同(tong),但表達的(de)(de)內容十(shi)(shi)分(fen)(fen)相似。

二、信息不等于智慧(Insight)

好吧,現在(zai)我(wo)們(men)去(qu)除了數據(ju)中所有(you)重(zhong)復(fu)的部分,也(ye)整合了內容類似的數據(ju),現在(zai)我(wo)們(men)剩下的全(quan)是信息(xi)了,這對我(wo)們(men)就一定(ding)有(you)用嗎(ma)?不一定(ding),信息(xi)要能轉(zhuan)化成(cheng)智慧(hui),至少要滿足一下三個標(biao)準(zhun):

可(ke)(ke)破(po)譯性。這(zhe)可(ke)(ke)能是(shi)個大數據(ju)時(shi)(shi)代特(te)有的(de)(de)問題,越(yue)來(lai)越(yue)多的(de)(de)企業每天都會生(sheng)產出大量(liang)的(de)(de)數據(ju),卻還沒想好怎么(me)用,因(yin)此,他們就(jiu)將這(zhe)些(xie)數據(ju)暫時(shi)(shi)非結構化(unstructured)的(de)(de)存儲起來(lai)。這(zhe)些(xie)非結構化的(de)(de)數據(ju)卻不(bu)一定可(ke)(ke)破(po)譯。比如(ru)說,你記(ji)錄(lu)了(le)某客(ke)戶(hu)在你網站上三次翻(fan)頁的(de)(de)時(shi)(shi)間間隔:3秒,2秒,17秒,卻忘記(ji)標(biao)注這(zhe)三個時(shi)(shi)間到底代表了(le)什么(me),這(zhe)些(xie)數據(ju)是(shi)信息(非重復(fu)性),卻不(bu)可(ke)(ke)破(po)譯,因(yin)此不(bu)可(ke)(ke)能成為智(zhi)慧。

關(guan)(guan)聯性。我們曾(ceng)經對關(guan)(guan)聯性的重要性進行過解(jie)釋。這里不再(zai)贅述了,無關(guan)(guan)的信息,至多只(zhi)是噪音。

新(xin)穎(ying)性(xing)。這(zhe)個(ge)和(he)我(wo)前文舉(ju)的(de)那(nei)個(ge)社交網站的(de)例子(zi)類似(si),不(bu)同的(de)是,這(zhe)里的(de)新(xin)穎(ying)性(xing)很多(duo)(duo)時(shi)候(hou)無法僅僅根據我(wo)們(men)(men)手上(shang)的(de)數據和(he)信(xin)息(xi)進行判斷(duan)。舉(ju)個(ge)例子(zi),某電子(zi)商務公司通(tong)過(guo)一(yi)組數據/信(xin)息(xi),分析(xi)出了客戶愿意(yi)為當天送貨(huo)的(de)產品(pin)多(duo)(duo)支付10塊錢,然后(hou)又通(tong)過(guo)另一(yi)組完全獨立的(de)數據/信(xin)息(xi)得(de)到了同樣的(de)內容,這(zhe)樣的(de)情況下,后(hou)者就不(bu)具備(bei)新(xin)穎(ying)性(xing)。不(bu)幸(xing)的(de)是,很多(duo)(duo)時(shi)候(hou),我(wo)們(men)(men)只有在處理了大量的(de)數據和(he)信(xin)息(xi)以后(hou),才(cai)能判斷(duan)它們(men)(men)的(de)新(xin)穎(ying)性(xing)。

說了(le)這么多,是想表達(da),其實我們手上(shang)有(you)(you)用的(de)(de)數(shu)據(ju)(ju)(ju)并沒有(you)(you)我們想象的(de)(de)那(nei)么多——大數(shu)據(ju)(ju)(ju)本身(shen)就(jiu)是個(ge)(ge)耍噱頭的(de)(de)詞。在如(ru)今(jin)這個(ge)(ge)年代,一(yi)個(ge)(ge)普(pu)通的(de)(de)創業公(gong)司每天就(jiu)能生(sheng)產1GB以(yi)(yi)上(shang)的(de)(de)數(shu)據(ju)(ju)(ju),稍微大一(yi)點的(de)(de)公(gong)司每天生(sheng)產的(de)(de)數(shu)據(ju)(ju)(ju)都(dou)以(yi)(yi)TB來技(ji)術。但在花錢進行(xing)大數(shu)據(ju)(ju)(ju)分析之前(qian),我們要意識到,數(shu)據(ju)(ju)(ju)不代表信息(xi),更不代表智慧(hui)。

文章來源于縱橫數據(

在線客服
微信公眾號
免費撥打400-1886560
免費撥打0592-5580190 免費(fei)撥(bo)打 400-1886560 或 0592-5580190
返回頂部
返回頭部 返回頂(ding)部