《大數(shù)據(jù)》讀后感2000字
如今,我們正處于一個大數(shù)據(jù)時代,有時候數(shù)據(jù)給了我們有力的證明。以下是、《大數(shù)據(jù)》讀后感2000字,歡迎閱覽!
《大數(shù)據(jù)》讀后感2000字【1】
這兩年,大數(shù)據(jù),云計算的思想就像小蘋果的音樂一樣,傳的到處都是,每一個公司不管是互聯(lián)網(wǎng)公司還是傳統(tǒng)企業(yè),都標榜自己的大數(shù)據(jù)。
1、實體物聯(lián)網(wǎng)與虛擬物聯(lián)網(wǎng)
曾幾何時,物聯(lián)網(wǎng)的概念鬧得風生水起,龐大的物聯(lián)網(wǎng)能夠讓世間大量的物體,都能夠被檢測 并聯(lián)網(wǎng),包括了人、車、房等一切能夠被聯(lián)網(wǎng)的物體,這些物體都能夠以種方式被感知他的存在,并對其信息記錄在案,以供使用。在若干年前,這還是一種看似遙不可及的事物,要對每個物體都貼上一個所謂的RFID的標簽,顯得不切實際。如今,隨著手機的大量使用,人類本身也被加入了物聯(lián)網(wǎng)中。為什么要物聯(lián)網(wǎng)?是為了獲取什么?要知道物聯(lián)網(wǎng)獲取了什么,只需要看看在一個物體在沒有加入物聯(lián)網(wǎng)與加入物聯(lián)網(wǎng)之后,我們多出了哪些東西便能夠知曉。那么,很明顯,我們需要通過某種方式來獲取該物體的信息,這種存儲下來的信息,就叫做——數(shù)據(jù)。
物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)是實體的物品之間的信息,而現(xiàn)在的互聯(lián)網(wǎng)上,占最大數(shù)據(jù)量的,是虛擬物品,或者叫做網(wǎng)絡虛擬物品。由于網(wǎng)絡物體是直接寄生于網(wǎng)絡,具有能夠方便的接入網(wǎng)絡的特征,因此,在獲取實體物體信息還有一定難度的時期,占有很大優(yōu)勢。但今后實體的物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量一定會不斷增加,或許,能夠超越網(wǎng)絡上的物物相連數(shù)據(jù)量。
網(wǎng)絡的廣泛使用,使得信息的產(chǎn)生于傳遍變得容易,每個接入網(wǎng)絡的人都以一定的角色存在,都是網(wǎng)絡的信息的創(chuàng)造者。對于所產(chǎn)生的信息而言,每個接入網(wǎng)絡的人又身兼多角,對于網(wǎng)絡服務商,他是網(wǎng)絡使用者的角色;對于門戶網(wǎng)站而言,他是使用的用戶;對于社交網(wǎng)站而言,我們則扮演一個虛擬或者真實的網(wǎng)絡角色;對于瀏覽器而言,他是一系列的瀏覽網(wǎng)頁、一些列鼠標動作的角色… 不同的角色取決于對方需要從我們的行為中獲取哪些信息。將網(wǎng)絡上各種角色看成是虛擬的物體,那么,這種虛擬物體構(gòu)成的虛擬物聯(lián)網(wǎng)便產(chǎn)生了巨大的數(shù)據(jù)量。經(jīng)歷過一直以來缺乏信息獲取渠道的日子,現(xiàn)在,既然信息獲取變得如此容易,那么,必然迎來信息量暴增的時代——大數(shù)據(jù)時代。
2、思維的轉(zhuǎn)變
技術的改變,使得我們思維方式也要隨之發(fā)生變化。在過去的小數(shù)據(jù)時代,由于獲取信息、存儲信息、整理信息都是費時費力的活,我們只能精打細算,捉摸著如何以最小的代價、最快的方式來收集盡可能準確的信息。之所以會有抽樣統(tǒng)計的方式,是受技術所限,無法獲得全體的樣本,或者就算獲取了也無法在合理的時間內(nèi)進行處理。由于信息獲取代價大,使得我們不得不在獲取信息前,就把一切都想清楚,才能夠著手處理。這就像在計算機出現(xiàn)的初期,使用紙袋來編碼的時期,一次出錯的代價太大,所以人們不得不在輸入前將代碼驗證過無數(shù)遍之后才敢輸入到機器中。而現(xiàn)代計算機讓編碼的效率大大提升,這才使得人們能夠創(chuàng)造出更加強大的軟件。人們不需要在著手編碼前就對代碼過分深思熟慮,因為機器會幫助你解決一些問題。因此,那些擔心由于獲取數(shù)據(jù)太方便,進行數(shù)據(jù)處理、分析代價太小而使人們變得懶惰或者做事欠考慮的家伙,真是杞人憂天。歷史上,技術的進步都會提升人類的生產(chǎn)力,但卻沒有讓人們變得懶惰,因為與此同時,欲望也隨之增長。人類只會變得更偉大。
因此,大數(shù)據(jù)時代,這個數(shù)據(jù)更加全面的時代,我們可以涉足一些之前由于缺乏數(shù)據(jù)而無法涉及的領域,例如——預測。這是一個令人興奮的領域,但其實這個領域早有苗頭,而且大家都是受益者。我們平時使用的輸入法中的智能聯(lián)想功能,能夠根據(jù)我們之前輸入的文字,來預測我們接下來有可能輸入的文字,以節(jié)省我們的輸入時間。這種算法里,沒有人工智能,而只有人們大量的輸入習慣的統(tǒng)計,通過大量數(shù)據(jù)的統(tǒng)計來預測,是一個統(tǒng)計學的方式而非加入了特有的規(guī)則或者邏輯。這便引出了在大數(shù)據(jù)時代,對于信息處理的一種重要方式,基于統(tǒng)計,得出不同個體的相關關系,卻無需了解其因果關系,而我們則受益于相關關系。這種方式,看似有些投機取巧,卻能夠在關鍵時刻令我們處于優(yōu)勢地位。我們已經(jīng)習慣了先知道某些事物的因果邏輯,繼而推斷出相應的結(jié)果。但世間總會有一些令人無法用合理的邏輯進行解釋的現(xiàn)象,若通過大數(shù)據(jù)分析,我們能夠跳過邏輯階段直接享用某些一些結(jié)果(沃爾瑪?shù)钠【萍幽虿及咐?,豈不樂哉。當然,嚴密的邏輯永遠是值得尊敬的。
3、互聯(lián)網(wǎng)的黏性
在經(jīng)歷過了從廣度上通過新花樣來吸引用戶的時代,由于技術的提高,一個創(chuàng)業(yè)者在一個新的領域開辟的東西很容易被其他人所復制。在這個時候,深度很重要。特別是購物網(wǎng)站、微薄、門戶網(wǎng)站這類信息量大的網(wǎng)站,越是了解一個用戶,優(yōu)勢就越大。所以,在技術已經(jīng)不是最重要的因素的時代,如何增加用戶的黏性、忠誠度便是首要的。通過用戶之前的信息,來推測用戶的喜好,給用戶推薦相應的信息或物品。當你越了解一個用戶,而別人卻不了解時,這個用戶就越離不開你。微薄中有他的`智能排序功能、新聞門戶中有“今日頭條”應用,各類購物網(wǎng)站有他的推薦算法(但這個純粹為了增加消費而非增加用戶黏性),都能夠根據(jù)用戶之前的瀏覽、偏好來給出相應的推薦。這些的基礎,都是擁有用戶的行為記錄,否則,都無從談起。
各行各業(yè),都在瘋狂的抓緊時機,獲取數(shù)據(jù),擁有足量的數(shù)據(jù),那一切就變得皆有可能。
《大數(shù)據(jù)》讀后感2000字【2】
凡是過去,皆為序曲是大數(shù)據(jù)業(yè)者最喜歡引用的語句。大數(shù)據(jù)是現(xiàn)在的潮流,大數(shù)據(jù)時代被認為是了解大數(shù)據(jù)的初級讀物。近期連續(xù)讀了兩遍,第二遍是為了寫這篇讀后感,總體而言,值得一看,但細節(jié)方面卻需要討論了。
維基百科對大數(shù)據(jù)的解釋:Big data,或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達到截取、管理、處理、并整理成為人類所能解讀的信息。
有人說現(xiàn)在是讀圖時代,除去小說、心靈雞湯以外,現(xiàn)在的暢銷書基本都有圖片,這本書是一個特例
首先嘗試解析一下作者的三大觀點,這三大觀點是大數(shù)據(jù)業(yè)者很喜歡引用的三句話:
1 不是隨機樣本,而是全體數(shù)據(jù)
我想所有人都能意識到對全體數(shù)據(jù)的分析優(yōu)于對隨機樣本的分析,但在現(xiàn)實中我們經(jīng)常拿不到全體數(shù)據(jù):一是數(shù)據(jù)的收集方法,每一種方法都有適用的范圍,不太可能包羅萬象;二是數(shù)據(jù)分析的角度,戰(zhàn)斗機只能統(tǒng)計到飛回來的飛機上的彈孔,而墜毀的則無法統(tǒng)計,沃德通過分析飛回來的戰(zhàn)斗機得出來最易導致墜毀的薄弱點;三是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些數(shù)據(jù)。“采樣分析是信息缺乏時代和信息流通受限制的模擬數(shù)據(jù)時代的產(chǎn)物”,作者顯然只關注了一部分原因。
從語言的理解上看,什么是全體數(shù)據(jù),究竟是“我們需要的所有數(shù)據(jù)”,還是“我們能收集到的所有數(shù)據(jù)”,書中的很多商業(yè)案例中,處理的只是“我們能收集到的所有數(shù)據(jù)”,或者說是“我們認為的全體數(shù)據(jù)”。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例“Farecast使用了每一條航線整整一年的價格數(shù)據(jù)來進行預測”,而“整整一年”就是一個采樣,或者是“我們需要的所有數(shù)據(jù)”。
從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是“收集全世界的書”,實現(xiàn)“世界知識總匯”的夢想,國內(nèi)的乾隆匯編四庫全書,每個收集的過程都有主觀因素在里面,而他們當時都認為可以收集全部的書籍,到最后,我們也沒有得到那個夢中的全體。
2 不是精確性,而是混雜性
既然我們過去總是在抽樣,那本身就是在一個置信水平下,有明確的容錯度或者是偏差值。人類永遠知道我們是在精確性受限的條件下工作。同時,作者本身也承認 “錯誤并不是大數(shù)據(jù)固有的特性,而是一個亟需我們?nèi)ヌ幚淼默F(xiàn)實問題,并且有可能長期存在”。那大數(shù)據(jù)的特征究竟是精確性還是混雜性?
由此衍生出一個問題,大數(shù)據(jù)的品質(zhì)如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小數(shù)據(jù)時代?這里的邏輯我沒有理順)。就像品質(zhì)管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結(jié)構(gòu)化數(shù)據(jù)的處理,譬如說對新聞的量化、情感的分析,目前對非SQL的應用還有巨大的進步空間。
“一個東西要出故障,不會是瞬間的,而是慢慢地出問題的”!巴ㄟ^找出一個關聯(lián)物并監(jiān)控它,我們就能預測未來”。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之于項目管理行業(yè),如果一個項目出了嚴重的問題,我們相信,肯定是很多因素和過程環(huán)節(jié)中出了問題,我們也失去了很多次挽救的機會。而我們一味的容忍混雜性的話,結(jié)果顯然是不能接受的。
3 不是因果關系,而是相關關系
這是本書對大數(shù)據(jù)理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。
相關關系我實在是太熟了,打小就學的算命就是典型的“不是因果關系,而是相關關系”。算命其實是對趨向性的總結(jié),在給定條件下,告訴你需要遠離什么,接近什么,但不會告訴你為什么那樣做。
我們很多時候都在說科學,然而,什么是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的范圍;二、在這個范圍內(nèi)樹立一個強制正確的公理;三、有明確的推演過程;四 可以復制。科學的霸道體現(xiàn)在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大數(shù)據(jù)不符合科學。
混沌學理論中的蝴蝶效應主要關注相關關系。它是指對初始條件敏感性的一種依賴現(xiàn)象,輸入端微小的差別會迅速放大到輸出端,但能輸出什么,誰也不知道。
人類一旦放棄了對因果關系的追求,也就放棄了自身最優(yōu)秀的品質(zhì):意志力。很多人不愿意相信算命是擔心一旦知道了命運,就無法再去奮斗。即使我相信算命,也在探求相關關系中的因果要素。我放棄第一份工作的原因之一是厭倦了如此確定的明天:一個任務發(fā)出去,大概能預測到哪些環(huán)節(jié)會出問題,只要不去 follow,這些環(huán)節(jié)十有八九會出問題。
解析完這三大觀點,下面是我對大數(shù)據(jù)理論的一些疑惑。大數(shù)據(jù)是目前風行的反饋經(jīng)濟中的重要一環(huán),在金融、互聯(lián)網(wǎng)行業(yè)的應用最為廣泛,而這些行業(yè)都是大家所認為的高薪領域。很多時候我就在想,所謂無形的手所產(chǎn)生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數(shù)人跟風,自然就生造出購物節(jié),至于合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。
看完這本書,總是覺得作者說的過于絕對,也許是我的認識太淺了吧,所以最后用法演四戒做總結(jié):
勢不可以使盡,使盡則禍必至
福不可以受盡,受盡則緣必孤
話不可以說盡,說盡則人必易
規(guī)矩不可行盡,行盡則事必繁
【《大數(shù)據(jù)》讀后感2000字】相關文章:
為什么移動硬盤無法拷貝大容量數(shù)據(jù)07-19
四大數(shù)據(jù)描繪職業(yè)教育發(fā)展穩(wěn)健步伐10-06
EXCEL數(shù)據(jù)錄入技巧10-30
硬盤數(shù)據(jù)丟失后如何進行數(shù)據(jù)恢復07-19
計算機硬盤數(shù)據(jù)備份及數(shù)據(jù)恢復技術07-07
數(shù)據(jù)維護求職簡歷范文08-14