可可簡歷網

位置:首頁 > 熱點 > 其他文案

大資料時代的閱讀心得感悟3篇 數字化閱讀:大資料時代的感悟

大資料時代,資訊爆炸讓我們面臨著閱讀壓力與認知挑戰。在這個背景下,如何進行高效、有序的閱讀,是每一個人都需要解決的問題。在不斷摸索中,我們也在逐漸找到了應對大資料時代閱讀的方法與體會。

大資料時代的閱讀心得感悟3篇 數字化閱讀:大資料時代的感悟

第1篇

有人說現在是讀圖時代,除去小說、心靈雞湯以外,現在的暢銷書基本都有圖片,這本書是一個特例(書裡唯一的圖是出品方湛廬文化做的)

首先嚐試解析一下作者的三大觀點,這三大觀點是大資料業者很喜歡引用的三句話:

我想所有人都能意識到對全體資料的分析優於對隨機樣本的分析,但在現實中我們經常拿不到全體資料:一是物件的特性:比如炸彈的威力,你不可能把所有炸彈都炸掉來得到全體資料;二是資料的收集方法,每一種方法都有適用的範圍,不太可能包羅永珍;三是資料分析的角度,戰鬥機只能統計到飛回來的飛機上的彈孔,而墜毀的則無法統計,沃德通過分析飛回來的戰鬥機得出來最易導致墜毀的薄弱點;四是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些資料。“取樣分析是資訊缺乏時代和資訊流通受限制的模擬資料時代的產物”,作者顯然只關注了一部分原因。

從語言的理解上看,什麼是全體資料,究竟是“我們需要的所有資料”,還是“我們能收集到的所有資料”,書中的很多商業案例中,處理的只是“我們能收集到的所有資料”,或者說是“我們認為的全體資料”。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例“farecast使用了每一條航線整整一年的價格資料來進行預測”,而“整整一年”就是一個取樣,或者是“我們需要的所有資料”。

從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是“收集全世界的書”,實現“世界知識總彙”的夢想,國內的乾隆彙編四庫全書,每個收集的過程都有主觀因素在裡面,而他們當時都認為可以收集全部的書籍,到最後,我們也沒有得到那個夢中的全體。

既然我們過去總是在抽樣,那本身就是在一個置信水平下,有明確的容錯度或者是偏差值。人類永遠知道我們是在精確性受限的條件下工作。同時,作者本身也承認 “錯誤並不是大資料固有的特性,而是一個亟需我們去處理的現實問題,並且有可能長期存在”。那大資料的特徵究竟是精確性還是混雜性?

由此衍生出一個問題,大資料的品質如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小資料時代?這裡的邏輯我沒有理順)。就像品質管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結構化資料的處理,譬如說對新聞的量化、情感的分析,目前對非sql的應用還有巨大的進步空間。

“一個東西要出故障,不會是瞬間的,而是慢慢地出問題的”。“通過找出一個關聯物並監控它,我們就能預測未來”。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之於專案管理行業,如果一個專案出了嚴重的問題,我們相信,肯定是很多因素和過程環節中出了問題,我們也失去了很多次挽救的機會。而我們一味的`容忍混雜性的話,結果顯然是不能接受的。

這是本書對大資料理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。

相關關係我實在是太熟了,打小就學的算命就是典型的“不是因果關係,而是相關關係”。算命其實是對趨向性的總結,在給定條件下,告訴你需要遠離什麼,接近什麼,但不會告訴你為什麼那樣做。

我們很多時候都在說科學,然而,什麼是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的範圍;二、在這個範圍內樹立一個強制正確的公理;三、有明確的推演過程;四 可以複製。科學的霸道體現在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大資料不符合科學。

混沌學理論中的蝴蝶效應主要關注相關關係。它是指對初始條件敏感性的一種依賴現象,輸入端微小的差別會迅速放大到輸出端,但能輸出什麼,誰也不知道。

人類一旦放棄了對因果關係的追求,也就放棄了自身最優秀的品質:意志力。很多人不願意相信算命是擔心一旦知道了命運,就無法再去奮鬥。即使我相信算命,也在探求相關關係中的因果要素。我放棄第一份工作的原因之一是厭倦瞭如此確定的明天:一個任務發出去,大概能預測到哪些環節會出問題,只要不去 follow,這些環節十有_會出問題。

解析完這三大觀點,下面是我對大資料理論的一些疑惑。大資料是目前風行的反饋經濟中的重要一環,在金融、網際網路行業的應用最為廣泛,而這些行業都是大家所認為的高薪領域。很多時候我就在想,所謂無形的手所產生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數人跟風,自然就生造出購物節,至於合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。

1 資料獨裁。個人意志將受制於集體意志,個人的自由在哪裡?用大資料預測來懲罰人的行為又確定的違反了無罪推定的原理。

2 所有資料都來源於過去,大資料分析出來的確定性結果是否意味著我們在重複過去?拉普拉斯的決定論已經被認為是錯誤的,愛因斯坦也說過“上帝不會跟宇宙玩骰子”,但霍金不同意這句話。

大資料時代的閱讀心得感悟3篇 數字化閱讀:大資料時代的感悟 第2張

第2篇

在看《大資料》之前,我只知道社會越來越數字化了,看完之後,才覺悟到:人類將迎來一個新的時代。

數字化已經把我們帶入一個資訊時代,大資料卻把我們捲進了一場科技風暴之中,這本書中,作者為我們開啟了一個更包容更廣闊的新時代,大資料把社會的方方面面融合在了一起,曾經看似因果聯絡緊密的事物,可能變得不再那麼重要;毫無關聯的事物,可能隱藏著重要的資訊,從科技、商業,到醫療、政治、教育、文化,大資料一概席捲囊括,它改變著我們的傳統思維,為這個時代注入了新鮮的血液,就像作者書中所說:“這項技術終將改變我們所居住的星球上的許多東西。”

大資料最顯著的影響是對於電子商務,通過大資料,最先洞察出潛在市場的,也必然最先佔領市場。而電子商務對實業的衝擊又是勢不可擋,可見,掌握了大資料就主導了市場,擁有了先進的科技才能擁有堅實的競爭力。在醫療方面,曾經的非典時期,就是一個很好的例證,正是有大資料的預測功能,才使疫情得到了控制。在更小的方面,他也同樣改變著我們的生活,書中提到美國著名計算機專家奧倫 · 埃齊奧尼發明了飛機機票價格預測軟體,就是利用大資料造福我們生活的很好例子。

大資料不僅節省了時間,提高了效率,更將人類帶入一個新的文明階段。從分析因果總結經驗,轉變為蒐集資料預測未來;由原來的滯後性變為現在的預見性——大大提高了人類認識世界、改造世界的能力,變被動為主動。大資料為我們掀開了歷史新紀元,不敢想象它將會為我們帶來什麼,或許會出現新奇的生活方式,從未有過的職業,聞所未聞的商業模式,百家爭鳴的文化高峰;也或許會解開更多未解之謎,探索到宇宙之外的祕密。總之,毫無疑問的是,大資料為我們帶來的未來是超乎想象的。

這本書中作者提到最多的是:改變我們的傳統思維,摒棄精確性轉向巨集觀。從總結因果轉向預測。這個世界正以驚人的速度向前發展,資料大爆炸的波及範圍遠超乎我們的想象,單純靠人類的主觀判斷力是多麼的有限,大資料早晚會取而代之這一現象,這必將影響我們的生活和工作,我們也只有認清這種趨勢,改變思維,調整步伐,緊跟時代才行。即使不能與時代同步,也儘量做到避免固步自封,認識大資料、利用大資料趨利避害,為我們的生活造福!

第3篇

?大資料時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大資料研究的先河之作。這本書最大的優點就在於作者利用上百個例子來對大資料的方方面面做了詳細解說,讓外行也很容易理解。結構上,作者通過大資料時代的思維變革、商業變革和管理變革三個角度依次闡述,條理清晰。

所謂"大資料",按作者的說法,就是"所有資料"。隨著計算機運算速度和儲存能力的發展,收集資料變得越來越簡單,儲存資料的成本越來越低。在過去,由於技術限制,人們做統計時只能收集有限的資料做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現的誤差;統計結果往往不能重複使用,造成資料利用率低。而現在則可以做到"樣本=總體"。資料的增多帶來不可避免的精確性問題。 "小資料"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大資料"時代對精確性不再那麼要求苛刻——也無法要求太嚴格——資料的數量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大資料時代,我們應該從追求"因果關係"的舊思維方式向追求"相關關係"轉變。 在我看來,這實際上是通過大資料來透視一種事物的發展趨勢,而很多精確學科領域依然需要探尋"因果關係"解決更有針對性的問題,所以,這侷限了這一轉變只能在特定的領域發生。作者自己也說,"大資料的相關性將人們指向了比探討因果關係更有前景的領域。"

大資料時代的資料獲取方式是多種多樣,資料形式也是千變萬化,任何文字、行為、萬物都可以被資料化後用來分析。對這些資料的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高資料的利用率。當然資料並不是無限使用,時效、環境的變化肯定會對資料提出新的要求,所以資料的折舊也是應當考慮的。這又引出了對資料這一無形資產的估值可能性。對於這樣的公司來說,資料就是他們的核心,如何在資產負債表上給他們一個公正的體現正是我們需要考慮的。

大資料時代的價值鏈由三部分構成,我把它們簡化為"生產—分析—使用"三個環節,這對應書中的三種類型公司: 第一種是基於資料本身的公司,第二種是基於技能,第三種則是基於思維。在大資料早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從資料本身來挖掘。這是假定了一個成熟的市場,人人都瞭解了大資料的用途。

對於普通人來說,大資料時代最關心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業之下,還面臨潛在的洩露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流於形式的使用授權。大資料甚至能預測一個人的犯罪動機,這給監管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。

大資料時代的風險控制靠的是"演算法師",類似會計師一樣的職業,對大資料的準確度或有效性進行鑑定。這能在一定程度上防止資料濫用的發生和資料獨裁。當今的法律亦需對大資料監管進行修訂補充。

當代大資料發展主要由科技公司推動,相信在不久的將來更多的傳統領域會意識到大資料的重要性。但我們也應該保持清醒,大資料並不是萬能藥,對某些領域或環節,使用大資料是一種簡單且實用的選擇;但對某些領域,盲目使用大資料只會適得其反。