《數(shù)據(jù)分析簡史∶從概率到大數(shù)據(jù)》 項亦子 著 上??萍冀逃霭嫔绯霭?/p>
■項亦子
“數(shù)據(jù)是21世紀的石油,而分析則是內燃機。”這是Gartner研究院高級副總裁彼得·桑德加在一次報告上的講話觀點。沒有內燃機,石油也僅是埋在地下的一堆烴化物;沒有分析,數(shù)據(jù)也就是磁盤中的二進制。數(shù)據(jù)分析作為一個日益重要的科學領域,成為了人工智能時代的基石。如今大紅大紫的人工智能ChatGPT其基本算法來自于深度學習和強化學習,而ChatGPT的訓練則是用了大數(shù)據(jù)和大算力??茖W家司馬賀曾給出如下定義:“如果一個系統(tǒng)能夠通過執(zhí)行某個過程改進它的性能,這就是學習。”而所謂“訓練”則是為了讓人工智能歸納出模型而提供大量的數(shù)據(jù)讓它學習。總的來說,人類創(chuàng)造的人工智能如今能達到這個地步,與數(shù)據(jù)分析學科的一步步進階是分不開的。要想在AI領域有所建樹,學習數(shù)據(jù)分析是必由之路。
數(shù)據(jù)分析不僅僅是人工智能的基礎,它現(xiàn)在還被運用于各個領域。我們正一腳跨入的這個人工智能時代,數(shù)據(jù)無處不在,不僅僅科技領域帶來了大數(shù)據(jù),商務世界也每天都在產生海量數(shù)據(jù)——金融領域利用數(shù)據(jù)對風險進行管控,外貿領域利用數(shù)據(jù)對買方賣方信用度進行考察。日常生活中處處有數(shù)據(jù),刷手機時有大數(shù)據(jù)推送,上網(wǎng)買書時有網(wǎng)站的推薦系統(tǒng),看足球比賽時有實時數(shù)據(jù)統(tǒng)計。了解數(shù)據(jù)分析的簡要歷史,能讓你輕松愉快地走近數(shù)據(jù)分析的世界。
數(shù)據(jù)分析和科學是分不開的,它一直輔佐著科學的發(fā)展,伴隨科學成長。我們回顧歷史,人類科學史上歷經了三個階段:被動地接受大自然賜予的一切并且探索客觀規(guī)律;研究信息并且用仿真模擬探索自然;研究主觀世界和人工智能。這三個階段科學和數(shù)據(jù)分析是保持同步的。
統(tǒng)計學家拉奧曾經說過:“在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數(shù)學;在理性的世界里,所有的判斷都是統(tǒng)計學。”對于數(shù)據(jù)分析的重要組成部分——統(tǒng)計學,《數(shù)據(jù)分析簡史》一書將數(shù)據(jù)科學三個最重要的歷史階段和兩次統(tǒng)計學革命娓娓道來。從文藝復興起在距今500多年的歷程里,數(shù)據(jù)科學領域出現(xiàn)了一個接一個的才俊,從天文學家開普勒、神秘的牧師貝葉斯,到模糊數(shù)學開創(chuàng)者扎德、分形幾何大師芒德布羅,他們所開創(chuàng)的天文數(shù)據(jù)統(tǒng)計、主觀概率、分形統(tǒng)計……從不同角度對標準統(tǒng)計學作出了突破。最后就到了如今的時代,統(tǒng)計學習刮起了統(tǒng)計學革命的風暴,和大數(shù)據(jù)一起為即將到來的人工智能時代打下了基礎。
《數(shù)據(jù)分析簡史》中所舉的例子多是輕松的話題,比如世界杯、房價、股市、旅游、婚戀等。書的正文以故事為主,數(shù)學概念和公式集中放在了每章末尾的注釋中。沒有專業(yè)數(shù)學知識背景的讀者可以選擇跳過注釋部分,輕松讀懂本書,而對具體數(shù)學推導過程有興趣的讀者,又可以在注釋中解惑。
近年來,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等技術加速創(chuàng)新,日益融入經濟社會發(fā)展各領域全過程,各國競相制定數(shù)字經濟發(fā)展戰(zhàn)略,出臺鼓勵政策。數(shù)字經濟發(fā)展速度之快、輻射范圍之廣、影響程度之深前所未有,正在成為重組全球要素資源、重塑全球經濟結構、改變全球競爭格局的關鍵力量。
《數(shù)據(jù)分析簡史》在此時問世,也算是做了一點微末的科學普及的貢獻。
- 2023-08-01《中國共產黨軍事工作重要文獻選編》出版發(fā)行
- 2023-08-01第31屆全國圖書交易博覽會在山東舉辦
- 2023-08-01【動態(tài)】文學評論專著《時空印記》出版
- 2023-08-01探索新時代軍人心靈秘密