認識 大 數據 的 第 一 本書

大數據是一種新穎、包羅萬象、如大自然一般廣大又雜亂的自然現象。想要搞懂它的規模與範疇及其機會和挑戰,需要新型的意識。而想要了解大數據的概念,則需要抑制許多關於資料上的傳統期望與假設,像是完整性、清晰度、一致性、以及簡潔性。對大數據的理解與掌握已從夢想慢慢轉變為現實,它是一個快速演化的領域,不論在值價與能力上皆呈指數型成長。

關於大數據的書籍愈來愈多,大部分都屬於兩種類型,有些著重在商業觀點,討論若想從大數據提供的諸多機會中獲得商業利益,需要什麼樣的策略性內部轉移。另一種則是著重在特定技術平台,例如Hadoop或Spark。而本書的目標則是將商業考量與技術完美地整合在一起。

感謝Maharishi Mahesh Yogi創辦了這所美好的大學,其以意識為基礎的環境,讓撰寫這本持續演進的書得以成真。感謝許多過去與當前學生對本書的貢獻。感謝Dheeraj Pandey協助「網路日誌分析器」應用程式與其細節,Suraj Thapalia協助Hadoop的安裝指導,Enkh Tseeleesuren協助撰寫Spark教學。感謝我的家人在此過程中的支持,本書亦得到許多同事與學生的讚許。

願大數據原力與您同在!

內容簡介

完整的大數據概論
大數據是無所不包的名詞,它代表無法使用傳統資料管理工具來管理十分大量、快速、且高度多樣又複雜的資料。理想上大數據包含了所有資料類型,可用來協助我們在正確的時間,以正確的數量,傳達正確的資訊給適當的人,最終協助人們做出正確決策。本書將為管理階層與資料科學家提供完整的大數據概論。涵蓋大數據的關鍵挑戰與優點,以及組織所需的必備工具與技術,還有能從大數據獲得的好處。

本書涵蓋內容包括:
.大數據的商業應用
.頂尖組織如何應用大數據
.大數據的生態系統
.大數據的應用、入門與教學

作者

Anil Maheshwari

Anil Maheshwari博士是瑪赫西管理大學的電腦科學與資訊系統教授以及資料分析中心總監。他在IBM Austin TX扮演領導角色,並且任職於許多其他公司,包括新創公司。他同時也是一位超覺靜坐技術的執業者。
個人網站:anilmah.com

目錄

第1章|大數據整體介紹
第2章|大數據來源與應用
第3章|大數據架構
第4章|使用 Hadoop 進行分散式運算
第5章|運用 MapReduce 進行平行處理
第6章|NoSQL 資料庫
第7章|運用 Spark 進行串流處理
第8章|提取資料
第9章|雲端運算
第10章|網路日誌分析器應用程式個案研究
第11章|資料探勘入門
第12章|大數據程式設計入門
附錄 A|在 Virtual Box 上使用 Cloudera 安裝 Hadoop
附錄 B|在 Amazon Web Services (AWS) Elastic Compute Cluster (EC2) 上安裝 Hadoop
附錄 C|Spark 安裝與教學

序/導讀

大數據是一種新穎、包羅萬象、如大自然一般廣大又雜亂的自然現象。想要搞懂它的規模與範疇及其機會和挑戰,需要新型的意識。而想要了解大數據的概念,則需要抑制許多關於資料上的傳統期望與假設,像是完整性、清晰度、一致性、以及簡潔性。對大數據的理解與掌握已從夢想慢慢轉變為現實,它是一個快速演化的領域,不論在值價與能力上皆呈指數型成長。

關於大數據的書籍愈來愈多,大部分都屬於兩種類型,有些著重在商業觀點,討論若想從大數據提供的諸多機會中獲得商業利益,需要什麼樣的策略性內部轉移。另一種則是著重在特定技術平台,例如Hadoop或Spark。而本書的目標則是將商業考量與技術完美地整合在一起。

感謝Maharishi Mahesh Yogi創辦了這所美好的大學,其以意識為基礎的環境,讓撰寫這本持續演進的書得以成真。感謝許多過去與當前學生對本書的貢獻。感謝Dheeraj Pandey協助「網路日誌分析器」應用程式與其細節,Suraj Thapalia協助Hadoop的安裝指導,Enkh Tseeleesuren協助撰寫Spark教學。感謝我的家人在此過程中的支持,本書亦得到許多同事與學生的讚許。

願大數據原力與您同在!

試閱

大數據的應用

記錄並處理所有這些資料需要更多天賦、資源與時間。若能發揮想像力且有意義地運用此資料,將能為業務帶來好處。主要有三種商業應用類型,各有不同程度的轉化潛力。

監看與追蹤應用

此為大數據首要且最基本的應用。它們幾乎可協助所有產業改善其商業效率。以下為一些特殊的應用。

公共衛生監督

美國政府鼓勵所有醫療保健相關單位皆建立一個全國性平台以互相交流與建立資料分享標準。這將能啟動健康資料的再次運用,進而發展大數據分析系統與個人化全面精準醫學。它會是一種像Google流感趨勢這樣的廣泛平台。

消費者情感監測

社交媒體已變得比一般廣告更為有力。許多消費性商品公司已將許多廣告預算從傳統媒體轉移至社群媒體上。他們設置了大數據監聽平台(圖2.6),在那裡篩選社群媒體資料流(包括推文與Facebook貼文以及部落格貼文),並依特定客層與區域,分析特定關鍵字或情感。由此分析所得的可行動資訊,便被傳送至行銷專業人員以進行適當的行動,特別是在剛推出新產品到市場上時。

資產追蹤

美國國防部鼓勵工業界開發小型RFID晶片,用來避免最終會出現在航空電子設備或電路板等其他裝置上的偽造電子零件。飛機則為感應器重度使用者之一,它會追蹤飛機上各個部位在各層面上的效能。此資料會呈現在儀表板上,並儲存下來供稍後詳細分析。這些感應器再配合通訊裝置一起運作,便能產生大量的資料。

對零售商來說,顧客與員工的偷竊行為乃是營收損失的主要來源。店內所有高價品項可以裝上RFID標籤,並在店門口設置RF感應器。這將有助於保護產品,減少店內偷窺。

供應鏈的監看

船隻上的所有貨櫃皆使用RFID標籤來傳輸其狀態與位置。因此,零售商與其供應商便能透過全球供應鏈取得即時庫存可見度。零售商可得知各品項位於倉庫的確實位置,因而能在正確時刻送至商店。這對需要及時出售的季節性商品來說特別重要,否則便得打折出清。在所有品項皆釘上RFID下,零售商還能全盤掌握每一個品項,進而對客戶做出更好的服務。

詳細資料

詳細資料

    • 編/譯者
    • 徐瑞珠
    • 語言
    • 中文繁體
    • 裝訂
    • 紙本平裝
    • ISBN
    • 9789864766901
    • 分級
    • 普通級
    • 商品規格
    • 18開17*23cm
    • 頁數
    • 272
    • 出版地
    • 台灣
    • 適讀年齡
    • 全齡適讀
    • 注音
    • 級別

  • 商品分類:中文書電腦資訊資料庫/大數據資料處理/大數據

訂購須知

加入金石堂 LINE 官方帳號『完成綁定』,隨時掌握出貨動態:

認識 大 數據 的 第 一 本書

認識 大 數據 的 第 一 本書

商品運送說明:

  • 本公司所提供的產品配送區域範圍目前僅限台灣本島。注意!收件地址請勿為郵政信箱。
  • 商品將由廠商透過貨運或是郵局寄送。消費者訂購之商品若無法送達,經電話或 E-mail無法聯繫逾三天者,本公司將取消該筆訂單,並且全額退款。
  • 當廠商出貨後,您會收到E-mail出貨通知,您也可透過【訂單查詢】確認出貨情況。
  • 產品顏色可能會因網頁呈現與拍攝關係產生色差,圖片僅供參考,商品依實際供貨樣式為準。
  • 如果是大型商品(如:傢俱、床墊、家電、運動器材等)及需安裝商品,請依商品頁面說明為主。訂單完成收款確認後,出貨廠商將會和您聯繫確認相關配送等細節。
  • 偏遠地區、樓層費及其它加價費用,皆由廠商於約定配送時一併告知,廠商將保留出貨與否的權利。

提醒您!!
金石堂及銀行均不會請您操作ATM! 如接獲電話要求您前往ATM提款機,請不要聽從指示,以免受騙上當!

退換貨須知

**提醒您,鑑賞期不等於試用期,退回商品須為全新狀態**

  • 依據「消費者保護法」第19條及行政院消費者保護處公告之「通訊交易解除權合理例外情事適用準則」,以下商品購買後,除商品本身有瑕疵外,將不提供7天的猶豫期:
    1. 易於腐敗、保存期限較短或解約時即將逾期。(如:生鮮食品)
    2. 依消費者要求所為之客製化給付。(客製化商品)
    3. 報紙、期刊或雜誌。(含MOOK、外文雜誌)
    4. 經消費者拆封之影音商品或電腦軟體。
    5. 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,經消費者事先同意始提供。(如:電子書、電子雜誌、下載版軟體、虛擬商品…等)
    6. 已拆封之個人衛生用品。(如:內衣褲、刮鬍刀、除毛刀…等)
  • 若非上列種類商品,均享有到貨7天的猶豫期(含例假日)。
  • 辦理退換貨時,商品(組合商品恕無法接受單獨退貨)必須是您收到商品時的原始狀態(包含商品本體、配件、贈品、保證書、所有附隨資料文件及原廠內外包裝…等),請勿直接使用原廠包裝寄送,或於原廠包裝上黏貼紙張或書寫文字。
  • 退回商品若無法回復原狀,將請您負擔回復原狀所需費用,嚴重時將影響您的退貨權益。