最新Hadoop Yarn的精華:MapReduce機制

0 / 0
  • 語言:繁體中文
  • ISBN:9789863790662
  • 出版日期:2014/12/26
Hadoop是一種分散式資料和計算的框架,在巨量資料處理中應用非常 廣泛。MapReduce是一種程式設計模型,Hadoop正是以MapReduce 作為核心程式設計模型的。 本書深入淺出、有系統地透過非技術性的表達方式和詳細的原始程式分 析,介紹MapReduce 2.0的理論系統、架構和程式設計方法。幫助讀者掌握MapReduce 2.0基礎和特性的基礎上,培養實際程式設計和解決巨量資料處理問題的能力。 強調理論聯繫實際,注重MapReduce程式設計解決現實問題的應用,提供大量程式設計實戰例題供讀者參考。 適用:學習MapReduce 2.0的原始程式、MapReduce 2.0程式設計、資料採擷、機器學習等相關內容的程式設計人員,或大專院校相關系作為參考教材。 ★內文試閱: ‧前言 我們處於一個資料爆炸的時代。每時每刻、各行各業都在產生和累積巨量的資料內容。這些資料中蘊含著生產業務活動、取得商業資訊、做出管理決策的重要資訊。如何處理這些資料並取得有價值的資訊,是許多組織和單位面臨的共同問題。而這個問題的解決又依賴兩項技術,一是能夠對產生的業務資料進行統一管理和綜合,並且能夠無限擴充儲存空間;二是能夠有效處理獲得的巨量資料,在限定時間內獲得處理結果的處理常式。 因此,尋求一個合理可靠的巨量資料處理解決方案是目前資料處理的重點。很多企業領導者把對巨量資料的處理看成網際網路之後,又一個能夠獲得競爭優勢的關鍵性因素,把巨量資料處理能力作為其核心商業競爭力加以發展。這更突顯了巨量資料的戰略意義。 寫作目的 Hadoop 作為應用範圍最為廣泛的巨量資料處理開放原始碼框架,自然引起廣泛的關注,吸引了大量程式設計和開發人員進行相關內容的開發與學習。掌握Hadoop 程式設計基本技能的程式設計人員,成為目前各組織和單位最迫切需要的熱門人才。他們的主要工作就是利用儲存和管理產生的巨量資料撰寫對應的MapReduce 程式對巨量資料進行處理,分析巨量資料中包含的潛在資訊,進行資料資源的管理和對其價值進行進一步開發,為商業機會的取得、管理模式的創新、決策的制定提供對應的支援。隨著越來越多的組織、單位和企業對巨量資料採擷的重視,高層次的程式設計人才必將成為就業市場上搶手的人才。 本書是為MapReduce 程式設計和開發人員,學習最新MapReduce2.0 程式碼而出版的。對MapReduce 2.0 的組成結構與核心部分程式,循序漸進的介紹與說明,以MapReduce 2.0 來源程式為主,從最底層開始介紹新一代的MapReduce 2.0 程式設計模式,多角度、多方面地對MapReduce 2.0 原始程式和功能實現提供翔實的分析,並結合實際案例撰寫大量的應用程式設計,使讀者能夠在開發者的層面掌握MapReduce 2.0 程式的設計方法和技巧,為開發出更強大的MapReduce 2.0 應用打下紮實的基礎。 本書優勢 本書並非單純理論的說明,深入淺出地介紹了MapReduce 2.0 理論系統的全部基礎知識,並在程式撰寫時使用官方推薦的最新MapReduce 2.0 的新型API 進行程式設計,摒棄了已經被明確放棄使用的MapReduce 1.0 程式設計方法,這也是Hadoop 程式設計的大勢所趨。 本書透過深入分析MapReduce 2.0 原始程式,從來源介紹MapReduce 2.0程式設計的優雅,在此基礎上進行對應程式的開發,更進一步地幫助讀者了解和掌握MapReduce 2.0 程式設計的精妙之處。 作者認為,巨量資料處理和分析人才應在掌握基礎

    還沒有人寫書評喔,快來寫第一篇書評吧!

會員中心