海量資料
解碼大數據 不可不知科技最新浪潮
2013年6月14日 星期五
開放原始碼的雲端運算平台技術-初探Hadoop開放原始碼平台環境
文/圖 沈炳宏.責任編輯/洪羿漣
大量資料的處理一直是電腦科學與實務應用中非常重要的課題,雲端運算的風起雲湧也使得分散式運算這項技術成了新顯學,整合MapReduce演算法並已被各大企業所廣泛採用的Hadoop套件,更是開發雲端運算技術的佼佼者,本系列文章將會帶領讀者一步步瞭解並活用該技術。
近年來最熱門的雲端運算(Cloud Computing),其概念結合了IaaS、PaaS、SaaS、Web 2.0和其它相關技術(如MapReduce、Ajax、虛擬化),共同在網際網路架構上,來滿足使用者在運算資源的高度需求。目前雲端運算有各家專業研究機構分別提出了不同的定義,如表1所示。
大量資料的處理一直是電腦科學與實務應用中非常重要的課題,雲端運算的風起雲湧也使得分散式運算這項技術成了新顯學,整合MapReduce演算法並已被各大企業所廣泛採用的Hadoop套件,更是開發雲端運算技術的佼佼者,本系列文章將會帶領讀者一步步瞭解並活用該技術。
近年來最熱門的雲端運算(Cloud Computing),其概念結合了IaaS、PaaS、SaaS、Web 2.0和其它相關技術(如MapReduce、Ajax、虛擬化),共同在網際網路架構上,來滿足使用者在運算資源的高度需求。目前雲端運算有各家專業研究機構分別提出了不同的定義,如表1所示。
善用Hadoop 孕育多樣化產業應用
2012/07/30-闞大成
如果已對Hadoop、MapReduce、HDFS、HBase、Hive…等一干關於巨量資料分散式處理的技術知之甚詳,而且也有實作經驗、並非僅能紙上談兵,那麼如果僅能將此技能發揮在IT底層庶務,未免太過可惜,理應以此根基,好好地做出幾套足以提振企業營運績效的應用,那才可謂物超所值。
說真的,任何企業的執行長或財務長,即使對於公司建立巨量資料分析環境,抱持樂觀其成態度,甚至不吝於核准放行一些IT投資案,主要目的絕不是為了讓IT部門養出一堆Hadoop高手,更不是為了看到程式開發人員談論MapReduce時的神采飛揚,終極目標是在於創新、在於應用,從而帶出成本撙節、生產力提升、新品研發速度加快、業績上揚、客戶基礎變大…等各類型正面效應。
Hadoop與MapReduce 開發巨量資料應用
2012/07/30-闞大成
工欲善其事,必先利其器,縱使巨量資料寶庫蘊藏豐沛的珍寶,然而意欲挖掘出這些寶寶,企業所需準備的工具,仍是以往慣常採用的關聯式資料庫、SQL語法、ETL(Extract、Transform、Load)嗎?當然不是!除了幾乎成為巨量資料代名詞的Hadoop外,以及相同框架裡頭的MapReduce、HDFS等技術,企業皆需勤加研習。
當巨量資料鋪天蓋地攻佔IT專業媒體重要版面,許多過去仍對此一知半解的企業,也不得不修正隔岸觀火的心態,開始花時間加以研究,結果發現,世界上很多赫赫有名的企業,都早已熱情簇擁巨量資料,並獲得豐碩的應用成果,那麼事不宜遲,得緊搭上這個熱潮才是。
|
主因在於,意欲開啟巨量資料希望之門,幾乎可以肯定,絕對少不掉Hadoop這把鑰匙!
2013年6月13日 星期四
訂閱:
意見 (Atom)


