去年,我參加了GigaOm的Structure Data會(huì )議,這次會(huì )議的主題是關(guān)于Hadoop,大數據和非結構化數據的承諾,這對于標題為“ structure”的事件而言具有諷刺意味。今年的活動(dòng)(3月19日至20日)更多地涉及可交付成果,包括案例研究,用戶(hù)體驗以及對大數據大計劃的實(shí)際期望范圍。從承諾到現實(shí)的轉變值得歡迎。這是活動(dòng)第一天以來(lái)我的五個(gè)最佳收獲。

1.大數據和Hadoop類(lèi)型的基礎架構的部署既涉及技術(shù),也涉及流程。關(guān)于客戶(hù)的大數據湖填充大量數據,然后試圖弄清楚該如何處理,“ H腳”只是one語(yǔ)。這個(gè)詞來(lái)自前火箭科學(xué)家,現在是特納廣播公司分析師高管科林·科爾曼。
他指的是建立基于Hadoop的數據基礎結構然后將所有形式的數據轉儲到系統中的誘惑,而沒(méi)有大量計劃是否需要數據,如何提取需要的內容以及提取數據后如何分析數據。
過(guò)去的商業(yè)智能技術(shù)專(zhuān)家應注意:急需人才,而不僅僅是在您學(xué)習交易的平臺上。更好的案例研究是圍繞開(kāi)發(fā)人員獲得自上而下的批準來(lái)重新考慮其公司如何使用數據和數據的方法,其中包括來(lái)自MetLife的一項引人注目的隱私保護計劃,以及福特計劃使用開(kāi)源使開(kāi)發(fā)人員根據大量汽車(chē)數據創(chuàng )建新應用程序。然后獲得在通常的新產(chǎn)品規限之外進(jìn)行操作的自由。
2. Hadoop仍然不是那么容易實(shí)現。在與MetaScale的討論中以及在A(yíng)lpine Data Labs的演示中,重點(diǎn)是采取(或至少掩蓋了復雜性)并使非結構化數據更容易由需要答案的業(yè)務(wù)主管來(lái)積累,集成和查詢(xún)。
不幸的是,Hadoop獲得了可以滿(mǎn)足您所有數據需求的神奇術(shù)語(yǔ)的光環(huán)。今年很明顯,Hadoop及其相關(guān)模塊正在迅速發(fā)展成為一個(gè)平臺,該平臺對客戶(hù)具有很大的吸引力,但仍然需要平臺在企業(yè)中成功運行所需的屬性。
安全性,易于學(xué)習的工具以及與現有公司系統的掛鉤都在不斷發(fā)展,但目前還沒(méi)有完全成熟。Alpine Data Labs產(chǎn)品副總裁Steve Hillion表示:“ [Hadoop]將脫離科學(xué)項目領(lǐng)域,并開(kāi)始產(chǎn)生切實(shí)可行的有價(jià)值的見(jiàn)解和分析。
