大數據是什么意思

2021-02-13 16:35:33    來(lái)源:新經(jīng)網(wǎng)    作者:艾靜

大數據是指不能在一定時(shí)間范圍內使用常規軟件工具捕捉、管理和處理的數據集合,它是大量、高增長(cháng)率和多樣化的信息資產(chǎn),需要新的處理模式來(lái)增強決策力、洞察力和流程優(yōu)化能力。

大數據是什么意思

大數據”這個(gè)詞現在出現得很頻繁,每個(gè)人都說(shuō)現在是大數據時(shí)代,那么你知道大數據到底是什么意思嗎?以下小編就來(lái)給大家講講。

詳細內容

01

IT行業(yè)術(shù)語(yǔ),指的是一組數據,這些數據不能用常規的軟件工具在一定時(shí)間范圍內捕獲、管理和處理,它們都是大量、高增長(cháng)率和多樣化的信息資產(chǎn),需要新的處理模式,以獲得更強的決策力、洞察力和流程優(yōu)化能力?!洞髷祿r(shí)代》是由維克多·邁爾-舍恩伯格和肯尼斯·庫克耶編寫(xiě),使用了所有數據進(jìn)行分析處理,但使用的是不用隨機分析方法(抽樣)。5個(gè)大數據特征(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣化)、Value(低價(jià)值密度)、Veracity(真實(shí))。

02

McKinseyGlobalInstitute給出了這樣一個(gè)定義:一個(gè)數據集,其規模之大,在獲取、存儲、管理和分析方面遠遠超過(guò)了傳統數據庫軟件工具的能力,它有四個(gè)特點(diǎn):海量數據規模,快速的數據流動(dòng),多樣化的數據類(lèi)型,低價(jià)值密度。

03

大數據的戰略意義并不在于獲取大量的數據信息,而是要對這些有意義的數據進(jìn)行專(zhuān)門(mén)的處理。換句話(huà)說(shuō),如果把大數據比作一個(gè)行業(yè),那么這個(gè)行業(yè)贏(yíng)利的關(guān)鍵,就在于提高它對數據的“處理能力”,通過(guò)“處理”來(lái)實(shí)現數據的“增值”。從技術(shù)上看,大數據與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。海量數據不可能在單一的計算機上處理,因此必須采用分布式架構。它的特色在于對海量數據進(jìn)行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術(shù)。

04

伴隨著(zhù)云計算時(shí)代的到來(lái),大數據(Bigdata)也越來(lái)越受到人們的關(guān)注。分析小組認為,大數據(Bigdata)通常被用來(lái)描述一家公司生成的大量非結構化和半結構化數據,這些數據在下載到關(guān)系數據庫進(jìn)行分析時(shí)會(huì )花費大量的時(shí)間和金錢(qián)。大數據分析通常與云計算相關(guān)聯(lián),因為實(shí)時(shí)的大數據集分析需要類(lèi)似于MapReduce的框架來(lái)將工作分配給幾十、幾百甚至幾千臺計算機。大數據需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過(guò)時(shí)間內的數據。適合大數據的技術(shù),包括大規模并行處理數據庫,數據挖掘,分布式文件系統,分布式數據庫,云計算平臺,因特網(wǎng)和可擴展存儲系統等。最低的基本單位是bit,并按順序列出:bit,Byte,KB,MB,GB,TB,PB,EB,ZB,YB,BB,NB,DB。

05

大數據包括結構性、半結構性和非結構性數據,非結構性數據日益成為數據的重要組成部分。據IDC的調查報告顯示:企業(yè)中80%的數據都是非結構化數據,這些數據每年都按指數增長(cháng)60%。大數據只是因特網(wǎng)發(fā)展到今天這個(gè)階段的一個(gè)表現和特點(diǎn),沒(méi)有必要對它進(jìn)行神話(huà),也沒(méi)有必要對它保持敬畏,在以云計算為代表的技術(shù)創(chuàng )新的大幕的映襯下,這些原本看起來(lái)難以收集和使用的數據開(kāi)始被輕易地使用,并且,通過(guò)各行各業(yè)的不斷創(chuàng )新,大數據將逐漸為人類(lèi)創(chuàng )造更多的價(jià)值。

06

當今社會(huì )是一個(gè)高速發(fā)展的社會(huì ),科技發(fā)達,信息流通,人與人之間的交流更加緊密,生活更加便利,大數據是這個(gè)高科技時(shí)代的產(chǎn)物。阿里巴巴創(chuàng )辦人馬云來(lái)臺演講中就提到,未來(lái)的時(shí)代將不是IT時(shí)代,而是DT的時(shí)代,DT就是DataTechnology數據科技,顯示大數據對于阿里巴巴集團來(lái)說(shuō)舉足輕重。有些人將數據比作蘊藏著(zhù)能量的煤礦。煤炭按照性質(zhì)有焦煤、無(wú)煙煤、肥煤、貧煤等分類(lèi),而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類(lèi)似,大數據并不在“大”,而在于“有用”。價(jià)值含量、挖掘成本比數量更為重要。對許多行業(yè)來(lái)說(shuō),如何使用這些海量數據是企業(yè)贏(yíng)得競爭的關(guān)鍵。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。