2021年大数据基础(一):大数据概念
2021大數據領域優質創作博客,帶你從入門到精通,該博客每天更新,逐漸完善大數據各個知識體系的文章,幫助大家更高效學習。
有對大數據感興趣的可以關注微信公眾號:三幫大數據
目錄
大數據概念
數據
常見數據存儲單位
大數據
大數據概念
最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,大數據是當前很熱的一個詞。這幾年來,云計算、繼而大數據,成了整個社會的熱點,大數據究竟是什么東西?有哪些相關技術?對普通人的生活會有怎樣的影響?我們來一步步弄清這些問題。
在講什么是大數據之前,我們首先需要厘清數據的基本概念。
數據
數據是可以獲取和存儲的信息,直觀而言,表達某種客觀事實的數值是最容易被人們識別的數據(因為那是“數”)。但實際上,人類的一切語言文字、圖形圖畫、音像記錄,所有感官可以察覺的事物,只要能被記下來,能夠查詢到,就都是數據(data)。
隨著互聯網快速發展、智能手機以及“可佩帶”計算設備的出現,我們的行為、位置,甚至身體生理數據等每一點變化都成為了可被記錄和分析的數據。這些新技術推動著大數據時代的來臨,各行各業每天都在產生數量巨大的數據碎片,數據計量單位已從Byte、KB、MB、GB、TB發展到PB、EB、ZB、YB甚至BB來衡量。
常見數據存儲單位
1Byte = 8bit ???1K(千)= 1024Byte ?1MB(兆)=1024K ?1G(吉) = 1024M
1T(太)=1024G ??1P(拍)=1024T ????1E(艾)=1024P ????1Z(澤)=1024E
1Y (堯)=1024Z ??1B(布)=1024Y ????1N(諾)=1024B ???1D(刀)=1024N
大數據
大數據(big data),是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
數據分析的前提是有數據,數據存儲的目的是支撐數據分析。究竟怎么去存儲龐大的數據量,是開展數據分析的企業在當下面臨的一個問題。傳統的數據存儲模式存儲容量是有大小限制或者空間局限限制的,怎么去設計出一個可以支撐大量數據的存儲方案是開展數據分析的首要前提。
當解決了海量數據的存儲問題,接下來面臨的海量數據的計算問題也是比較讓人頭疼,因為企業不僅追求可以計算,還會追求計算的速度、效率。
以目前互聯網行業產生的數據量級別,要處理這些數據,就需要一個更好、更便捷的分析計算方式了。傳統的顯然力不從心了,而且效率也會非常低下。這正是傳統數據分析領域面臨的另一個挑戰,如何讓去分析、計算。這個時候就需要有新的技術去解決這些問題,這個技術就是大數據。
大數據主要解決的問題: 海量數據的存儲和海量數據的計算問題
總結
以上是生活随笔為你收集整理的2021年大数据基础(一):大数据概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年大数据ZooKeeper(六)
- 下一篇: 2021年大数据基础(三):