前出塞数据挖掘的一些必须了解的概念
生活随笔
收集整理的這篇文章主要介紹了
前出塞数据挖掘的一些必须了解的概念
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前出塞現在使用了數據挖掘,下面跟大家一起討論下數據挖掘的概念。從龐雜的數據背后挖掘、分析用戶的行為習慣和喜好,找出更符合用戶「口味」的產品和服務,并結合用戶需求有針對性地調整和優化自身,就是大數據的價值。?
對于大數據在商業上的用途,這句話說得很清楚。前半句是重點,了解用戶的行為習慣和愛好,這就是大數據的核心價值。
1. 元數據(Metadata)的概念
簡單說,元數據是對數據本身進行描述的數據,或者說,它不是對象本身,它只描述對象的屬性。
比如,一幅畫本身,是數據。而這幅畫的作者、完成時間、尺寸、價格、類型等等,就是它的元數據。
再比如,你媽逼你結婚,找了個男的讓你相親。你并不認識他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛好特長,你心里也就對他有了印象。即便你還不認識他。
元數據的價值,第一是能夠從側面描述對象,第二點就是可以結構化、信息化。
什么意思呢?
比如,我們要判斷一幅畫的價值,除了專家直接通過畫的藝術性來評價,還可以通過元數據來判斷。
這幅畫是名家的還是二流畫家的?這幅畫是作者在他創作鼎盛時期的作品,還是在年輕時的作品?這幅畫是作者擅長的類型還是他不熟悉的?
用這些描述的信息,我們居然就能把這幅畫的價值算得八九不離十。雖然肯定會存在誤差,但同樣是科學合理的方法。
那用元數據而非數據本身描述對象的意義何在?
這就是在大數據上產生的價值了:對于非結構化的、非量化的對象本身,結構化的元數據可以用以快速計算和判斷。
比如,你媽拿了 100 個單身男的資料,你要是一個一個去仔細翻閱,那幾天都翻不完。但你告訴你媽,高學歷的可能意味著素質很高,高收入的可能意味著能力很強,所以先把低學歷低收入的篩掉,剩下的再依據身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會有失誤的,說不定真愛就在被篩掉的人里。但這樣的概率微乎其微。
相親里似乎還不太明顯,但大數據在真正產品應用中,產生的效果就天翻地覆了。(待續。。。)
對于大數據在商業上的用途,這句話說得很清楚。前半句是重點,了解用戶的行為習慣和愛好,這就是大數據的核心價值。
1. 元數據(Metadata)的概念
簡單說,元數據是對數據本身進行描述的數據,或者說,它不是對象本身,它只描述對象的屬性。
比如,一幅畫本身,是數據。而這幅畫的作者、完成時間、尺寸、價格、類型等等,就是它的元數據。
再比如,你媽逼你結婚,找了個男的讓你相親。你并不認識他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛好特長,你心里也就對他有了印象。即便你還不認識他。
元數據的價值,第一是能夠從側面描述對象,第二點就是可以結構化、信息化。
什么意思呢?
比如,我們要判斷一幅畫的價值,除了專家直接通過畫的藝術性來評價,還可以通過元數據來判斷。
這幅畫是名家的還是二流畫家的?這幅畫是作者在他創作鼎盛時期的作品,還是在年輕時的作品?這幅畫是作者擅長的類型還是他不熟悉的?
用這些描述的信息,我們居然就能把這幅畫的價值算得八九不離十。雖然肯定會存在誤差,但同樣是科學合理的方法。
那用元數據而非數據本身描述對象的意義何在?
這就是在大數據上產生的價值了:對于非結構化的、非量化的對象本身,結構化的元數據可以用以快速計算和判斷。
比如,你媽拿了 100 個單身男的資料,你要是一個一個去仔細翻閱,那幾天都翻不完。但你告訴你媽,高學歷的可能意味著素質很高,高收入的可能意味著能力很強,所以先把低學歷低收入的篩掉,剩下的再依據身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會有失誤的,說不定真愛就在被篩掉的人里。但這樣的概率微乎其微。
相親里似乎還不太明顯,但大數據在真正產品應用中,產生的效果就天翻地覆了。(待續。。。)
總結
以上是生活随笔為你收集整理的前出塞数据挖掘的一些必须了解的概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jquery validate 中文教程
- 下一篇: 大数据?人工智能?揭秘银行数据仓库发展趋