《深入浅出数据分析》读书笔记
一切模型都是錯(cuò)誤的,但其中一些是有用的。
數(shù)據(jù)分析的根本在于妥善分解問(wèn)題、為數(shù)據(jù)套上適當(dāng)?shù)男闹悄P秃徒y(tǒng)計(jì)模型、做出正確的判斷,但并不保證次次得到正確答案。
1. 數(shù)據(jù)分析的模式:確認(rèn)問(wèn)題--》分解數(shù)據(jù)--》評(píng)估數(shù)據(jù)--》決策;如何提問(wèn)獲取需要的信息來(lái)確認(rèn)問(wèn)題非常關(guān)鍵
2. 檢驗(yàn)?zāi)愕睦碚摚汉玫腁B測(cè)試;沒(méi)有任何統(tǒng)計(jì)數(shù)據(jù)是絕對(duì)準(zhǔn)確的,比較是破解觀察數(shù)據(jù)不準(zhǔn)備的法寶,數(shù)據(jù)只有對(duì)比才有意義;
3. 尋找最大值:利用規(guī)劃求解;設(shè)定公式及所有約束條件,求可行區(qū)域內(nèi)的最大解
4. 數(shù)據(jù)圖形化:數(shù)據(jù)圖形化的根本在于正確比較
5. 假設(shè)檢驗(yàn):證偽法:通過(guò)每一條信息剔除基本不可能的假設(shè);之后將各種因素之間建立正負(fù)相關(guān)性關(guān)聯(lián);每一條信息分別給各個(gè)假設(shè)賦正負(fù)值,擁有最大值的假設(shè)是最可能發(fā)生的;
6.貝葉斯統(tǒng)計(jì):貝葉斯很神奇:若默認(rèn)患感冒,檢驗(yàn)結(jié)果為陽(yáng)性的概率為90%,或未患感冒,檢驗(yàn)結(jié)果為陽(yáng)性的概率為9%;如果你檢驗(yàn)結(jié)果為陽(yáng)性,感冒的概率為多少(1%的人患了感冒)。比如大家都認(rèn)為A非??赡馨l(fā)生,突然收到消息說(shuō)A很可能不發(fā)生;這是的做法不是讓所有人重新評(píng)估A發(fā)生的概率,而是評(píng)估A如果發(fā)生收到這條消息的概率和A不發(fā)生收到這條消息的概率,之后利用貝葉斯進(jìn)行計(jì)算。
7.主觀概率:將直覺(jué)固化為主觀概率數(shù)據(jù);用標(biāo)準(zhǔn)偏差確定分歧大小;
8. 啟發(fā)法:你是憑沖動(dòng)做決定,還是憑幾個(gè)精心選取的關(guān)鍵數(shù)據(jù)做決定?或是構(gòu)建一個(gè)包含所有變量的模型,然后得出最佳答案?
總結(jié)
以上是生活随笔為你收集整理的《深入浅出数据分析》读书笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: louvain算法_单细胞聚类(四)图解
- 下一篇: WINHTTP的API接口说明