python缺失值类型与分析_3.1.1 缺失值分析
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                python缺失值类型与分析_3.1.1 缺失值分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                數據的缺失主要包括記錄的缺失和記錄中某個字段信息的缺失,兩者都會造成分析結果的不準確,以下從缺失值產生的原因及影響等方面展開分析。
(1)缺失值產生的原因
1)有些信息暫時無法獲取,或者獲取信息的代價太大。
2)有些信息是被遺漏的。可能是因為輸入時認為不重要、忘記填寫或對數據理解錯誤等一些人為因素而遺漏,也可能是由于數據采集設備的故障、存儲介質的故障、傳輸媒體的故障等非人為原因而丟失。
3)屬性值不存在。在某些情況下,缺失值并不意味著數據有錯誤。對一些對象來說某些屬性值是不存在的,如一個未婚者的配偶姓名、一個兒童的固定收入等。
(2)缺失值的影響
1)數據挖掘建模將丟失大量的有用信息。
2)數據挖掘模型所表現出的不確定性更加顯著,模型中蘊涵的規律更難把握。
3)包含空值的數據會使建模過程陷入混亂,導致不可靠的輸出。
(3)缺失值的分析
使用簡單的統計分析,可以得到含有缺失值的屬性的個數,以及每個屬性的未缺失數、缺失數與缺失率等。
從總體上來說,缺失值的處理分為刪除存在缺失值的記錄、對可能值進行插補和不處理3種情況,將在4.1.1節詳細介紹。
總結
以上是生活随笔為你收集整理的python缺失值类型与分析_3.1.1 缺失值分析的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: python 构造函数继承_Python
- 下一篇: pbs 写matlab作业,pbs提交作
