二十七、综合案例数据预处理
生活随笔
收集整理的這篇文章主要介紹了
二十七、综合案例数据预处理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 綜合案例數據預處理
1.1 電力竊漏電綜合案例
- 數據清洗:去掉冗余數據
- 缺失值處理:填充缺失值
- 數據變換:竊漏電評價指標體系
- 構建專家樣本:構建專家樣本
2. 數據清洗
2.1 竊漏電數據預處理
- 原始數據中并不是所有的數據都需要進行分析,因此在數據處理時,需要將冗余的數據進行過濾。
- 非居民用電類別不可能存在竊漏電現象,需要將非居民用電類別數據過濾掉;
- 結合本業務的實例,節假日用電了與工作日項目,會明顯降低,可以過濾節假日的用電數據。
竊漏電案例數據集詳細信息
- 在原始計量數據,特別是用戶電量抽取過程中,發現存在缺失的現象。若將這些數據拋棄掉,會嚴重影響供出電量的計算結果。
3. 缺失值處理
- 首先從原始數據集中確定因變量和自變量,取出缺失值錢后5個數據,根據取出來的10個數據組成一組,然后采用拉格朗日多項式插值公示:
3.3 資源
資源庫
pandas==0.24.2 scipy==1.1.0數據集
missing_data.xls3.3 數據補全代碼
補全后的數據
4 數據變換
4.1 竊漏電評價指標體系的內容
-
通過電力計量系統采集的電量、負荷、雖然在一定程度上能反映用戶竊漏電行為的某些規律,但要作為構建模型的專家樣本,特征不明顯,需要重新構造。
電量趨勢下降指標 - 竊漏電用戶的用電量呈現下降的趨勢
- 考慮前后幾天作為統計窗口
- 利用電量做直線擬合得到斜率作為衡量
告警類指標
1. 與竊漏電相關終端報警主要有電壓缺相、電壓斷相、電流反極性等告警線損指標
1. 線損率是用于衡量供電線路的損失比例,同時可結合線戶拓撲關系計算出用戶所屬線路在當體的線損率。
5 構建專家樣本
專家樣本數據
- 對2009年1月1日至2014年12月31日所有竊漏電用戶及正常用戶的電量、告警及線損數據和該用戶在當天是否竊漏電的標識,按竊漏電評價指標進行處理并選取其中291個樣本數據,得到專家樣,下圖是樣本數據。
1日所有竊漏電用戶及正常用戶的電量、告警及線損數據和該用戶在當天是否竊漏電的標識,按竊漏電評價指標進行處理并選取其中291個樣本數據,得到專家樣,下圖是樣本數據。
總結
以上是生活随笔為你收集整理的二十七、综合案例数据预处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 二十六、数据挖掘电力窃漏电用户自动识别
- 下一篇: 二十八、电力窃漏电案例模型构建