psql where里有自定义函数慢_使用gplearn自定义特征自动生成模块
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                psql where里有自定义函数慢_使用gplearn自定义特征自动生成模块
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                背景:數據科學領域中,數據一直都是主要驅動力,特征工程作為其中重要一環,成為無論是kaggle類的數據競賽,還是工業界應用中關注的重點。特征工程中有重要的一個環節叫做特征融合,好的特征融合能幫助構造當前模型不能學習到的知識,通常產生新的特征會很依賴于專家知識,當在缺乏專家知識的情況下,我們就需要一款工具幫我們自動生成特征。因此gplearn就主要產生了。
簡介:待補充
gplearn特征生成使用案例:以官方給出的boston房屋數據為例
- 安裝
 
- 引入庫
 
- 數據導入
 
- 自定義可計算的算子:logical算子使用官方給定案例,自定義算子通過make_function()實現,這里我自定義一個box-cox算子(lamda = 2),注意一定要有報錯機制,比如np.errstate,不然不會通過。官方自定義的‘add’等算子可以直接使用
 
- 初始化
 
- 生成新特征
 
- 查看新生成的特征
 
gplearn參數的介紹
- unction_set。用于構成程式的函數(算子)集合
 - tournament_size。參與遺傳算法計算下一代特征的特征數量(控制特征之間的相關性)
 - stopping_criteria。遺傳算法停止條件
 - init_depth。初始化的樹深度
 - parsimony coefficient。簡化系數
 - p_hoist_mutation。提升變異系數
 - max_samples。最大采樣比例
 - hall_of_fame。備選數量
 - const_range。混入程式的常數范圍
 - init_method。初始化方法
 - metric。適應度標準
 - p_crossover。交叉變異系數
 - warm_start。熱啟動
 - n_jobs。并行計算使用的核心數量
 - verbose。顯示信息控制
 - random_state。隨機種子
 - p_subtree_mutation。子樹變異系數
 - p_point_mutation。點變異系數
 
參考:
gplearn官網
一個github代碼例子
總結
以上是生活随笔為你收集整理的psql where里有自定义函数慢_使用gplearn自定义特征自动生成模块的全部內容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 计算器rad和deg是什么意思
 - 下一篇: 繁体字转换用什么软件好