快速筛选数据集中某列特征符合某种规律的所有数据集
生活随笔
收集整理的這篇文章主要介紹了
快速筛选数据集中某列特征符合某种规律的所有数据集
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
我們常常有這樣的需要:
如果某條數據的特征card1的取值在某個列表里面,就提取出來.
所有上述數據輸出得到新的數據集.
?
那么sql怎么操作呢?
1.統計犯罪信用卡設計的卡號card1有哪些取值.
select distinct card1 from merge.train where isFraud=12.把上述結果導入數據庫,表名為fraud_card1,然后做查詢操作如下:
select * from merge.train,merge.fraud_card1 where merge.train.card1=merge.fraud_card1.card1這個時候就能得到初始訓練集中,所有和犯罪卡號相關的數據集用來訓練了.
?
上方的merge是schema名(可以理解為子數據庫)
總結
以上是生活随笔為你收集整理的快速筛选数据集中某列特征符合某种规律的所有数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pandas的dataframe节省内存
- 下一篇: Unknown column 'XXX'