谈下关于kaggle的反作弊规则
看了下知乎,反作弊機制無視賬號所在不同的IP
如果兩個賬號的提交文件一模一樣,并且沒有線上組隊,那么就會取消成績。多次取消成績封號處理。kaggle官方不接受申訴。
開小號組隊的話,整個隊伍同樣只有五次/天。
另外可以開小號提交不同的模型的效果。
如果多個賬號提交別人公開的kernel上面的結果會不會被查呢?應該是不會的。
刪號如果開了新號以后,你新提交的和刪號前提交的一致,就會被視為作弊,我在這里找到了一個有意思的截圖:
如果A賬號和B賬號曾經(注意是曾經)提交過相同的結果,最后結果不一致,會不會被查呢?不清楚
刪號的還有一個效果如下:
如果作弊了,刪除賬號有沒有用呢?
我之前注冊了兩個號碼,一個賬號沒包含名字想改,改不了,然后去注冊了第二個賬號,
然后第二個賬號就被封了,發郵件給kaggle要求刪除第一個才能恢復第二個。
然后就刪除了第一個。
然后第一個過幾天就徹底連discussion上面的信息都沒了。
今天刪了一次主號,然后重新注冊,沒問題,所以還有一種辦法是,你注冊一個小號,五次上限達到了以后,你可以刪除這個號然后重新建,提交新的結果,那么這樣理論上你就可以在一天內提交無數次。
但是刪號會同時刪除你之前其他比賽的所有成績
另外,kaggle的GPU只讓用30個小時,所以從媷羊毛角度,小號也是必須的。
小號還有一個作用就是別人發布了kernel 但是沒有提交成績,那么你可以用小號測試下對方的kernel的submission.csv
另外,提交次數的話是根據賬戶所在ip的時區來更新的,國內的話,是第二天八點準時更新。
有個自稱京東的哥們兒作弊直接導致成績被取消:
這個人發的notebook是:
IEEE cbt 9600 LB solution | Kaggle
一個小技巧,如果是用臨時郵箱注冊的小號,那么看過的帖子有更新,怎么知道哪些更新的評論是自己沒看過的呢?
很簡單,在之前看的時候,給評論點贊,這樣點贊過的都會有標記,過幾天再來看這個帖子,沒點贊過得就是沒看過的.
如下:
另外,反作弊系統大概運行時間為不到一天.在通過作弊系統以后,才會發放獎牌.
補充:
作弊被kaggle發現后,你的submission.csv 全部會消失。
如果是因為沒有上傳代碼文件(Two-stage 比賽)被取消成績,那么submission記錄將會保留,呈現:
上面這個是正常的。
下面的這個是作弊處理結果:
賬號正常的話應該是這樣:
也就是說,被查到作弊后,你提交的文件被kaggle吞沒作為憑據,按鈕"My Submissions消失"你再也不能參加這個比賽了。
另外,還有的人通過兩個文件各自乘以一個不同系數來防止"被kaggle認為作弊",注意這個系數不能是這種1.000001
因為小數點后面位數太多的話,兩個文件就是一樣的了,因為kaggle是計算小數點后面的4~5位,所以
如果你的位數太多,兩個文件一致,就會被認為是作弊的了。
舉個例子:
帳號a:預測文件predict1.csv=原始文件*1.00001
帳號b:預測文件predict2.csv=原始文件*1.00002
兩個帳號分別提交上述結果到同一場比賽,
屬于結果一致,會在比賽結束后,兩個帳號都會被視為作弊,因為反作弊系統只看前面幾位小數.
kaggle具體檢測前幾位小數?每場比賽檢測的小數位數長度各不相同。
一定要記住,如果你開了小號,或者小號借給別人用了,任意兩個賬號之間的某次提交都不能是同一個文件,如果你乘了一個系數1.000001生成一個文件,kaggle會認為生成后的文件與生成前的一致,視為作弊,兩個賬號都會有作弊記錄,作弊的效果上面的截圖中有.被視為作弊后,kaggle禁止申訴,一定要小心,最好是每次提交的時候,都做個記錄,嚴格檢查與上次提交的結果不一致。個人比較推薦的習慣就是,每個csv文件只要你修改過,就重命名,并且每次提交文件到kaggle之前,都確定自己提交的是個新名字的文件。
同一個IP登陸多個不同的kaggle賬號會不會被判定為作弊呢?
理論上來講,不會。
①因為一個IP,室內可以團隊的各個成員獨立參加,他們在百度上的IP都是路由器IP
②IP是動態的,DHCP決定的,也就是每次你啟動電腦、打開百度的IP都可以與上一次不一樣。所以換位思考,kaggle官方不可能通過綁定"IP和賬號"的方式,來判定同一個IP登陸的都是作弊成員。
同一臺電腦多個賬號提交不同的csv會不會被判定為作弊呢?
理論上來講,不會。
因為Kaggle沒有PC客戶端軟件,都是網頁登陸,理論上來講,瀏覽器不會提供你網卡的物理地址給kaggle。不像QQ這種客戶端把個人電腦信息掃描個遍。
為什么兩個文件里面的數值很接近不會被判定為作弊呢?
因為kaggle的排行榜基本都是在拼小數點后面幾位,前幾百名成績都差不多,所以kaggle沒法監測這種情況,如果kaggle想要監測,那么kaggle就必須冤枉和錯殺排行榜前面做的特別好的一些參賽選手。
注意Two-Stage比賽會同時查stage1和stage2的作弊情況。
總結
以上是生活随笔為你收集整理的谈下关于kaggle的反作弊规则的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: kaggle上面的score以及ROC_
- 下一篇: kaggle中的分类比赛为什么可以提交浮