【数据竞赛】2020 Kaggle 10大竞赛方案汇总
作者: 塵沙黑夜
2020 Kaggle 10大競賽方案匯總
1??2020kaggle精選10大賽事匯總
1.1??2019 Data Science Bowl(3493只隊(duì)伍)
1.2??TensorFlow 2.0 Question Answering(1233只隊(duì)伍)
1.3??Santa's Workshop Tour 2019(1620只隊(duì)伍)
1.4??Google QUEST Q&A Labeling(1571只隊(duì)伍)
1.5??OpenVaccine: COVID-19 mRNA Vaccine Degradation Prediction(1636只隊(duì)伍)
1.6??RSNA STR Pulmonary Embolism Detection(784只隊(duì)伍)
1.7??Google Landmark Recognition 2020(736只隊(duì)伍)
1.8??OSIC Pulmonary Fibrosis Progression(2097只隊(duì)伍)
1.9??Mechanisms of Action (MoA) Prediction
1.10??Google Research Football with Manchester City F.C.(1138只隊(duì)伍)
2019 Data Science Bowl
1. 賽題背景:
啟發(fā)學(xué)習(xí)。點(diǎn)燃可能性。
揭示幼兒教育的新見解以及媒體如何支持學(xué)習(xí)成果。參加我們的第五屆年度數(shù)據(jù)科學(xué)碗,由博斯艾倫漢密爾頓和卡格爾。
而PBS的宗旨是讓孩子們在幼年時(shí)代學(xué)習(xí)到一個(gè)值得信賴的技能,讓孩子們在幼年時(shí)代獲得成功。在本次挑戰(zhàn)中,您將使用來自PBS KIDS Measure Up的匿名游戲數(shù)據(jù),包括觀看視頻和玩游戲的知識(shí)!app,一種基于游戲的學(xué)習(xí)工具,是由美國教育部資助的CPB-PBS準(zhǔn)備學(xué)習(xí)計(jì)劃的一部分。參賽者將被要求預(yù)測游戲內(nèi)評估的分?jǐn)?shù),并創(chuàng)建一種算法,從而設(shè)計(jì)出更好的游戲,提高學(xué)習(xí)效果。您的解決方案將有助于發(fā)現(xiàn)參與高質(zhì)量教育媒體和學(xué)習(xí)過程之間的重要關(guān)系。
“數(shù)據(jù)科學(xué)碗”是全球最大的以社會(huì)公益為重點(diǎn)的數(shù)據(jù)科學(xué)競賽。每年,這項(xiàng)比賽都會(huì)給卡格爾斯一個(gè)機(jī)會(huì),讓他們用自己的熱情去改變世界。在過去的四年里,超過5萬名kaggler提交了超過11.4萬份報(bào)告,以改善從肺癌和心臟病檢測到海洋健康的所有方面。有關(guān)數(shù)據(jù)科學(xué)碗的更多信息,請?jiān)L問DataScienceBowl.com網(wǎng)站
比賽的數(shù)據(jù)來自哪里?
在這個(gè)比賽中使用的數(shù)據(jù)是匿名的,與PBS兒童測量互動(dòng)的表格數(shù)據(jù)!應(yīng)用程序。選擇數(shù)據(jù),如用戶的應(yīng)用程序內(nèi)評估分?jǐn)?shù)或他們通過游戲的路徑,是由PBS兒童測量收集!應(yīng)用程序,一個(gè)基于游戲的學(xué)習(xí)工具。
PBS兒童致力于為所有年齡段的家庭成員創(chuàng)造一個(gè)安全可靠的環(huán)境。PBS的孩子們都很好!應(yīng)用程序不收集任何個(gè)人身份信息,如姓名或位置。比賽中使用的所有數(shù)據(jù)都是匿名的。要查看完整的PBS兒童隱私政策,
任何人都無法下載整個(gè)數(shù)據(jù)集,參與者也無法訪問有關(guān)個(gè)人用戶的任何個(gè)人身份信息。PRIVO是全球領(lǐng)先的兒童在線隱私行業(yè)專家,他對數(shù)據(jù)科學(xué)碗和今年比賽的數(shù)據(jù)使用進(jìn)行了審查,以確保其符合適用的兒童隱私法規(guī)的要求。
PBS的孩子們有什么標(biāo)準(zhǔn)!應(yīng)用程序?
在PBS里,孩子們都很好!應(yīng)用程序,3至5歲的孩子學(xué)習(xí)早期的莖的概念,重點(diǎn)是長度,寬度,容量和重量,而去冒險(xiǎn),通過樹梢城市,巖漿峰和水晶洞穴。加入他們最喜歡的PBS兒童角色,孩子們也可以收集獎(jiǎng)勵(lì)和解鎖數(shù)字玩具,因?yàn)樗麄儼l(fā)揮。了解更多關(guān)于PBS的孩子們的標(biāo)準(zhǔn)!,請單擊此處。
PBS KIDS和PBS KIDS徽標(biāo)是PBS的注冊商標(biāo)。經(jīng)允許使用。PBS孩子們的內(nèi)容都很好!是在教育部的資助下發(fā)展起來的。然而,這些內(nèi)容并不一定代表教育部的政策,你不應(yīng)該承擔(dān)由聯(lián)邦政府認(rèn)可。該應(yīng)用程序由教育部向公共廣播公司提供的即學(xué)助學(xué)金資助(PR/獎(jiǎng)勵(lì)編號:U295A150003,CFDA編號:84.295A)。
2. Top方案分享:
1st place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127469
2nd place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127388
3rd place solution - single TRANSFORMER model:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127891, Code:https://github.com/lime-robot/dsb2019
4th place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127210
7th place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127213
8th place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127285
9th place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127612
10th place solution:https://www.kaggle.com/c/data-science-bowl-2019/discussion/127332
TensorFlow 2.0 Question Answering
1. 賽題背景:
2. Top方案分享:
1st place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127551
2nd place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127333
3rd place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127339
4th place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127371
6th place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127521
7th place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127259
8th place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/127545
9th place solution:https://www.kaggle.com/c/tensorflow2-question-answering/discussion/128278
Santa's Workshop Tour 2019(1620只隊(duì)伍)
1. 賽題背景:
錘子響了,你在聽嗎? 在商店里,玩具閃閃發(fā)光.他們應(yīng)該看風(fēng)景嗎?可能會(huì)有一場戰(zhàn)斗…在工作坊仙境漫步
家人說,他們想看看,圣誕老人說,他會(huì)保證的,他們選了個(gè)約會(huì),但他們可能不得不等待,在工作坊仙境漫步
我們告訴圣誕老人他是個(gè)瘋子,他只是想確保他們都笑,他會(huì)說“你靈活嗎?他們會(huì)說“是的,伙計(jì),但你能幫我們讓這值得一試嗎?”
“給他們食物或毛衣,他們等得越久,禮物就越好”,請幫我們排名,否則我們就要破產(chǎn)了!在工作坊仙境漫步
圣誕老人有令人興奮的消息!在圣誕節(jié)前的100天里,他開始參觀他的工作室。因?yàn)樾枨笕绱送?#xff0c;而且圣誕老人想讓事情盡可能公平,他讓5000個(gè)將要參觀研討會(huì)的家庭中的每一個(gè)選擇一份他們希望參加研討會(huì)的日期清單。既然所有的家庭都給圣誕老人送去了他們的偏好,他意識(shí)到不可能每個(gè)人都能得到他們的首選,所以他決定為那些沒有得到他們偏好的家庭提供額外的福利。此外,圣誕老人的會(huì)計(jì)部門告訴他,根據(jù)家庭的安排,可能會(huì)產(chǎn)生一些意想不到的巨大費(fèi)用。
圣誕老人需要Kaggle社區(qū)的幫助來優(yōu)化每個(gè)家庭被分配到哪一天參加研討會(huì),以盡量減少任何額外的開支,這將削減明年的玩具預(yù)算!你能幫圣誕老人嗎?
2. Top方案分享:
1st place solution:https://www.kaggle.com/c/santa-workshop-tour-2019/discussion/127427
2nd place solution:https://www.kaggle.com/c/santa-2019-revenge-of-the-accountants/discussion/126380
6th place solution:https://www.kaggle.com/c/santa-workshop-tour-2019/discussion/126255
13th place solution:https://www.kaggle.com/c/santa-workshop-tour-2019/discussion/126254
Google QUEST Q&A Labeling
1. 賽題背景:
計(jì)算機(jī)真的很擅長用單一的、可驗(yàn)證的答案回答問題。但是,人類通常更善于回答關(guān)于意見、建議或個(gè)人經(jīng)歷的問題。
人類更善于解決主觀問題,這些問題需要對上下文有更深入、多層面的理解——計(jì)算機(jī)還沒有被訓(xùn)練得很好……但。。問題可以有多種形式——有些是多句話的闡述,另一些可能是簡單的好奇心問題或完全發(fā)展的問題。他們可以有多種意圖,或者尋求建議和意見。有些可能有用,有些則有趣。有些是簡單的對或錯(cuò)。
不幸的是,由于缺乏數(shù)據(jù)和預(yù)測模型,很難建立更好的主觀問答算法。這就是為什么google research的眾源團(tuán)隊(duì),一個(gè)致力于通過眾包來推進(jìn)NLP和其他類型的ML科學(xué)的團(tuán)隊(duì),已經(jīng)收集了許多質(zhì)量評分方面的數(shù)據(jù)。
在這場比賽中,你面臨的挑戰(zhàn)是如何使用這個(gè)新的數(shù)據(jù)集來為問答的不同主觀方面構(gòu)建預(yù)測算法。這些問答對是以“常識(shí)”的方式從近70個(gè)不同的網(wǎng)站收集的。我們的評分員接受的指導(dǎo)和培訓(xùn)很少,主要依賴于他們對提示的主觀解釋。因此,每個(gè)提示都是以最直觀的方式制作的,這樣評分員就可以簡單地使用他們的常識(shí)來完成任務(wù)。通過減少我們對復(fù)雜和不透明的評級準(zhǔn)則的依賴,我們希望增加這個(gè)數(shù)據(jù)集的重用價(jià)值。你看到的就是你得到的!
證明這些主觀標(biāo)簽?zāi)軌虮豢煽康仡A(yù)測,將為這一研究領(lǐng)域帶來新的曙光。本次比賽的結(jié)果將為未來智能答疑系統(tǒng)的構(gòu)建提供參考,希望有助于它們變得更加人性化。
2. Top方案分享:
1st place solution:https://github.com/oleg-yaroshevskiy/quest_qa_labeling
2nd place solution:https://www.kaggle.com/c/google-quest-challenge/discussion/129978
3rd place solution:https://www.kaggle.com/c/google-quest-challenge/discussion/129927
4th place solution:https://www.kaggle.com/c/google-quest-challenge/discussion/129896
5th solution:https://www.kaggle.com/c/google-quest-challenge/discussion/129875
6th place solution:https://www.kaggle.com/c/google-quest-challenge/discussion/130243
7th place post:https://www.kaggle.com/c/google-quest-challenge/discussion/130083
9th place solution:https://www.kaggle.com/c/google-quest-challenge/discussion/130167
10th Private:https://www.kaggle.com/c/google-quest-challenge/discussion/129901
12th place solution:https://www.kaggle.com/c/google-quest-challenge/discussion/129914
16th Place Solution:https://www.kaggle.com/c/google-quest-challenge/discussion/130112
OpenVaccine: COVID-19 mRNA Vaccine Degradation Prediction
1. 賽題背景:
要想贏得對抗COVID-19大流行的戰(zhàn)斗,就需要一種能夠公平和廣泛分布的有效疫苗。在幾十年的研究基礎(chǔ)上,科學(xué)家們加速了對COVID-19疫苗的研究,但是沒有疫苗的每一天都會(huì)給世界帶來巨大的代價(jià)。我們需要來自世界各地的新思想。網(wǎng)絡(luò)游戲和眾包能否幫助解決全球范圍內(nèi)的流行病?將科學(xué)和眾包智能結(jié)合起來可以幫助計(jì)算生物化學(xué)家取得可衡量的進(jìn)展。
mRNA疫苗已成為COVID-19最快的候選疫苗,但目前它們面臨著關(guān)鍵的潛在限制。目前最大的挑戰(zhàn)之一是如何設(shè)計(jì)超穩(wěn)定的信使RNA分子(mRNA)。傳統(tǒng)疫苗(如季節(jié)性流感疫苗)用一次性注射器包裝,冷藏后運(yùn)到世界各地,但這在目前的mRNA疫苗中是不可能的。
研究人員觀察到RNA分子有自發(fā)降解的傾向。這是一個(gè)嚴(yán)重的限制——一次切割就可以使mRNA疫苗無效。目前,對于特定RNA的主干中最容易受影響的部位的細(xì)節(jié)知之甚少。如果沒有這些知識(shí),目前針對COVID-19的mRNA疫苗必須在高強(qiáng)度冷藏條件下制備和運(yùn)輸,除非它們能夠穩(wěn)定下來,否則不太可能到達(dá)地球上超過一小部分的人類。
由斯坦福大學(xué)醫(yī)學(xué)院計(jì)算生物化學(xué)家Rhiju Das教授領(lǐng)導(dǎo)的Eterna社區(qū)將科學(xué)家和游戲玩家聚集在一起解決難題并發(fā)明藥物。Eterna是一個(gè)在線視頻游戲平臺(tái),它挑戰(zhàn)玩家通過謎題來解決諸如mRNA設(shè)計(jì)之類的科學(xué)問題。研究人員在斯坦福對這些溶液進(jìn)行了合成和實(shí)驗(yàn)測試,以獲得有關(guān)RNA分子的新見解。埃特納社區(qū)此前已經(jīng)開啟了新的科學(xué)原理,對致命疾病做出了新的診斷,并利用世界上最強(qiáng)大的智力資源來改善公眾的生活。Eterna社區(qū)通過其在20多份出版物中的貢獻(xiàn),包括RNA生物技術(shù)的進(jìn)展,促進(jìn)了生物技術(shù)的發(fā)展。
在這次比賽中,我們希望利用Kaggle社區(qū)的數(shù)據(jù)科學(xué)專業(yè)知識(shí)來開發(fā)RNA降解的模型和設(shè)計(jì)規(guī)則。您的模型將預(yù)測RNA分子每個(gè)堿基的可能降解率,這些RNA分子在一個(gè)由3000多個(gè)RNA分子組成的Eterna數(shù)據(jù)集的子集上進(jìn)行訓(xùn)練(這些RNA分子跨越了一系列序列和結(jié)構(gòu))以及它們在每個(gè)位置的降解率。然后,我們將為你的模型打分,這些模型是由Eterna players為COVID-19mRNA疫苗設(shè)計(jì)的第二代RNA序列。這些最終的測試序列目前正在斯坦福大學(xué)進(jìn)行合成和實(shí)驗(yàn)表征,與你的建模工作并行——大自然將為你的模型打分!
提高mRNA疫苗的穩(wěn)定性是大流行前正在探索的一個(gè)問題,但預(yù)計(jì)需要多年才能解決。現(xiàn)在,我們必須在數(shù)月甚至數(shù)周內(nèi)解決這一深層次的科學(xué)挑戰(zhàn),以加速mRNA疫苗的研究,并提供一種針對SARS-CoV-2(COVID-19背后的病毒)的冰箱穩(wěn)定疫苗。我們正在努力解決的問題已經(jīng)躲過了學(xué)術(shù)實(shí)驗(yàn)室、工業(yè)研發(fā)小組和超級計(jì)算機(jī)的視線,所以我們轉(zhuǎn)向你們。為了提供幫助,您可以加入Eterna的視頻游戲玩家、科學(xué)家和開發(fā)人員團(tuán)隊(duì),開啟我們抗擊這場毀滅性流行病的關(guān)鍵。
2. Top方案:
1st place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189620
2nd place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189709
3rd Place Write-up:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189574
4th place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189650
5th Place:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189691
7th place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189564
8th place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/190314
9th place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189845
11th place solution:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189571
其它方案:https://www.kaggle.com/c/stanford-covid-vaccine/discussion/189344
RSNA STR Pulmonary Embolism Detection
1. 賽題背景:
如果每一次呼吸都是緊張和痛苦的,那就可能是一種嚴(yán)重的、可能危及生命的狀況。肺栓塞是由肺動(dòng)脈阻塞引起的。確認(rèn)PE很費(fèi)時(shí),而且容易過度診斷。機(jī)器學(xué)習(xí)有助于更準(zhǔn)確地識(shí)別PE病例,使患者的管理和治療更有效。
目前,CT肺動(dòng)脈造影(CTPA)是評價(jià)疑似PE患者最常見的影像學(xué)檢查方法。這些CT掃描包括數(shù)百張圖像,需要詳細(xì)檢查以確定肺動(dòng)脈內(nèi)的血栓。隨著影像學(xué)的應(yīng)用不斷增長,放射科醫(yī)生的時(shí)間限制可能導(dǎo)致診斷延遲。
北美放射學(xué)會(huì)(RSNA?)與胸科放射學(xué)會(huì)(STR)合作,幫助改進(jìn)機(jī)器學(xué)習(xí)在PE診斷中的應(yīng)用。
在這次比賽中,你將發(fā)現(xiàn)和分類PE病例。特別是,您將使用胸部CTPA圖像(分組為研究)和您的數(shù)據(jù)科學(xué)技能,以便更準(zhǔn)確地識(shí)別PE。如果成功,你將有助于減少人為延誤和錯(cuò)誤的檢測和治療。
在美國,每年有60000-100000例PE死亡,是最致命的心血管疾病之一。及時(shí)準(zhǔn)確的診斷將有助于這些患者得到更好的治療,也可能改善預(yù)后。
2. Top方案:
1st place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/194145
2nd place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193401
3rd place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193424
4th place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193970
5th place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193475
6th place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/195865
7th place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193460
8th place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193506
9th place solution:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193417
10th place solution:kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193505
其它方案:https://www.kaggle.com/c/rsna-str-pulmonary-embolism-detection/discussion/193795
Google Landmark Recognition 2020
1. 賽題背景:
歡迎參加第三屆地標(biāo)識(shí)別大賽!今年,我們將此設(shè)置為一個(gè)代碼競賽,并收集了一組新的測試圖像。
你有沒有看過自己的度假照片,問自己:我在中國參觀的那座寺廟叫什么名字?或者是誰創(chuàng)造了這個(gè)我在法國看到的紀(jì)念碑?地標(biāo)識(shí)別有幫助!這項(xiàng)技術(shù)可以直接從圖像像素預(yù)測地標(biāo)標(biāo)簽,幫助人們更好地理解和組織他們的照片收藏。這項(xiàng)競賽挑戰(zhàn)Kagglers建立模型,識(shí)別具有挑戰(zhàn)性的測試圖像數(shù)據(jù)集中的正確地標(biāo)(如果有的話)。
許多kaggler都熟悉圖像分類挑戰(zhàn),比如ImageNet大規(guī)模視覺識(shí)別挑戰(zhàn)(ILSVRC),它的目標(biāo)是識(shí)別1K個(gè)一般對象類別。Landmark recognition與之稍有不同:它包含大量的類(在這個(gè)挑戰(zhàn)中有超過81K個(gè)類),每個(gè)類的訓(xùn)練示例數(shù)可能不是很大。地標(biāo)識(shí)別本身就具有挑戰(zhàn)性。
在本挑戰(zhàn)的前幾個(gè)版本(2018年和2019年)中,提交是通過將預(yù)測文件上傳到系統(tǒng)來處理的。今年的比賽采用同步重播的形式,參賽者需要提交卡格爾筆記本進(jìn)行評分。
本次挑戰(zhàn)賽與2020年6月30日推出的地標(biāo)檢索挑戰(zhàn)賽(Landmark Retrieval challenge 2020)聯(lián)合舉辦。這兩項(xiàng)挑戰(zhàn)都與ECCV'20的實(shí)例級識(shí)別研討會(huì)有關(guān)。
2. Top方案:
1st place solution:https://www.kaggle.com/c/landmark-recognition-2020/discussion/187821
2nd place solution:https://www.kaggle.com/c/landmark-recognition-2020/discussion/188299
3rd place solution:https://www.kaggle.com/c/landmark-recognition-2020/discussion/187757
6th place solution:https://www.kaggle.com/c/landmark-recognition-2020/discussion/187961
OSIC Pulmonary Fibrosis Progression
1. 賽題背景:
想象有一天,你的呼吸變得持續(xù)費(fèi)力和淺。幾個(gè)月后,你終于被診斷為肺纖維化,一種病因不明,治愈方法不明的疾病,由肺部疤痕造成。如果發(fā)生在你身上,你會(huì)想知道你的預(yù)后。正是在這種情況下,一種令人不安的疾病對患者來說變得可怕:結(jié)果可能從長期穩(wěn)定到迅速惡化,但醫(yī)生們不容易判斷一個(gè)人可能屬于這一范圍。你的幫助,和數(shù)據(jù)科學(xué),也許能夠幫助這個(gè)預(yù)測,這將極大地幫助病人和臨床醫(yī)生。
目前的方法使纖維化的肺部疾病難以治療,即使可以獲得胸部CT掃描。此外,各種各樣的預(yù)后造成了組織臨床試驗(yàn)的問題。最后,患者除了因疾病進(jìn)展路徑不透明而出現(xiàn)與纖維化相關(guān)的癥狀外,還遭受極度焦慮。
開放源代碼成像聯(lián)盟(OSIC)是學(xué)術(shù)界、工業(yè)界和慈善機(jī)構(gòu)之間的一個(gè)非營利合作組織。該小組在對抗特發(fā)性肺纖維化(IPF)、纖維化間質(zhì)性肺疾病(ILD)和其他呼吸系統(tǒng)疾病(包括肺氣腫)方面取得了快速進(jìn)展。它的任務(wù)是匯集來自世界各地的放射科醫(yī)生、臨床醫(yī)生和計(jì)算科學(xué)家,以改進(jìn)基于成像的治療方法。
在這場比賽中,你將根據(jù)患者肺部的CT掃描來預(yù)測其肺功能下降的嚴(yán)重程度。你將根據(jù)肺活量計(jì)的輸出測定肺功能,肺活量計(jì)測量吸入和呼出的空氣量。目前的挑戰(zhàn)是使用機(jī)器學(xué)習(xí)技術(shù),以圖像、元數(shù)據(jù)和基線FVC作為輸入進(jìn)行預(yù)測。
如果成功的話,當(dāng)病人和他們的家人第一次被診斷出患有這種無法治愈的肺部疾病時(shí),他們會(huì)更好地了解自己的預(yù)后。改善嚴(yán)重程度檢測也將對治療試驗(yàn)設(shè)計(jì)產(chǎn)生積極影響,并加速新療法的臨床開發(fā)。
2. Top方案:
1st place solution:https://www.kaggle.com/c/osic-pulmonary-fibrosis-progression/discussion/189346
4th place solution:https://www.kaggle.com/c/osic-pulmonary-fibrosis-progression/discussion/189214
5th place solution:https://www.kaggle.com/c/osic-pulmonary-fibrosis-progression/discussion/189318
6th place solution:https://www.kaggle.com/c/osic-pulmonary-fibrosis-progression/discussion/189220
9th place solution:https://www.kaggle.com/c/osic-pulmonary-fibrosis-progression/discussion/189251
10th place solution:https://www.kaggle.com/c/osic-pulmonary-fibrosis-progression/discussion/189217
Mechanisms of Action (MoA) Prediction
1. 賽題背景:
連接圖是麻省理工學(xué)院和哈佛大學(xué)廣泛研究所、哈佛大學(xué)創(chuàng)新科學(xué)實(shí)驗(yàn)室(LISH)和美國國立衛(wèi)生研究院共同基金綜合網(wǎng)絡(luò)細(xì)胞特征庫(LINCS)的一個(gè)項(xiàng)目,它提出了這一挑戰(zhàn),目標(biāo)是通過改進(jìn)MoA預(yù)測算法來推進(jìn)藥物開發(fā)。
藥物的作用機(jī)制是什么?為什么它很重要?
在過去,科學(xué)家從天然產(chǎn)物中提取藥物,或者受傳統(tǒng)療法的啟發(fā)。非常常見的藥物,如撲熱息痛,在美國被稱為對乙酰氨基酚,被投入臨床使用幾十年前的生物學(xué)機(jī)制驅(qū)動(dòng)其藥理活性被理解。今天,隨著更強(qiáng)大的技術(shù)的出現(xiàn),藥物發(fā)現(xiàn)已經(jīng)從過去的偶然方法轉(zhuǎn)變?yōu)榛趯膊撛谏飳W(xué)機(jī)制的理解的更有針對性的模型。在這個(gè)新的框架中,科學(xué)家們試圖找出一種與疾病相關(guān)的蛋白質(zhì)靶點(diǎn),并開發(fā)出一種能夠調(diào)節(jié)該蛋白質(zhì)靶點(diǎn)的分子。作為描述特定分子生物活性的簡寫,科學(xué)家們指定了一個(gè)簡稱為“作用機(jī)制”或“MoA”的標(biāo)簽。
如何確定新藥的MoAs?
一種方法是用藥物處理人類細(xì)胞樣本,然后用算法分析細(xì)胞反應(yīng),這些算法在大型基因組數(shù)據(jù)庫中搜索與已知模式的相似性,例如基因表達(dá)庫或已知MOA藥物的細(xì)胞生存模式。
在這場比賽中,你將獲得一個(gè)獨(dú)特的數(shù)據(jù)集,結(jié)合基因表達(dá)和細(xì)胞活力的數(shù)據(jù)。這項(xiàng)數(shù)據(jù)是基于一項(xiàng)新技術(shù),在100種不同細(xì)胞類型的細(xì)胞池中同時(shí)(在相同的樣本中)測量人類細(xì)胞對藥物的反應(yīng)(從而解決了事先確定哪些細(xì)胞類型更適合某一特定藥物的問題)。此外,您還可以訪問此數(shù)據(jù)集中5000多種藥物的MoA注釋。
按照慣例,數(shù)據(jù)集被分為測試和訓(xùn)練子集。因此,您的任務(wù)是使用訓(xùn)練數(shù)據(jù)集來開發(fā)一個(gè)算法,該算法自動(dòng)將測試集中的每個(gè)案例標(biāo)記為一個(gè)或多個(gè)MoA類。注意,由于藥物可以有多個(gè)MoA注釋,因此這項(xiàng)任務(wù)在形式上是一個(gè)多標(biāo)簽分類問題。
如何評估解決方案的準(zhǔn)確性?
基于MoA注釋,將根據(jù)應(yīng)用于每個(gè)藥物MoA注釋對的對數(shù)損失函數(shù)的平均值來評估溶液的準(zhǔn)確性。
如果成功,你將幫助開發(fā)一種算法,根據(jù)化合物的細(xì)胞特征預(yù)測其MoA,從而幫助科學(xué)家推進(jìn)藥物發(fā)現(xiàn)過程。
2. Top方案分享:
1st place solution:https://www.kaggle.com/c/lish-moa/discussion/201510
2nd Place Solution:https://www.kaggle.com/c/lish-moa/discussion/202256
3rd place solution:kaggle.com/c/lish-moa/discussion/202078
4th place solution:https://www.kaggle.com/c/lish-moa/discussion/200808
7th place solution:https://www.kaggle.com/c/lish-moa/discussion/200784
8th place solution:https://www.kaggle.com/c/lish-moa/discussion/200992
Google Research Football with Manchester City F.C.?
1. 賽題背景:
曼城F.C.和谷歌研究公司很自豪地展示了使用谷歌研究足球環(huán)境的人工智能足球比賽。
曼城足球俱樂部的一句話。
曼城足球俱樂部的老板,城市足球集團(tuán)的數(shù)據(jù)洞察和決策技術(shù)總監(jiān)布萊恩·普雷斯蒂奇提出了這個(gè)挑戰(zhàn)。“足球是一個(gè)艱苦的環(huán)境中表現(xiàn)和更艱苦的環(huán)境中學(xué)習(xí)。學(xué)習(xí)就是要駕馭失敗,但足球中的失敗很少被接受。與谷歌研究公司(Google Research)的基于物理的足球環(huán)境合作,為我們提供了一個(gè)通過模擬學(xué)習(xí)的新地方,并為我們提供了測試戰(zhàn)術(shù)概念和完善原則的能力,從而使它們足夠強(qiáng)大,足以讓教練將職業(yè)生涯押在其身上。”
“因此,我們非常高興能與谷歌的研究團(tuán)隊(duì)合作,創(chuàng)建這一競賽,并期待著有機(jī)會(huì)通過資金和獨(dú)家獎(jiǎng)勵(lì),支持一些最具創(chuàng)意和最成功的競爭對手。我們希望在本次比賽之外,與獲獎(jiǎng)?wù)呓⒊掷m(xù)的合作關(guān)系,為我們大家提供探索和確立足球戰(zhàn)術(shù)基本原則的平臺(tái),從而提高我們在球場上的表現(xiàn)和成功的能力。”
城市足球集團(tuán)(City Football Group)首席技術(shù)官格雷格?斯威默(Greg Swimer)補(bǔ)充說:“機(jī)器學(xué)習(xí)和人工智能等技術(shù)在增強(qiáng)球員、教練和球迷對足球的理解和享受方面具有巨大的未來潛力。我們很高興能與谷歌的研究團(tuán)隊(duì)合作,以幫助擴(kuò)大知識(shí),人才和創(chuàng)新工作在這個(gè)令人興奮和轉(zhuǎn)型的領(lǐng)域”。
谷歌研究足球環(huán)境競賽,世界從足球中得到樂趣(足球在美國)。作為地球上最受歡迎的運(yùn)動(dòng),數(shù)百萬的球迷喜歡在球場上觀看塞爾吉奧·阿圭羅、拉希姆·斯特林和凱文·德·布魯因。足球電子游戲雖然不那么生動(dòng),但仍然非常受歡迎,我們想知道人工智能代理是否能夠正確地玩這些游戲。
研究人員希望探索人工智能特工在足球等復(fù)雜環(huán)境中的能力。這項(xiàng)運(yùn)動(dòng)需要一種平衡,即短期控制,學(xué)習(xí)傳球等概念,以及高水平的策略,而這些都很難教給經(jīng)紀(jì)人。目前存在一個(gè)培訓(xùn)和測試代理的環(huán)境,但其他解決方案可能提供更好的結(jié)果。googleresearch的團(tuán)隊(duì)渴望做出對每個(gè)人都有影響的發(fā)現(xiàn)。分享研究成果和工具以推動(dòng)這一領(lǐng)域的進(jìn)展,是他們采取這一做法的關(guān)鍵。谷歌研究公司與曼城F.C.共同發(fā)起了這場競爭,以幫助他們實(shí)現(xiàn)目標(biāo)。
2. Top方案分享:
1st place solution: https://www.kaggle.com/c/google-football/discussion/202232
2nd place solution: https://www.kaggle.com/c/google-football/discussion/202977
3rd place solution: ?https://www.kaggle.com/c/google-football/discussion/200709
5th place solution:https://www.kaggle.com/c/google-football/discussion/203412
6th place solution:https://www.kaggle.com/c/google-football/discussion/201376
7th place post:https://www.kaggle.com/c/google-football/discussion/200912
總結(jié)
以上是生活随笔為你收集整理的【数据竞赛】2020 Kaggle 10大竞赛方案汇总的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Win10本地账户怎么更改为Micros
- 下一篇: 【Python基础】Python初学者必