2021美赛C题M奖思路
2021美賽C題亞洲大黃蜂思路
序言:
第一題的模型就用種群繁衍,然后用python做地圖的可視化,這就是數學公式啦,把地球近似成一個球體然后用角度和勾股定理模擬三代的繁衍(一開始只有三個巢穴是官方給的文獻能夠找到)
1.圖像識別
CNN卷積神經網絡
2.TF-IDF
Term Frequency - Inverse Document Frequency = 詞頻-逆文本頻率
把語言向量化,TF-IDF把每一個文檔 夠早晨一個相量 把這個相量放在一個空間中 計算機計算空間的效率是最高的,深度學習就是把一個向量計算出來然后放在一個空間中去計算位置與位置的距離,角度與角度之間的大小,通過對比,最終實現搜索和匹配,閑聊機器人、搜索,基于這種底層邏輯!
就是說 像在賣房的中介說了一大堆話,我怎么知道他說的話里面哪句話對我是最重要的
把正確發現大黃蜂的描述文本創建一個TF-IDF,把后面每一個需要判斷的文本都輸入進來計算TF*IDF最后計算兩個的余弦相似度,作為一個評分。
不足:不同領域的IDF不同,(中文結巴分詞)這里沒有特定的分領域。
3. 地點
用圖論
4.整合成一個模型
把上述三種不同的描述方面,整合成一個單獨的能夠判斷下一次上報的信息的可能性的一個模型
這里我們用的是層次分析法,首先是去量綱,然后歸一化,查閱相關的文獻,然后給三個不同的判斷方向的,
5.分類與模型靈敏度分析
我們的需求是通過概率來分類,我們這里用二分類,要么消息是真的,要么是假的,這個時候ROC曲線當仁不讓,用的是stata
TPR是真陽性檢出率(靈敏度)
FPR是假陽性率 = 1 - 真陰性檢出率(特異度)
我們要讓假陽性盡可能的小,真陽性盡可能的大,所以要越往左上角靠越好。我們要定義評分體系的最合理的“及格”分數是多少,就要用到ROC的約登指數來找出最佳閾值
約登指數 = 敏感度+特異度-1
ps:2021-10-01來看上榜了, 感謝大家支持啦~~~~
總結
以上是生活随笔為你收集整理的2021美赛C题M奖思路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 刷网课seleinum 小程序
- 下一篇: python九九乘法表代码及循环过程详解