2021亚太杯数学建模竞赛
亞太杯數學建模競賽
數據類型題涉及的知識點及基本模型講解
本人曾參加亞太杯四次,三次都是 First Prize,其中有一次因中途電腦燒壞了就暫停編寫建模論文因而拿了Second Prize;我們立足當前,著眼長遠,按照社會價值導向,輔導學生跨越夢想的橋梁;全面推進每個學子數學建模競賽的獲獎目標,切實抓好編程與數學模型的任務重點。
可以說亞太杯是所有建模競賽中最容易獲獎的數學建模競賽,不論這次亞太杯的題目是研究算法效率的、還是探尋數據規律的、還是有固定范圍計算結果答案的,我們都可以屢試不爽的使用我接下來介紹的數據描述基本模型:
數據的基本統計描述
– 目的
– 數據的基本統計描述
? 更好地識別數據的性質,把握數據全貌。
? 中心趨勢度量、數據分散度量、數據的圖形表示
– 中心趨勢度量
? 均值、加權算數均值、中位數、眾數、中列數
– 數據分散度量
? 極差、分位數和四分位數、方差和標準差
– 數據的圖形顯示
? 箱圖、餅圖、頻率直方圖、散點圖
有的人可能會說你這個寫這么簡單的東西,根本入不了評委的眼睛,不好意思,我年年這么干,年年First Prize,因為你數據分析前:第一要做數據處理;第二宏觀上了解數據的情況這一步就叫做數據的基本統計描述;第三步然后才是具體有針對的分析數據變量
1. 中心趨勢度量
– 均值(Mean)
? 令x1,x2,…,xN為某數值屬性X的N個觀測值,該值集合的均值如式
(2-1)所示。
– 加權算數平均數(Weighted Mean)
? 對于i=1,…,N,每個值xi都有一個權重wi。
– 分組數據中位數(Grouped Median)
? 根據N/2確定中位數所在的組
Me:中位數,L:中位數所在組的下限,Sm-1:中位數所在組以下各組的
累計頻數,fm:中位數所在組的頻數,d:中位數所在組的組距。
– 眾數(Mode):數據中出現最頻繁的值
– 中列數(Midrange):數據集中最大值和最小值的算術平均值
2. 數據分散度量
– 極差(又稱全距,Range):是集合中最大值與最小值之間的差距,
即最大值減最小值后所得數據。
– 分位數(Quantile):取自數據分布的每隔一定間隔上的點,把數據
劃分成基本上大小相等的連貫集合。
– 方差(樣本方差):是每個數據分別與平均數之差的平方的平均數。
3. 數據的圖形顯示(數據可視化)
每次數學建模競賽中都必須得繪圖,但你真的了解數據的圖形顯示么?你知道該怎么繪圖么?你知道什么情況下繪制直方圖,什么情況下繪制散點圖,什么情況下繪制密度直方圖么?你知道為什么你繪圖了,結果也對為什么沒獲獎么?**是因為你根本不知道什么情況下繪制什么可視化圖形。**我在這里告訴你一下:沒有比較就沒有鑒別,只知其一,一無所知。
– 盒圖(又稱箱線圖,Box-plot),是一種用來描述數據分布的統計圖形,
可以表現觀測數據的中位數、四分位數和極值等描述性統計量。
– 餅圖(又稱圓形圖或餅形圖,Pie Graph),通常用來表示整體的構成
部分及各部分之間的比例關系。餅圖顯示一個數據系列中各項的大小
與各項總和的比例關系。
– 頻率直方圖(又稱頻率分布直方圖,Frequency Histogram), 是在統
計學中表示頻率分布的圖形。
– 散點圖(Scatter Diagram):將樣本數據點繪制在二維平面或三維空
間上,根據數據點的分布特征,直觀地研究變量之間的統計關系以及
強弱程度。
標稱屬性的鄰近性度量
? 相異性
? p是對象的屬性總數,m是匹配的屬性數目(即對象i和j狀態相
同的屬性數)
? 相似性
數據的相異性判別方法有:
歐幾里得距離(Euclidean Distance ):又稱直線距離。
曼哈頓距離(Manhattan Distance):又稱城市塊距離。
閔可夫斯基距離(Minkowski Distance )。
切比雪夫距離(Chebyshev Distance ):又稱上確界距離,定義兩個對
象之間的上確界距離為其各坐標數值差的最大值。
如果你想了解更多,并且在競賽中取得榮譽,那就努力學習吧。大學學習沒有徘徊,沒有迷茫,沒有糾結,專注的走自己腳下這條學習的道路,走的更遠登的更高,不回頭,然后有一天當你往腳下看群星在你腳下燦爛。
總結
以上是生活随笔為你收集整理的2021亚太杯数学建模竞赛的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 部署OpenStack问题汇总(五)--
- 下一篇: 全国计算机等级考试题库二级C操作题100