隐藏层节点数对迭代次数分布规律的影响
制作一個二分類網絡
(mnist 0 ,2)-81*n*2-(1,0)(0,1)
讓n分別等于3,5,10,20,30,40,50,60,70,80,90,100,100,110,120,130,
讓δ=1e-6, ret=0.1,weix=1000.
對應每個收斂標準收斂1999次。觀察迭代次數對同一收斂標準的分布規律。
實驗得到數據如下
| 隱藏層節點數 | 迭代次數的均值 | 平均分類準確率 | δ | 耗時ms/次 | 最大峰值占比% | 不同峰值數量 |
| 3 | 178616.4877 | 0.986592451 | 1.00E-06 | 796.08804 | 7 | 683 |
| 5 | 117136.8594 | 0.98855914 | 1.00E-06 | 621.7969 | 3 | 674 |
| 10 | 80329.23862 | 0.988490518 | 1.00E-06 | 583.22361 | 18 | 162 |
| 20 | 56105.15958 | 0.987261772 | 1.00E-06 | 732.94347 | 46 | 40 |
| 30 | 34663.66183 | 0.985049185 | 1.00E-06 | 606.98649 | 37 | 23 |
| 40 | 18375.36068 | 0.983432571 | 1.00E-06 | 453.7964 | 38 | 13 |
| 50 | 12000.17909 | 0.982436049 | 1.00E-06 | 382.18659 | 34 | 13 |
| 60 | 8716.448224 | 0.982761759 | 1.00E-06 | 335.53677 | 62 | 8 |
| 70 | 7765.041521 | 0.981953203 | 1.00E-06 | 357.97199 | 82 | 6 |
| 80 | 7575.328664 | 0.981890548 | 1.00E-06 | 389.42671 | 80 | 7 |
| 90 | 6987.775888 | 0.982819939 | 1.00E-06 | 417.70035 | 47 | 7 |
| 100 | 5530.548274 | 0.98257404 | 1.00E-06 | 423.09355 | 55 | 9 |
| 110 | 4701.468734 | 0.981943755 | 1.00E-06 | 384.8024 | 55 | 9 |
| 120 | 4529.92096 | 0.981862701 | 1.00E-06 | 392.42271 | 92 | 5 |
| 130 | 4516.147074 | 0.981792089 | 1.00E-06 | 511.30415 | 100 | 2 |
?
比如第一組數據對應的迭代次數分布圖片
迭代次數的峰值為160393,在1999次迭代中占到大約7%,不同的峰值共有683個。
統計分類準確率和峰值占比的數據有很強的相關性
當n=5時取得最大pave=0.988559140405195
同樣當n=5時最大峰值為120409,這個峰值占比只有約3%,是所有15組數據最大峰值占比最小的。而不同峰值數量也僅次于n=3的683峰,有674峰。
這個實驗表明最大峰值占比與網絡的分類準確率有很強的關聯性。
從實驗結果上看隨著n的增加迭代次數在減小,同時迭代次數的散度也在減小,當n=130時只有4516和4614兩個峰值,其中4614只出現了3次,占比不過千分之1.5.
?
從耗時上來考慮,效率最優值是n=8,當n>8以后隨著節點數的增加單次計算量增大,耗時也增加。當n<8隨著n的增加大體上網絡收斂效率是增加的。
但分類效率最優值和分類性能最優值并不重合。
?
其余14組圖片
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的隐藏层节点数对迭代次数分布规律的影响的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 广发银行信用卡还款宽限期几天
- 下一篇: 神经网络波动方程∂f(x)/ ∂x=f(