AI魔方大师:1.2秒解魔方超世界纪录2倍,平均移动28步
看點:目前破解三階魔方的世界紀錄保持者,用時也需 3.47 秒。
導語:1. 2 秒是什么概念呢?要知道,目前破解三階魔方的世界紀錄保持者,用時也需 3.47 秒。
智東西 7 月 16 日消息。近日,加州大學歐文分校(University of California,Irvine,簡稱 UCI)的研究人員研發出了一個名為 DeepCubeA 的 AI 算法,它利用深度強化學習(Deep Reinforcement Learning)的方法,可以在沒有任何領域知識或人類游戲指導的情況下快速破解魔方,并且速度是人類極限的兩倍。
在人類領域,第 10 屆世界魔方協會(WCA)錦標賽于今年 7 月 14 日在墨爾本舉行,來自德國的菲利普·威爾(Philipp Weyer)獲得冠軍,而他的成績則是在 6.74 秒內解出3×3×3 的魔方。
然而,目前該項世界紀錄的保持者是來自中國的杜宇生,他只用了 3.47 秒就破解了這個難題。
DeepCubeA 人工智能程序的研究成果已于美國時間 2019 年 7 月 15 日發表在《自然機器智能》雜志上,名為《用深度強化學習和搜索破解魔方(Solving the Rubik’s cube with deep reinforcement learning and search)》。
1. 2 秒內破解魔方,平均移動 28 步
該論文的第一作者、UCI 的博士生 Forest Agostinelli 表示,DeepCubeA 系統由一個深層神經網絡組成,可以在 1.2 秒內破解魔方,平均移動 28 步。
在這項研究中,DeepCubeA 算法能夠破解 100% 隨機打亂的魔方方塊,并在 60.3% 的游戲時間里計算出最短的目標解決路徑,將魔方的六個面都解成同一個顏色。
研究人員表示,該算法還適用于其他組合游戲,如 15 拼圖、24 拼圖、35 拼圖、48 拼圖、Lights Out 和推箱子游戲。
Lights Out 游戲
UCI 的計算機科學教授皮 Pierre Baldi 表示,這項研究為人們展示了一個人工智能系統,它可以自動學習如何破解標志性的魔方和其他類似的問題,這些問題的特點是有許多的可能性和非常少的解決方案,并且通過隨機移動的方式也幾乎無法提供解決方案。
用 100 億個魔方組合進行訓練
DeepCubeA 是使用強化學習來進行訓練的。
在這項研究中,研究人員想要了解人工智能是如何采取行動,以及需要多長時間才能完善自己的方法。
因此,研究人員先用電腦模擬出一個完整的魔方,然后將魔方打亂。DeepCubeA 的任務則是需要盡快地找到最低的“功能成本”來破解方法,其中包括計算成本和移動量。
另一方面,由于魔方有大約 43 萬億個可能的組合,這使 DeepCubeA 隨機開始進行訓練是不實際的。因此,研究人員選擇反向訓練,將 DeepCubeA 放置于序列中的一個特殊狀態,讓它從已經破解的部分中開始進行深度強化學習。
隨后,研究人員用 100 億個不同的魔方組合,對 DeepCubeA 進行了為期兩天的隔離訓練,并要求它在 30 步之內破解所有的魔方。
除此之外,研究人員還用 1000 個魔方難題對該算法進行測試,結果顯示,該算法不僅解決了所有的難題,并且還能在 60.3% 的時間里,以最少的移動步數完成了測試。
Baldi 表示,頂級魔方玩家需要大約 50 次移動,才能在 4 秒內破解魔方,但 DeepCubeA 可以在 20 步內完成,這證明了 AI 的策略和人類的推理策略是不同的。
結合符號、數學和抽象思維
Baldi 認為,雖然魔方是一個玩具,但破解魔方問題需要更多的符號、數學和抽象思維,因此一個能夠破解魔方的深度學習機器,也將越來越接近成為一個能夠思考、推理、計劃和決策的系統。
“機器人和一些需要進行規劃才能解決問題的其他領域也具有這些特征,”Baldi 補充說。“想象一下,一個機器人負責清理廚房,它需要做出許多動作,但讓廚房變得干凈的步驟卻很少,隨意移動臟盤子的方法是行不通的。”
他還表示,從廣泛層面來說,DeepCubeA 能將機器學習 AI 和符號 AI 連接起來,以幫助人類進行規劃和推理,以解決更多更復雜的問題。
魔方創造者 Erno Rubik
結語:將為人們提供更高效的解決方案
一直以來,破解魔方都被人們認為是一個經典的規劃問題。DeepCubeA 的 AI 算法通過把神經網絡與符號 AI 相結合,能夠將復雜的環境提取為知識,并進行推理以解決問題。
DeepCubeA 不僅是對人類速度領域的進一步超越,同時在未來的工作中,它也許能應用在其他具有復雜特征的各種問題中,例如機器人操作、蛋白質結構預測等領域,為人們提供更高效得解決方案。
論文連接:https://www.nature.com/articles/s42256-019-0070-z
文章來源:Forbes、The Registe
總結
以上是生活随笔為你收集整理的AI魔方大师:1.2秒解魔方超世界纪录2倍,平均移动28步的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 沃达丰德国加入5G战局
- 下一篇: 腾讯申请,暴风集团被深圳南山法院冻结23