python图灵测试_最前沿:基于GAN和RL的思想来训练对话生成,通过图灵测试可期!...
PS:本文分析略深,需要一定的RL和GAN的基礎。
前兩天,Stanford的NLP小組出了一篇神經網絡對話生成的論文:
標題就是使用對抗學習來做神經對話生成。
這個idea非常的贊!在我看來是通往圖靈測試的正確一步。
以前的對話生成,我們使用Seq2Seq的監督學習,其實也就是模仿學習。但是模仿學習的問題是神經網絡的理解能力有限,訓練樣本有限,只能生成一定程度的對話。
那么,有沒有可能讓計算機真正理解對話的意思,然后自己學會對話呢?
有了深度增強學習,有了AlphaGo大家可以知道這是可能的。事實上這篇論文的作者Jiwei Li之前的一篇文章就是用深度增強學習來做對話生成。
但是使用深度增強學習最大的問題就是需要有reward。沒有reward沒法訓練。
但是怎么定義一個對話的reward呢?好困難,有太多評價標準。但是有一個標準是絕對的,就是圖靈測試的標準。只要這個對話看起來像人說的就行了。
這就不得不聯系到了GAN生成對抗網絡。把GAN中的分類器用來對對話做分類就行了。這樣訓練出來的分類器可以一定程度上判斷計算機生成的對話與人的對話的差距。而這個 差距就是reward !
這篇文章可以說把DRL和GAN的思想很好的結合起來并應用在對話生成問題上,也取得了比較好的效果。相信在這個方法的基礎上進一步發展,比如改進網絡結構,將對話拓展到段落,更多的訓練等等。 也許3-5年圖靈測試就真正通過了,而這一次,是機器自己真正學會了交流!
PS:本文同步發于“智能單元”微信公眾號,歡迎大家關注,第一時間獲取通用人工智能原創資訊!
總結
以上是生活随笔為你收集整理的python图灵测试_最前沿:基于GAN和RL的思想来训练对话生成,通过图灵测试可期!...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2019年银行存款利率表,最新存款利率查
- 下一篇: 2017想要成功申卡 一定要远离这几种行