RNN实践之唐诗创作
這次,嘗試先用RNN玩一下唐詩創(chuàng)作。
//update 201602100001 本來是唐詩的,結(jié)果唐詩里面太多生僻字 所以我剛剛從網(wǎng)上下載了一些歌詞,想仿照參考資料【4】創(chuàng)作一首歌。 不過,只有111KB,不知道訓(xùn)練模型夠不夠。 同時(shí),我傍晚訓(xùn)練唐詩時(shí),因?yàn)橘I的服務(wù)器是1G1核的,根本難以訓(xùn)練,所以換了個(gè)4G的服務(wù)器。 //當(dāng)然,同樣是只有CPU安裝Torch
買了臺(tái)最便宜的云服務(wù)器,Ubuntu.?
將torch裝在/home/tom/torch/下;安裝過程可以查看官方文檔。
由于我是剛買的服務(wù)器,可能在安裝torch之前需要先執(zhí)行以下命令
apt-get update apt-get install curl apt-get install git apt-get install cmake安裝過程中,出現(xiàn)了如下錯(cuò)誤:
【錯(cuò)誤1】
remote: Compressing objects: 100% (4/4), done. error: RPC failed; result=56, HTTP code = 200 | 924.00 KiB/s fatal: The remote end hung up unexpectedly fatal: early EOF fatal: index-pack failed Clone of 'https://github.com/torch/cutorch.git' into submodule path 'extra/cutorch' failed解決方案為這個(gè)鏈接:
git clone https://github.com/torch/distro.git ~/torch --recursive --depth 1【錯(cuò)誤2】
Error: Build error: Failed compiling object readline.o解決方案為:
sudo apt-get install libreadline-dev安裝成功后輸入th得到下圖:
Char-rnn
Char-rnn是一個(gè)基于RNN的字符級(jí)的語句生成工具。
這里的安裝過程完全參照這個(gè)鏈接;作者是Andrej Karpathy,該作者同時(shí)寫了一個(gè)介紹RNN的博客,可以訪問這里查看。
按照上面安裝了torch之后,就需要安裝以下三個(gè)包。
$ luarocks install nngraph $ luarocks install optim $ luarocks install nn訓(xùn)練過程中
creating vocabulary mapping... putting data into tensor... saving data/chinesepoetry/vocab.t7 /home/tom/torch/install/bin/luajit: cannot open <data/chinesepoetry/vocab.t7> in mode w at /home/tom/torch/pkg/torch/lib/TH/THDiskFile.c:640 stack traceback:這是權(quán)限錯(cuò)誤。
//終于可以訓(xùn)練了 th train.lua -data_dir data/tinyshakespeare -rnn_size 112 -num_layers 2 -dropout 0.5結(jié)果
//201602091728 現(xiàn)在讓它去訓(xùn)練吧,結(jié)果再說。 //201602100011 因?yàn)?span id="ze8trgl8bvbq" class="hljs-number">1唐詩中大量生僻字使得文本過于復(fù)雜;2之前那個(gè)云服務(wù)器只有1G內(nèi)存。故重新訓(xùn)練。訓(xùn)練了好幾次,結(jié)果都是中文亂碼,,,這個(gè)有點(diǎn)煩。?
?
簡(jiǎn)單來說,解決方案為,將input.txt的編碼格式設(shè)置為下圖(Notepad++)?
UNIX UTF-8?
現(xiàn)在,終于成功了。?
然而,慘不忍睹。
參考資料
【1】torch?
http://torch.ch/docs/getting-started.html?
【2】char-rnn?
https://github.com/karpathy/char-rnn?
【3】讓神經(jīng)網(wǎng)絡(luò)做唐詩?
http://zhengwy.com/neural-network-for-tangshi/?
【4】汪峰老師作詞機(jī)?
https://github.com/phunterlau/wangfeng-rnn
總結(jié)
以上是生活随笔為你收集整理的RNN实践之唐诗创作的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小C语言--词法分析程序
- 下一篇: 2020年回顾