远程控制与Nvidia显卡驱动和CUDA版本
前段時間TeamViewer被檢測成商用了,于是電腦就不能跑程序了,后來導師派提前到校的準研一學妹幫我去解決這個問題,解決的方法就是重新更換了一個遠程控制軟件—向日葵。這兩款軟件用起來的體驗對比起來,TV相對來說畢竟是大公司,專業(yè)性是沒的說的,功能相對來說也很全面。但是主要有兩個缺點:
現(xiàn)在用向日葵,除了不能傳文件,感覺還不錯,操作雖然說不上流暢吧,但是起碼卡起來沒有TV卡的時候那么卡。總之就是卡了勉強基本操作還能進行。有一點就是,每次開關(guān)機之后,都必須重裝向日葵,否則你這邊連過去就出現(xiàn)閃退的現(xiàn)象,我也不知道為什么,得返校之后去看看。現(xiàn)在用anydesk傳數(shù)據(jù)集,好在數(shù)據(jù)集也不是特別大,雖然只有兩點幾個G的大小,傳了一晚上,但是時間上還能接受。好了,說了這么多,還是回到今天的主題上來,就是又幾乎重新安裝了深度學習的環(huán)境,我太難了!!!
這次主要就是和驅(qū)動在做斗爭,因為之前顯卡驅(qū)動是384,所以只能安裝cuda9.0,但是cuda9.0對很多新的pytorch版本并不支持,所以我一直想著換一個比較高版本的驅(qū)動,好讓我安裝比較高版本的cuda,最終安裝比較高版本的pytorch我的思路大致就是這樣的。首先在我把顯卡驅(qū)動換成了430,這個比較高的版本,挑最高的換的,然后重啟了電腦,我以為沒事了,就讓在那邊操作的學妹走了。然后cuda依然是9.0,pytorch1.1.0。我運行了原先在上面能跑通的一個yoloV3的檢測程序,然后就報錯,基本的意思就是我電腦上的cuda不可用,你只能用cpu版本的pytorch跑程序。于是我心想,估計是換了驅(qū)動,要換比較高版本的cuda吧,于是我沒有在意,就去調(diào)試我要跑的程序了。在自己的電腦上調(diào)試好程序之后打算放在那臺機子上運行。于是我就把原先的cuda9.0給卸載了,然后安裝了cuda10.1,因為我自己的電腦上就安裝的是10.1。因為我在上次配環(huán)境的那個表里面沒有430驅(qū)動對應(yīng)的cuda版本,于是我就心想cuda10.1在418上都可以用,那么我的430肯定沒有問題,于是我就欣然裝了cuda10.1,然后對應(yīng)的cudnn也裝了。主要就是裝cuda10.1的時候有點怪,那就是它沒有給我像其他博客中以及我前面幾次裝cuda時的那些選項,所以我就比較迷惑,當你點擊install之后,他就自動給你裝好了,應(yīng)該都是默認選項吧。于是我又安裝了pytorch1.3.0,然后我就高興的去運行程序。結(jié)果還是報錯:torch.cuda.is_available()==false,也就是cuda不可用。于是我心想是不是cuda10.1安裝的時候有問題啊,況且我對這個版本的cuda不是很熟(因為我的電腦上最近也是需要跑一個pytorch1.4.0的evaluate程序才安裝的cuda10.1),好像安裝過程和以前的cuda有點不同,于是我就想著裝回cuda10.0吧,不知道如何,裝完之后,運行程序(當然這里我也安裝了cuda10.0對應(yīng)的pytorch了的),發(fā)現(xiàn)還是false。我絕望了,這次是無助,因為上次起碼還可以自己搞定問題,但是這次我深知很有可能是顯卡驅(qū)動存在問題,不是自己一個人能搞定的。于是我在網(wǎng)上開始瘋狂搜索那個false的原因,最后看到了一個視頻,對問題的總結(jié)還是比較全面的:
https://www.bilibili.com/video/av75282498/
于是,我打算自己去網(wǎng)上下載機器對應(yīng)的顯卡驅(qū)動來進行安裝,但是驅(qū)動安裝步驟太復雜了,而且安裝完之后又需要重啟,重啟的話只能找學妹幫著開機了。接著往后看,我看到up主查看了驅(qū)動的版本:用的是nvidia-smi,正常情況下就應(yīng)該是像up主這樣:
但是在CUDA Version那里顯示的是N/A,上網(wǎng)搜一下N/A,就是Not Applicable意思就是不適用。
于是最后我決定,保險點,到時候還是換回384的顯卡驅(qū)動,乖乖用cuda9.0吧。于是我直接把驅(qū)動給換回來了,并把電腦重啟了,等待著學妹下午給我把遠程控制軟件打開。但是中途我不甘心,我首先在百度上搜N/A這個問題,搜到了一個,還是英文的提問,但是很遺憾沒有人理這個老哥:
于是我又去google上查詢相關(guān)的信息,找到了和我一樣問題的老哥:
但是這個就很不同了,他的問題是解決了,底下有人叫他安裝一個顯卡驅(qū)動之前,最好先卸載之前的驅(qū)動,不然殘余的驅(qū)動會影響到之后的驅(qū)動,用的指令是:
我打算破罐子破摔,到時候先把這個指令給用了,大不了最后用384嘛。用了之后,發(fā)現(xiàn)切換成了手動安裝的模式,之前的那些驅(qū)動不能選了,我又絕望了。我看了看手動裝驅(qū)動的那些復雜的過程,關(guān)鍵是要重啟,重啟之后要重現(xiàn)裝向日葵。很無奈,我都讓學妹去幫我看看有沒有其他電腦可以用了。就在這個時候,我看到了一個博客,根本就沒有那么復雜的過程,一句話裝好驅(qū)動。那就是這個博客:
https://blog.csdn.net/linhai1028/article/details/79445722
直接采用:sudo apt-get install nvidia-384
于是我先嘗試安裝一下384,成了,但是沒有顯示CUDA version。于是我又不甘心,安裝了410,成功了。(當然這導致機器又重啟了一次,每換一張顯卡機器就要重啟)CUDA version那里顯示的是10.0,運行發(fā)現(xiàn)torch.cuda.is_available()也變成true了。
現(xiàn)在回想起來,當初就不應(yīng)該安裝一個表格上沒有的430驅(qū)動的,然后就是這個原因?qū)е掳惭b的cuda版本不匹配。以后換驅(qū)動就換常見的,然后照著表格上的來,一一對應(yīng)配cuda,那么就沒有問題了。
總結(jié)
以上是生活随笔為你收集整理的远程控制与Nvidia显卡驱动和CUDA版本的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java类的继承学生研究生类图_UML
- 下一篇: 【docker系列】docker深入浅出