检查文件上传完成_“我的数据上传NCBI又报错了...” “攻略拿去!”
在上一期的內容中,我們分享了NCBI測序數據上傳的主要步驟和資料填寫的注意事項。今天跟大家分享最后一步:原始測序數據的上傳以及上傳后項目編號的相關類型和含義。
圖1 NCBI測序數據上傳步驟| 原始測序數據上傳
完成樣本屬性和樣本測序建庫相關信息的填寫后,下一步(第7步)即為測序數據上傳。當然,如果測序數據量比較大,也可以在申請賬號后就開始數據預上傳,然后在第7步選擇對應文檔就可以。預上傳和第7步的上傳方法一樣(圖2、圖3)。
預上傳界面:登錄后→ my submissions→ Options to preload data。
圖2 預上傳界面圖3 第7步上傳界面Aspera和FTP都是遠程傳遞大數據量的軟件。通過軟件將本地地址與遠程地址相連,進行文件的高速傳輸。
我們以Aspera瀏覽器、Aspera命令行、FTP 3種形式為例介紹三種上傳方法,Aspera命令行看起來是代碼形式,比較復雜,但其實命令很簡單,上傳非常快而且穩定,大文件推薦使用Aspera命令行模式。
| 軟件安裝
1. Aspera軟件安裝
下載地址:https://downloads.asperasoft.com/connect2/Tips:選擇“典型安裝”模式,避免無法自動彈窗顯示。
2. FTP安裝
下載地址:https://filezilla-project.org/download.php?type=client方法一 Aspera瀏覽器
安裝成功后,進入 “步驟7”,出現彈框,詢問是否啟用IBM Aspera,選擇“打開”(圖4);
選擇第一項,點擊“選擇文件”,彈框后,選擇“允許”,選擇對應文檔,即進入上傳界面(圖5)。
圖4 啟用Aspera圖5 Aspera瀏覽器上傳Tips:如果將不同樣本的序列文件壓縮成一個文檔,選擇continue會出現warning(圖6),提示找不到第6步meta data表格中的文檔名,再次點擊continue,NCBI會自動解壓并核對文檔。
圖6 如有多個序列文件壓縮,會提示warning界面Tips:此步上傳的序列文檔名需要與metadata表格填寫的filename完全一致,且文檔數量也要一致。
方法二 Aspera命令行模式
在預上傳界面打開命令行的上傳說明,或者在第7步勾選命令行選項。
1. 下載aspera.openssh,記錄NCBI數據接收地址,即上傳者專屬路徑(圖7)。
圖7 賬戶對應的專屬路徑和密鑰界面2. 查找記錄aspera.openssh和ascp.exe兩個文檔的存儲路徑,添加兩個“環境變量”:ASPERA_SCP_PASS 和Path(圖8)。
圖8 添加環境變量操作如下:
我的電腦 → 鼠標右鍵→ 屬性 → 高級系統設置 →環境變量 → 新建 →“變量”輸入“ASPERA_SCP_PASS”,“值”輸入“路徑/aspera.openssh”; 新建 →“變量”輸入“Path”,“值”輸入“路徑/ascp.exe” → 確定。
3. 進入命令行模式:
Windows + R → 輸入cmd → 確定 → 打開命令提示符
4. 輸入命令:
(1)命令構成(各成分以空格相連):①"路徑ascp.exe" ②-i "路徑aspera.openssh" ③上傳參數 ④"數據存放路徑"⑤NCBI接收地址
(2)命令示例:①"C:UsersAdministratorAppDataLocalProgramsAsperaAsperaConnectbinascp.exe"
②-i "D:aspera.openssh"
③-QT -l100m -k1 -d
④"D:raw data" ⑤subasp@upload.ncbi.nlm.nih.gov:uploads/fish5691@qq.com_JexlxJIL
Tips:-l100m,表示設定的最大上傳速度。
Tips:-d表示打開本地路徑,建議先將所有待上傳的測序數據放在一個文件夾內,再輸入命令行,即可上傳該文件夾內所有文檔。如圖9,輸入命令后回車,界面會顯示讀取的文檔列表、上傳進度、文件大小、速度和耗時。完成后會給出Completed說明。
圖9 Asper命令行上傳界面(當前速度每秒約9.4M)5. 上傳完成后,回到NCBI界面,點擊刷新,選擇文檔。
Tips:一般上傳完成后,需要等待大約10min,NCBI網頁才會同步上傳完成。
方法三 FTP上傳
在預上傳界面打開FTP的上傳說明,或者在第7步勾選FTP選項。
1. 按圖10,記錄紅框中的相關信息。
圖10 FTP上傳提示2. 打開軟件,本地站點打開對應文件夾(圖11)。
圖11 FTP上傳文檔選擇3. 建立連接(圖12),輸入對應主機(Address),用戶名(Username),密碼(Password)。
圖12 與NCBI建立連接4. 輸入遠程站點分配的目錄位置,enter鍵進入上傳目錄(圖13)。
圖13 遠程連接5. 在左邊的“本地站點”找到要上傳的文件夾,點擊鼠標右鍵,點“上傳”,頁面下邊則會有文件在上傳的隊列中。上傳完成后,回到NCBI界面刷新。
|Overview 總覽
上傳完成后可檢查所有信息,確認無誤后提交。
跳轉至my submission,顯示已提交,等待處理。大約10分鐘后,Bioproject和Biosample一般會先處理完成,然后SRA待處理(圖14)。1-2天后,SRA處理完成,即可獲得樣本和項目的SRA編號。
圖14 上傳進程查看由于整個過程涉及到的編號非常多,所以我們進行了對比匯總,其中紅色編號表示可以用在文章中作為檢索測序數據的編號(圖15)。
圖15 NCBI上傳編號說明以上就是原始測序數據上傳至NCBI的SRA數據庫的所有操作指南,希望能幫助大家在數據上傳時少走一些坑,讓數據上傳之路暢通無阻~
想了解更多實用科研工具、詳實生信軟件教程、前沿創新組學文章解讀、獨家生信視頻教程,快關~注基迪奧生物官方公眾號。
總結
以上是生活随笔為你收集整理的检查文件上传完成_“我的数据上传NCBI又报错了...” “攻略拿去!”的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Symbian和C++ SDK开发入门之
- 下一篇: 旧调重弹-SetUnhandledExc