【渝粤教育】广东开放大学 数据采集技术 形成性考核 (29)
選擇題
題目:GET和POST的區別,以下說法不正確的有()。
題目:以下屬于HTTP協議的主要特點的是()。
題目:增量式爬蟲中的()指的是:爬蟲以相同的頻率訪問所有網頁,不考慮網頁的改變頻率。
題目:以下哪個屬于深層網頁()
題目:由HTTP客戶端發起一個請求,建立一個到服務器指定端口的TCP連接,這個端口默認是()端口。
題目:一次HTTP由()組成。
題目:以下哪個HTTP響應狀態表示服務器端錯誤()
題目:網絡爬蟲實際上是一種"自動化瀏覽網絡”的程序,或者說是一種網絡機器人,被廣泛用于互聯網搜索引擎或其他類似網站,以獲取或更新這些網站的內容和檢索方式。
題目:POST提交的數據大小有限制,最多只能有1024字節。
題目:網絡爬蟲不需要遵守任何限制。
題目:網絡爬蟲順著網頁及其超鏈接組成的網爬行,每到一個網頁就用抓取程序將這個網頁抓下來,將內容抽取出來,同時抽取超鏈接,作為進一步爬行的線索。
題目:HTTP協議是無狀態協議。
題目:HTTP的請求頭域可能包含Accept、Accept-Charset、Accept-Encoding、Accept-Language等字段。
題目:網絡爬蟲被廣泛用于互聯網搜索引擎或其他類似網站,以獲取或更新這些網站的內容和檢索方式 。
題目:通用網絡爬蟲對于爬行速度和存儲空間要求較低。
題目:Deep Web 爬蟲爬行過程中最重要部分就是鏈接提取。
題目:數據的預處理ETL的L表示()。
題目:正則表達式的規則中,()表示匹配所有非空白字符。
題目:正則表達式中,()匹配除了換行符之外的任意字符。
題目:以下關于正則表達式的說法,不正確的是()
題目:正則表達式中\w表示任意數字字符。
題目:正則表達式的量詞?表示0次或1次。
題目:爬蟲工具只能用Java語言編寫。
題目:增量式網絡爬蟲只會在需要的時候爬行新產生或發生更新的頁面。
題目:正則表達式中的\w表示任意單詞字符。
題目:HTTP請求的()方法是在Request-URI所標識的資源后附加新的數據。
題目:網絡數據采集是指通過()或網站公開API等方式從網站上獲取數據信息。。
題目:以下關于正則表達式中常用正則規則的說法,不正確的有()
題目:GET 請求獲取Request-URI所標識的資源 。
題目:HTTP請求的GET方法 請求獲取由Request-URI所標識的資源的響應消息報頭。
題目:深度優先策略比較適合垂直搜索或站內搜索, 但爬行頁面內容層次較深的站點時會造成資源的巨大浪費。
題目:廣度優先策略能夠有效控制頁面的爬行深度。
題目:HTTP的響應包括Content-Encoding、Content-Length、Content-Type等。
答案:
A、對
總結
以上是生活随笔為你收集整理的【渝粤教育】广东开放大学 数据采集技术 形成性考核 (29)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【渝粤教育】广东开放大学 商法 形成性考
- 下一篇: linux查找文件的命令grep(lin