线性回归csv数据集_测试数据科学家线性回归的30个问题
你的目標是數據科學家嗎?那你對線性回歸了解有多深入呢,下面的30道題,可以幫助你或者測試別人是否真的達到的數據科學家的水平,關注回復,答案在評論區:
1)是非題:線性回歸是一種受監督的機器學習算法。
A)是
B)虛假
2)是非題:線性回歸主要用于回歸。
A)是
B)虛假
3)是非題:可以使用神經網絡設計線性回歸算法嗎?
A)是
B)虛假
4)我們使用以下哪種方法在線性回歸中找到最適合數據的線?
A)最小二乘誤差
B)最大似然率
C)對數損失
D)A和B
5)在對連續輸出變量建模時,可以使用以下哪個評估指標來評估模型?
A)AUC-ROC
B)精度
C)對數損失
D)均方誤差
6)是非題:套索正則化可用于線性回歸中的變量選擇。
A)是
B)虛假
7)關于殘差的以下哪項是正確的?
A)越低越好
B)越高越好
C)A或B取決于情況
D)這些都不是
8)假設我們有N個自變量(X1,X2 ... Xn),因變量為Y。現在,想象一下,您正在通過使用最小二乘方誤差對該數據擬合最佳擬合線來應用線性回歸。
您發現其中一個變量(說X1)的Y的相關系數為-0.95。
以下哪個對X1是正確的?
A)X1和Y之間的關系是弱的
B)X1和Y
之間的關系是強的C)X1和Y之間的關系是中性的
D)相關性無法判斷該關系
9)從以上兩個特征來看,對于V1和V2之間的皮爾遜相關性,以下哪個選項是正確的?
如果給出兩個變量V1和V2,它們將遵循以下兩個特征。
1.如果V1增加,則V2也增加
2.如果V1減小,則V2行為未知
A)皮爾遜相關性將接近1
B)皮爾遜相關性將接近-1
C)皮爾遜相關性將接近0
D)這些都不是
10)假設V1和V2之間的皮爾遜相關性為零。在這種情況下,得出V1和V2之間沒有任何關系的結論是正確的嗎?
A)是
B)虛假
11)我們在線性回歸的最小二乘擬合中使用以下哪個偏移量?假設水平軸是自變量,垂直軸是因變量。
A)垂直偏移
B)垂直偏移
C)兩者,視情況而定
D)以上都不是
12)是非題:當您需要訓練大量數據時,過度擬合的可能性更高?
A)是
B)虛假
13)我們還可以借助稱為“正態方程”的分析方法來計算線性回歸系數。關于正規方程,以下哪項是正確的?
A)1和2
B)1和3
C)2和3
D)1,2和3
14)關于A和B的殘差之和,以下哪一項是正確的?
下圖顯示了隨機生成的數據上的兩條擬合的回歸線(A和B)。現在,我想找到情況A和情況B的殘差之和。
注意:
A)A的殘差總和比B高
B)A的殘差總和比B低
C)兩者的殘差總和相同
D)這些都不是
15)選擇以最佳方式描述偏差的選項。
A)如果x很大;偏差低
B)如果x很大;偏見很高
C)我們不能說偏見
D)這些都不是
16)當您施加非常大的罰款時會發生什么?A)一些系數將變為絕對零
B)一些系數將接近零但不是絕對零
C)A和B都取決于情況
D)這些都不是
17)如果對套索應用非常大的罰款會發生什么?
A)一些系數將變為零
B)一些系數將接近零但不是絕對零
C)A和B都取決于情況
D)這些都不是
18)關于線性回歸中的離群值,以下哪個說法是正確的?A)線性回歸對異常值敏感
B)線性回歸對異常值不敏感
C)不能說
D)這些都不是
19)假設您在線性回歸中的殘差和預測值之間繪制了散點圖,并且發現它們之間存在關聯。您對這種情況做出以下哪個結論?A)由于存在關系意味著我們的模型不好
B)由于存在關系意味著我們的模型很好
C)不能說
D)這些都不是
20)在線性回歸中擬合4級多項式時會發生什么?
A)高度為4的多項式將非常適合數據
B)高度為4的多項式將
不太適合數據C)不能說
D)這些都不是
21)在線性回歸中擬合2度多項式時會發生什么?
A)2階多項式過擬合數據的
可能性很高B)2階多項式過擬合數據的可能性很高
C)不能說
D)這些都不是
22)在偏見和差異方面。當您擬合2級多項式時,以下哪項是正確的?
A)偏差會很高,方差會很高
B)偏差會很低,方差會很高
C)偏差會很高,方差會很低
D)偏差會很低,方差會很低
23)假設l1,l2和l3分別是A,B,C的三個學習率。關于l1,l2和l3,以下哪一項是正確的?
A)l2 B)l1> l2> l3
C)l1 = l2 = l3
D)這些都不是
24)現在我們逐漸增加訓練集的大小。隨著訓練集大小的增加,您期望平均訓練誤差發生什么?
A)增加
B)減少
C)保持不變
D)不能說
25)隨著訓練數據量的增加,您期望偏差和方差會發生什么?
A)偏差增加且方差增加
B)偏差減小且方差增加
C)偏差減小且方差減小
D)偏差增加且方差減小
E)不能說錯
26)如果運行形式為(Y = A0 + A1X)的線性回歸模型,此數據的均方根訓練誤差是多少?
A)小于0
B)大于零
C)等于0
D)這些都不是
27)以下哪種情況會為您提供正確的超級參數?
A)1
B)2
C)3
D)4
28)假設您從上一個問題中獲得了已調整的超級參數。現在,假設您要在變量空間中添加變量,以使此添加功能很重要。在這種情況下,您會觀察以下哪件事?
A)訓練錯誤將減少而驗證錯誤將增加
B)訓練錯誤將增加并且驗證錯誤將增加
C)訓練錯誤將增加并且驗證錯誤將減少
D)訓練錯誤將減少并且驗證錯誤將減少
E)以上都不是
問題上下文29-30:
假設您發現線性回歸模型擬合數據不足。
29)在這種情況下,您會考慮以下哪些選擇?
A)1和2
B)2和3
C)1和3
D)1、2和3
30)現在情況與上一個問題(擬合中)相同。您希望使用以下哪個正則化算法?
A)L1
B)L2
C)任何
D)這些都不是
總結
以上是生活随笔為你收集整理的线性回归csv数据集_测试数据科学家线性回归的30个问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 抚州治疗卵巢功能减退最好的医院推荐
- 下一篇: python 数据分析库_五个 Pyth