机器学习学习笔记 --- 标称型数据和数值型数据
【標(biāo)稱型數(shù)據(jù)和數(shù)值型數(shù)據(jù)】
監(jiān)督學(xué)習(xí)一般使用兩種類型的目標(biāo)變量:標(biāo)稱型和數(shù)值型
標(biāo)稱型:一般在有限的數(shù)據(jù)中取,而且只存在‘是’和‘否’兩種不同的結(jié)果(一般用于分類)
數(shù)值型:可以在無(wú)限的數(shù)據(jù)中取,而且數(shù)值比較具體化,例如4.02,6.23這種值(一般用于回歸分析)
監(jiān)督學(xué)習(xí)中的分類方法輸出是標(biāo)稱型數(shù)據(jù)。
監(jiān)督學(xué)習(xí)中的回歸方法輸出是數(shù)值型數(shù)據(jù)。
?
【標(biāo)稱屬性和數(shù)值屬性】
屬性,表示數(shù)據(jù)對(duì)象的一個(gè)特征。
標(biāo)稱屬性(nominal attribute)意味著‘與名稱相關(guān)’,它的值是一些符號(hào)或事物的名稱。每個(gè)值代表某種類別,編碼或狀態(tài),因此標(biāo)稱屬性又被看作是分類的(categorical)。這些值不必具有有意義的序。在計(jì)算機(jī)科學(xué)中,這些值也被看做是枚舉的(enumeration)。在標(biāo)稱屬性上,數(shù)學(xué)運(yùn)算是沒有意義的。
二元屬性(binary attribute)是一種標(biāo)稱屬性,只有0,1兩種狀態(tài)。通常0表示不出現(xiàn),1表示出現(xiàn)。
序數(shù)屬性(ordinal attribute),其可能只具有有意義的序或評(píng)定(ranking),但是相繼值之間的差是未知的,具有先后順序。序數(shù)屬性可以通過把數(shù)值量的值域劃分成有限個(gè)有序類別,把數(shù)值屬性離散化而得到。序數(shù)屬性的中心趨勢(shì)可以用它的眾數(shù)和中位數(shù)(有序序列的中間值)表示,但不能定義均值。
以上屬性都是定性的。即它們描述對(duì)象的特征,而不給出實(shí)際大小或數(shù)量。
數(shù)值屬性(numeric attribute)是定量的,即它是可度量的量。數(shù)值屬性可以是區(qū)間標(biāo)度的或比率標(biāo)度的。
區(qū)間標(biāo)度屬性(interval-scaled attribute)用相等的單位尺度度量。區(qū)間屬性的值。
比率標(biāo)度(ratiao-scaled)屬性具有固定零點(diǎn)的數(shù)值屬性。可以進(jìn)行數(shù)值運(yùn)算。
總結(jié)
以上是生活随笔為你收集整理的机器学习学习笔记 --- 标称型数据和数值型数据的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MagicLicense破解记录
- 下一篇: 无线衰落信道的分类方式和选择性衰落条件