数据仓库与数据挖掘 阶段考试复习题
文章目錄
- 第一章 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述
- 第二章 數(shù)據(jù)倉庫概述
- 第三章 聯(lián)機分析處理(OLAP)
- 第四章 數(shù)據(jù)挖掘的基本概念
- 第五章 數(shù)據(jù)預(yù)處理
- 第六章 概念描述:特征化和比較
- 習(xí)題答案
第一章 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述
無習(xí)題
第二章 數(shù)據(jù)倉庫概述
一. 判斷題
二.單選題
在以下人員中,被譽為“數(shù)據(jù)倉庫之父”的是:( ) (知識點:數(shù)據(jù)倉庫的基本概念; 易)
A. H.Inmon B. E.F.Codd C. Simon D. Pawlak
以下關(guān)于數(shù)據(jù)倉庫的說法正確的是:( ) (知識點:數(shù)據(jù)倉庫的基本概念; 難)
A. 數(shù)據(jù)倉庫中的數(shù)據(jù)只能來源于組織內(nèi)部的操作型數(shù)據(jù)庫
B. 數(shù)據(jù)倉庫是為應(yīng)對事務(wù)型數(shù)據(jù)處理的需要而產(chǎn)生的
C. 數(shù)據(jù)倉庫是面向主題的,這是其區(qū)別于操作型數(shù)據(jù)庫的關(guān)鍵特征
D. 數(shù)據(jù)倉庫必須是面向企業(yè)全局的,不能以部門為單位建立數(shù)據(jù)倉庫
以下哪項不是“信息包圖”中的元素? ( ) (知識點:數(shù)據(jù)倉庫的三級模型; 難)
A. 維度 B. 維的概念層次及相應(yīng)層次上的數(shù)量
C. 度量 D. 方體的格
以下哪項不屬于數(shù)據(jù)倉庫的邏輯模型? ( ) (知識點:數(shù)據(jù)倉庫的三級模型; 中)
A. 星型模型 B. 雪花模型
C. 度量模型 D. 事實星座模型
在數(shù)據(jù)倉庫的設(shè)計過程中,下列描述正確的是( ) (知識點:數(shù)據(jù)倉庫的設(shè)計; 難)
A. 數(shù)據(jù)倉庫是“數(shù)據(jù)驅(qū)動+需求驅(qū)動”雙驅(qū)動,但必須以需求驅(qū)動為中心
B. 數(shù)據(jù)倉庫主要面向分析型處理環(huán)境,在設(shè)計時很難完全明確用戶的需求
C. 數(shù)據(jù)倉庫與數(shù)據(jù)庫一樣,其數(shù)據(jù)主要來自于企業(yè)的業(yè)務(wù)流程
D. 數(shù)據(jù)倉庫的設(shè)計目標是要提高事務(wù)處理的性能
下面哪項關(guān)于星型模型的說法是不正確的:( ) (知識點:數(shù)據(jù)倉庫的三級模型; 難)
A. 有一個事實表,且事實表中的屬性由指向各個維表的外鍵和一些相應(yīng)的度量數(shù)據(jù)組成
B. 有一組小的附屬表,稱為維表,且每維一個維表
C. 事實表的每個字段都是事實度量字段
D. 由于每維只能建立一個維表,使得維表中有些信息會產(chǎn)生冗余
在數(shù)據(jù)倉庫的概念模型中,通過( )來實現(xiàn)數(shù)據(jù)從客觀世界到主觀認識的映射。 (知識點:數(shù)據(jù)倉庫的三級模型; 易)
A. E-R模型 B. 信息包圖
C. 星型模型 D. 雪花模型
四.填空題
第三章 聯(lián)機分析處理(OLAP)
一.判斷題
二.單選題
OLAP技術(shù)的核心是:( ) (知識點:OLAP的基本概念;中)
A. 在線性 B對用戶的快速響應(yīng)
C. 互操作性 D. 多維分析
關(guān)于OLAP和OLTP的區(qū)別描述,不正確的是:( ) (知識點:OLAP的基本概念;難)
A. OLAP主要面向企業(yè)的高層管理人員,用以輔助決策;而OLTP主要面向企業(yè)的基層管理人員,用以輔助日常業(yè)務(wù)
B. 與OLAP技術(shù)不同,OLTP需要處理大量相對簡單的任務(wù)
C. OLAP的特點在于一次性處理的事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高 D. OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的,但其最終數(shù)據(jù)來源與OLTP一樣,大都來自底層的數(shù)據(jù)庫系統(tǒng)
三、填空題
四、多選題
A. 切片 B 切塊 C 鉆取 D 旋轉(zhuǎn)
第四章 數(shù)據(jù)挖掘的基本概念
一. 單選題
A. 關(guān)聯(lián)規(guī)則發(fā)現(xiàn) B. 聚類
C. 分類 D. 孤立點檢測
A. 關(guān)聯(lián)規(guī)則發(fā)現(xiàn) B. 聚類
C. 分類 D. 孤立點檢測
A. 關(guān)聯(lián)分析 B. 分類預(yù)測
C. 概念描述 D. 聚類分析
二. 判斷題
第五章 數(shù)據(jù)預(yù)處理
一. 單選題
對于區(qū)間 [240,460],按照自然劃分的3-4-5規(guī)則,可以劃分為: ( ) (知識點:數(shù)據(jù)預(yù)處理; 中)
A. [200,300), [300,400), [400,500]
B. [300,350), [350,400), [400,450), [450,500]
C. [200,250), [250,300), [300,350), [350,400]
D. [200,300), [300,400]
已知一組價格數(shù)據(jù):15,21,24,21,25,4,8,34,28,按照等寬(寬度為10)分箱方法對其進行平滑,可以劃分為幾個箱子? ( ) (知識點:數(shù)據(jù)預(yù)處理; 易)
A. 3 B. 4 C. 5 D. 6
假定屬性income的平均值與標準差分別為$54000和$16000,使用z-score規(guī)范化,則屬性值$73600將變換為:( ) (知識點:數(shù)據(jù)預(yù)處理; 中)
A. 0.736 B. 0.716 C. 1.225 D. 1
在數(shù)據(jù)歸約的如下描述中,錯誤的是:( ) (知識點:數(shù)據(jù)預(yù)處理; 難)
A. 數(shù)據(jù)歸約技術(shù)可以用來得到數(shù)據(jù)集的歸約表示,它小得多,但仍接近保持原數(shù)據(jù)的完整性
B. 對歸約后的數(shù)據(jù)集進行挖掘可提高挖掘的效率,并產(chǎn)生相同(或幾乎相同)的結(jié)果
C. 用于數(shù)據(jù)歸約的時間可以超過或“抵消”在歸約后的數(shù)據(jù)集上挖掘節(jié)省的時間
D. 維歸約可以檢測并刪除不相關(guān)、弱相關(guān)或冗余的屬性維。
將原始數(shù)據(jù)進行集成、變換、維度歸約、數(shù)值歸約是在以下哪個步驟進行的?( ) (知識點:數(shù)據(jù)預(yù)處理; 中)
A. 頻繁模式挖掘 B. 分類和預(yù)測
C. 數(shù)據(jù)預(yù)處理 D. 數(shù)據(jù)流挖掘
二. 多選題
A. 忽略元組 B. 使用一個全局變量填充空缺值
C. 使用屬性的平均值填充空缺值 D. 使用最可能的值進行填充
E.使用與給定元組屬同一類的所有樣本的平均值
A. 最大最小規(guī)范化 B. 小數(shù)定標規(guī)范化
C. 3-4-5規(guī)則 D. Z-score規(guī)范化
A. 逐步向前選擇 B. 逐步向后刪除
C. 向前選擇和向后刪除相結(jié)合 D. 判定樹歸納
三. 填空題
第六章 概念描述:特征化和比較
一. 單選題
以下操作中不屬于數(shù)據(jù)概化操作是:( ) (知識點:概念描述;中)
A. 將n維數(shù)據(jù)立方體聚集為n-1維數(shù)據(jù)立方體
B. 利用OLAP進行數(shù)據(jù)的上卷操作
C. 考察任務(wù)相關(guān)數(shù)據(jù)中每個屬性的不同取值的個數(shù),對數(shù)據(jù)進行概化操作
D. 利用最大最小規(guī)范化方法,將數(shù)據(jù)按比例縮放到一個小的特定區(qū)間
什么是AOI:( ) (知識點:概念描述;易)
A. 面向?qū)傩詺w納 B. 屬性相關(guān)分析
C. 數(shù)據(jù)庫中的知識發(fā)現(xiàn) D. 屬性子集選擇
以下關(guān)于面向?qū)傩詺w納的描述中,正確的是:( ) (知識點:概念描述;難)
A. 屬性概化閾值是用來控制數(shù)據(jù)集中屬性個數(shù)的參數(shù)
B. 在面向?qū)傩詺w納過程中,絕對不能生成相同的行
C. 概化關(guān)系閾值是用來控制廣義元組個數(shù)的參數(shù)
D. 面向?qū)傩詺w納是根據(jù)屬性與決策任務(wù)間的相關(guān)性來選擇屬性的方法
什么是DW:( ) (知識點:數(shù)據(jù)倉庫的基本概念;易)
A. 領(lǐng)域知識發(fā)現(xiàn) B. 機器學(xué)習(xí)
C.數(shù)據(jù)挖掘 D. 數(shù)據(jù)倉庫
對某商場2016年的銷售數(shù)據(jù)執(zhí)行面向?qū)傩詺w納操作后,得到如下數(shù)據(jù)表。設(shè)目標集合為“電冰箱”,則在數(shù)據(jù)表基礎(chǔ)上可得到如下定量描述規(guī)則:
?X,item(X)= “電冰箱” ?\Rightarrow?(location(X)=“東北”)[t1:( )]∨(location(X)=“華北”)[t2:( )]
其中,t1和t2分別為定量描述規(guī)則的t權(quán),則, t1、 t2的值為:( )。 (知識點:概念描述;難)
A. 0.43 0.57; B. 0.5 0.5;
C. 0.33 0.67; D. 0.4 0.6;
二. 多選題
A. 均值 B. 中位數(shù)
C. 眾數(shù) D. 四分位數(shù)
E. 方差
三. 填空題
設(shè)目標集合為“電視”,則在數(shù)據(jù)表基礎(chǔ)上可得到如下定量描述規(guī)則:
?X,item(X)= “TV” ?\Rightarrow?(location(X)=“Asia”)[t1:( )]∨(location(X)=“Europe”)[t2:( )]
其中,t1和t2分別為定量描述規(guī)則的t權(quán),則:t1=( ), t2=( )。
(知識點:概念描述;中)
習(xí)題答案
【第二章】
1.(對; 知識點:數(shù)據(jù)倉庫的基本概念; 易)
2.(對; 知識點:數(shù)據(jù)倉庫的基本概念;易)
3.(對; 知識點:數(shù)據(jù)倉庫的基本概念;易)
4.(錯; 知識點:數(shù)據(jù)倉庫的基本概念; 中)
5.(對; 知識點:數(shù)據(jù)倉庫的基本概念; 中)
6.(對; 知識點:數(shù)據(jù)倉庫的基本概念; 難)
7.(錯; 知識點:數(shù)據(jù)立方體; 易)
8.(對; 知識點:數(shù)據(jù)立方體;中)
9.(錯; 知識點:數(shù)據(jù)立方體; 難)
10.(對; 知識點:數(shù)據(jù)倉庫的三級模型; 中)
11.(錯; 知識點:數(shù)據(jù)倉庫的三級模型; 難)
12.(錯; 知識點:數(shù)據(jù)倉庫的基本概念; 中)
A C D C B C B
1.主題、集成的、反映歷史變化(知識點:數(shù)據(jù)倉庫的基本概念; 易)
2.邏輯模型(知識點:數(shù)據(jù)倉庫的三級模型; 易)
3.星型、事實星座、事實星座(知識點:數(shù)據(jù)倉庫的三級模型; 中)
4.分析型數(shù)據(jù)處理、分析型數(shù)據(jù)處理(知識點:數(shù)據(jù)倉庫的基本概念; 中)
5. CLDS(知識點:數(shù)據(jù)倉庫的設(shè)計; 中)
【第三章】
1.(錯;知識點:OLAP的基本概念;易)
2.(對;知識點:OLAP的基本概念;易)
3.(對;知識點:OLAP的基本概念;難)
4.(錯;知識點:OLAP的基本概念;中)
D C
1.常見的OLAP的分析方法包括:( 切片)、切塊、鉆取和( 旋轉(zhuǎn) )。(知識點:OLAP的基本概念;中)
2.OLAP的數(shù)據(jù)組織方式有如下幾種:ROLAP、 ( MOLAP )和 ( HOLAP )。 (知識點:OLAP的基本概念;中)
ABCD
【第四章】
A B B
1.(對; 知識點:數(shù)據(jù)挖掘的基本概念; 中)
2.(錯; 知識點:數(shù)據(jù)挖掘的基本概念; 易)
【第五章】
A A C C C
ABCDE ABD ABCD
1.商務(wù)智能的三大支撐技術(shù)有:( 數(shù)據(jù)倉庫 )、( OLAP)和 數(shù)據(jù)挖掘。 (知識點:商務(wù)智能的基本概念;易)
2.常見的數(shù)據(jù)規(guī)范化的方法有:( 最小最大規(guī)范化 )、零均值規(guī)范化,和( 小數(shù)定標規(guī)范化 )。 (知識點:數(shù)據(jù)預(yù)處理;中)
【第六章】
D A C D C ABC
0.4 0.6
總結(jié)
以上是生活随笔為你收集整理的数据仓库与数据挖掘 阶段考试复习题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据仓库与数据挖掘归纳汇总
- 下一篇: 数据仓库与数据挖掘相关基础概念