當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

三十七、数据泛化（面向属性的归纳）

發布時間：2024/9/16 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了三十七、数据泛化（面向属性的归纳）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

從概念上講，數據立方體可以看做一種多維數據泛化。數據泛化通過把相對低層的值（例如，屬性年齡的數值）用較高層概念（例如，青年、中年和老年）替換來匯總數據。

2.1 面向屬性的歸納的基本步驟

數據聚焦，獲得初始數據關系

進行面向屬性的歸納

基本操作是數據泛化，對有大量不同的屬性，進行一下操作：

2.2 數據聚焦

目的是獲得跟任務相關的數據集，包括屬性或維，在DMQL中它們由in relevance to子句表示。
獲取Big-University數據庫中研究生的數據
use Big_University_DBselect name,gender,major,birth_place,birth_datefrom studentTo Science in “graduate”where status in “graduate”
用戶可能引進太多的屬性

2.3 數據泛化

2.4 屬性概化控制

3.1 基本步驟

4.1 類比較的面向屬性歸納的過程
在許多應用中，用戶可能對單個類的概念或特征不感興趣，而是希望挖掘一種描述，它將一個類與其他課比較的類相區分

4.2 挖掘類比較

假設我們想比較Big_University的研究生和本科生的一般性質，給定了屬性name,gender,major,
birth_place,birth_date,residence,phone#和gpa。

首先將該查詢轉換成兩個關系查詢，收集兩個任務相關的集合：一個是初始目標類工作關系，另一個是初始對比類工作關系。

合：一個是初始目標類工作關系，另一個是初始對比類工作關系。

以上是生活随笔為你收集整理的三十七、数据泛化（面向属性的归纳）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。