當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

Nhanes临床数据库挖掘教程1----数据库下载

發布時間：2023/12/16 数据库 187 豆豆

生活随笔收集整理的這篇文章主要介紹了 Nhanes临床数据库挖掘教程1----数据库下载小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

美國國家健康與營養調查（ NHANES, National Health and Nutrition Examination Survey）是一項基于人群的橫斷面調查，旨在收集有關美國家庭人口健康和營養的信息。
地址為：https://wwwn.cdc.gov/nchs/nhanes/Default.aspx

數據庫有5個信息欄：DEMO：人口統計學DIET: 飲食EXAM: 檢查 LAB: 實驗室指標Q: 問卷調查

我以論文Zhang RH, Zhou JB, Cai YH, Shu LP, Simó R, Lecube A. Non-linear association between diabetes mellitus and pulmonary function: a population-based study. Respir Res. 2020 Nov 4;21(1):292.為參照（糖尿病與肺功能之間的非線性關聯：一項基于人群的研究）為參照，

對數據進行下載，作者取的是2007-2012年的數據，我這里取的是2007-2008的數據。下載nhanes數據庫有兩種方法，1是直接從頁面下載，2是通過R包nhanesA下載。頁面下載為：
點擊：Questionnaires, Datasets, and Related Documentation，再點擊2007-2018

然后從右邊選擇需要的數據

根據文章Non-linear association between diabetes mellitus and pulmonary function: a population-based study. Respir Res. 2020 Nov 4;21(1):292.的基線資料表列出的數據

需要找到年齡、性別、種族、體重指數、血糖、FVC等相關指標，這是一個花時間的過程，需要慢慢找，先把人口統計數據下載下來看看，使用haven包的函數把數據打開

library(haven) library(nhanesA) library(tidyverse) mydata <- read_xpt("e:/nhanes/DEMO_E.XPT")

使用R包下載也是一樣的，要記住數據的標識

mydata1<- nhanes(‘DEMO_E’)

對照變量說明提取需要的變量

我做演示，隨便抽取一些

dat1 <- mydata %>% select(SEQN, # 序列號RIAGENDR, # 性別RIDAGEYR, # 年齡RIDRETH3, # 種族DMDMARTL, # 婚姻狀況WTINT2YR,WTMEC2YR, # 權重SDMVPSU, # psuSDMVSTRA) # strata

還需要關鍵的血糖和肺功能的指標，血糖應該在化驗室指標那里，這次我們使用nhanesA包來下載
先查看血糖文檔編號：GLU_E

xuetang <- nhanes('GLU_E')

數據小的話還是很快的

對數據進行提取，序列號都要提取，等下對數據進行合并用的

xuetang1 <- xuetang %>% select(SEQN, # 序列號LBDGLUSI, #血糖mmol表示LBDINSI, #胰島素( pmmol/L)PHAFSTHR #餐后血糖)

同理依次取糖化血紅蛋白、肺功能數據

tanghuadb <- nhanes('GHB_E') tanghuadb1<- tanghuadb %>% select(SEQN, # 序列號LBXGH #糖化血紅蛋白 feihuoliang <- nhanes('SPXRAW_E ') feihuoliang1<- feihuoliang %>% select(SEQN, # 序列號SPXNFEV1, #FEV1：第一秒用力呼氣量SPXNFVC #FVC：用力肺活量，ml（估計肺容量）)

處理好數據以后把數據合并就好了

hdata<-join_all(list(dat1, xuetang1,tanghuadb1,feihuoliang1), by = 'SEQN', type = 'full')

我們把它保存起來，今后的操作將在這個數據展開

write.csv(hdata,file = "1.csv",row.names = F)

參考文獻：

nhanes數據庫使用手冊

https://blog.csdn.net/weixin_40563866/article/details/120113073?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-5-120113073-blog-121296965.pc_relevant_3mothn_strategy_and_data_recovery&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-5-120113073-blog-121296965.pc_relevant_3mothn_strategy_and_data_recovery&utm_relevant_index=7

總結

以上是生活随笔為你收集整理的Nhanes临床数据库挖掘教程1----数据库下载的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：浅析json_encode
下一篇：欧洲人“家里蹲”，差点把美国互联网搞“瘫

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

数据库

Nhanes临床数据库挖掘教程1----数据库下载

總結