spss24 中文版 2.数据清洗与处理
字數:608 ,基礎級別,難度一個星,建議閱讀時長60秒:
寫在前面:接下來的幾篇都是與spss操作相關的內容,將自己曾經有困惑或者使用頻率較高的內容介紹出來,最后一篇將會是Airbnb相關實戰分析 ? ?~~我也不知道能不能堅持到最后一篇~~?
只是個小白,所以..歡迎大家糾錯~
目錄
數據排序的基本操作
重復個案的識別
數據文件的拆分
變量計算
選擇個案
數據排序的基本操作
1) 數據(Data)--個案排序(Sort Cases);
2) 右鍵按一次圈起來的區域。
值得注意的是:數據排序以后,原有數據排列次序被打亂,因此為了保留原有數據的原始排列,通常會在第一列加入編號列。
重復個案的識別
操作:數據(Data)-標識重復個案(Identify Duplicate Cases)
作用:通常會和刪除重復個案連用;避免可能由重復錄入引起的統計錯誤
數據文件的拆分
操作:數據-拆分文件(Split Files)
作用:分組統計,通常和其他方法(如描述統計)連用
異常:命令最多只能使用8個拆分文件變量。請注意,長字符串變量將算作多個拆分文件變量。
處理方法:修改該變量的寬度
結合使用例子:
恢復原狀:
?
變量計算
操作:轉換(Transform)-計算變量(Compute Variable)
| 運算符 | 等價形式 | 含義 |
| ** | ? | 乘方 |
| ~=(關系運算符) | NT | 不等于 |
| & | AND | 與運算 |
| | | OR | 或運算 |
| ~ | NOT | 非運算 |
?
選擇個案
操作:數據-選擇個案(Select Cases)
原因:由于調研和實驗得到的數據量一般都很大,根據抽樣的方法選取一部分變量進行分析;數據處理之前需對數據進行篩選,篩選出有問題或無關緊要的額數據。
1)所有個案(All cases),表示全部個案
2)如果條件滿足(If condition is satisfied),表示根據自定的邏輯關系表示式選擇數據。
3)隨機個案樣本(Random sample of cases),表示隨機選取數據。
下一篇預告:表格+圖形創建
總結
以上是生活随笔為你收集整理的spss24 中文版 2.数据清洗与处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JS之简易日历的制作
- 下一篇: CRM客户关系管理系统开发第十七讲——实