把时间还给洞察,且看PPT调研报告自动生成攻略
生活随笔
收集整理的這篇文章主要介紹了
把时间还给洞察,且看PPT调研报告自动生成攻略
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文/JSong @2017.02.28
在數據分析里面有一句話是說,80%的時間要用于數據清洗和整理,而我覺得理想的狀態應該是把更多的把時間花在數據背后的洞察當中。去年11月在簡書占了個坑,說要自己寫一個工具來解決,今天我來填坑了。
1、解決方案概述
2、準備工作
依賴環境:
備注
py2.7版本的pptx包對中文支持有 bug, 請按照如下方式修改
3、快速上手
【不懂或者不想學python3的請看這】
為了方便更多人使用,我給windows用戶提供了一個很簡單的使用方法,大家下載項目地址中的文件夾reportgen[無python經驗的下載]即可,使用說明也在其中,非常簡單。這里也提供一個百度云盤地址:reportgen簡易使用版本鏈接(密碼: as84): https://pan.baidu.com/s/1dEPT72p
3.1 三行代碼解決描述統計報告:
import report as rpt # 數據編碼和導入 # 300_300_0.xls是問卷星的按文本數據,300_300_2.xls是問卷星的按序號數據. # 如果將他們放在“.\\data\\”中,則文件名可以缺省,即:`data,code=rpt.wenjuanxing()` data,code=rpt.wenjuanxing(['300_300_0.xls','300_300_2.xls']) # 描述統計報告生成 rpt.summary_chart(data,code,filename=u'調研報告初稿');如上代碼可以在.\out\文件夾下生成兩個文件
3.2 四行代碼解決交叉統計報告
import report as rpt # 數據編碼和導入 data,code=rpt.wenjuanxing() # 交叉統計報告生成(假設第一道題Q1是性別選擇題) save_dstyle=['FE','TGI','CHI']#自由選擇需要保存的指標(FE:期望頻數等) rpt.cross_chart(data,code,cross_class='Q1',filename=u'性別差異分析',save_dstyle=save_dstyle);如上代碼可以在.\out\文件夾下生成5個文件
3.3 其他實用函數
import report as rpt # 文件I/O data=rpt.read_data(filename) code=rpt.read_code(filename) rpt.save_data(data,filename,code) rpt.save_code(code,filename) data,code=rpt.wenjuanxing(filepath)# 編碼問卷星的數據 data,code=rpt.wenjuanwang(filepath)# 編碼問卷網的數據 # 數據統計函數 t,t1=rpt.qtable(data,code,'Q1')# 單變量頻數統計 t,t1=rpt.qtable(data,code,'Q1','Q2')# 雙變量交叉統計 # 數據分析函數 cdata=rpt.contingency(fo)# 列聯表分析 rpt.gof_test(fo,fe)# 擬合優度檢驗 rpt.chi2_test(fo,fe)# 卡方檢驗 rpt.binomial_interval(p,n)# 計算比率的置信區間 # 自動描述統計報告 ''' summary_qlist: 例如['Q1','Q2'],需要分析的問卷題目列表,缺省為code中所有的關鍵詞 template: 例如{'path':'mytemplate.pptx','layouts':[1,2]}, 缺省為pptx自帶的模板''' rpt.summary_chart(data,code,filename=u'描述統計報告', summary_qlist=None,\ max_column_chart=20,template=None)# 自動交叉統計報告 ''' cross_class: 需要交叉分析的題目,如:'Q1' cross_qlist: 例如['Q1','Q2'],需要分析的問卷題目列表,缺省為code中所有的關鍵詞 plt_dstyle: 繪制在ppt上使用的數據格式,缺省為百分比表,可以選擇'TGI'等 save_dstyle: 需要保存的數據,例如:['TGI','FO','TWI','CHI'] template: 例如{'path':'mytemplate.pptx','layouts':[1,2]}, 缺省為pptx自帶的模板''' rpt.cross_chart(data,code,cross_class,filename=u'交叉分析', cross_qlist=None,\ delclass=None,plt_dstyle=None,cross_order=None, significance_test=False, \ reverse_display=False,total_display=True,max_column_chart=20,save_dstyle=None,\ template=None):END
若您覺得感興趣,請點擊“喜歡”;
若您用的舒服,請分享給其他人;
轉載于:https://www.cnblogs.com/gasongjian/p/6481422.html
總結
以上是生活随笔為你收集整理的把时间还给洞察,且看PPT调研报告自动生成攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux驱动:电阻屏驱动分析
- 下一篇: 跨域 CORS policy