用python完成《商务与经济统计(第13版)》课后练习——第7章和第8章
這次作業(yè)練習(xí)收獲挺多,難的不是練習(xí)題,而是在計(jì)算前的數(shù)據(jù)預(yù)處理。本來以為可以很快解決的,還是花了些力氣,看來還是要多練習(xí)~
文章目錄
- chapter7-14題
- chapter8-6題
- chapter8-22題
chapter7-14題
晨星公布了1208家企業(yè)的股票信息數(shù)據(jù)(晨星官網(wǎng),2012年10月24日)。這些股票中的40只組成一個(gè)樣本,存放在數(shù)據(jù)文件Morningstar.csv 中,利用Morningstar數(shù)據(jù)集回答下列問題。
1.求晨星股票中達(dá)到最高評級5星的股票所占比率的點(diǎn)估計(jì)。
2.求晨星股票中商業(yè)風(fēng)險(xiǎn)評級高于平均水平的股票所占比率的點(diǎn)估計(jì)。
3.求晨星股票中評級不高于2星的股票所占比率的點(diǎn)估計(jì)。
數(shù)據(jù)預(yù)處理
import pandas as pd import numpy as np##讀取數(shù)據(jù) ms = pd.read_csv("/myfile/個(gè)人事務(wù)/數(shù)據(jù)分析學(xué)習(xí)/商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)/數(shù)據(jù)文件/第7章/Morningstar.csv",sep=",") ms.head(10)
星級和風(fēng)險(xiǎn)水平都是字符串的形式,為了方便計(jì)算先轉(zhuǎn)換成數(shù)值型
1.求5星所占比率的點(diǎn)估計(jì)
2.求高于平均水平的股票所占比率的點(diǎn)估計(jì)
3.求評級不高于2星的股票所占比率的點(diǎn)估計(jì)
chapter8-6題
全球商務(wù)旅行協(xié)會(GBTA)對旅行中住宿、租車、和餐飲方面每天的旅行稅進(jìn)行了研究,試圖評價(jià)各個(gè)城市的每日總旅行稅。關(guān)于芝加哥商務(wù)旅行的研究結(jié)果存放在名為TravelTax的文件中(GBTA基金,2012年10月30日)。假設(shè)已知總體標(biāo)準(zhǔn)差為8.05美元,試求芝加哥每日旅行稅的總體均值的區(qū)間估計(jì),取95%置信區(qū)間。
TT = pd.read_csv("/myfile/個(gè)人事務(wù)/數(shù)據(jù)分析學(xué)習(xí)/商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)/數(shù)據(jù)文件/第8章/TravelTax.csv",sep=",") TT.head(10) # 95%置信區(qū)間,z_score = 1.96,直接計(jì)算 tax = TT["Lodging, Car Rental, and Meal Taxes ($)"] tax_mean = tax.mean() n = len(tax) tax_sigma = 8.50 tax_up = tax_mean + 1.96*tax_sigma/np.sqrt(n) tax_low = tax_mean - 1.96*tax_sigma/np.sqrt(n) print(tax_up) print(tax_low) # 編寫函數(shù)求解 from scipy.stats import norm import numpy as np def confidence_interval(sample_mean,population_std,sample_size,confidence):alpha = 1 - confidence z = abs(norm.ppf(alpha/2)) #求z_score的值# 根據(jù)概率求解z值,或者是求解陰影面積,它的逆操作是norm.cdf(z_score)upper_limit = sample_mean + z*population_std/np.sqrt(sample_size)lower_limit = sample_mean - z*population_std/np.sqrt(sample_size)return [lower_limit,upper_limit]chapter8-22題
漫威公司電影《銀河護(hù)衛(wèi)隊(duì)》在2014年勞動(dòng)節(jié)周末的前兩天上映,其票房收入打破北美記錄,達(dá)到9340萬美元(《好萊塢報(bào)道》,2014年8月3日)。由30家電影院組成一個(gè)樣本,其票房銷售收入(單位:美元)存放在名為Guardians的文件中。
1.求每家電影院票房銷售收入均值的95%置信區(qū)間,并解釋這個(gè)結(jié)果。
2.電影票的價(jià)格是每張8.11美元,試估計(jì)每家電影院的平均觀影人數(shù)。
3.該部影片已經(jīng)在4080家影院上映,估計(jì)觀看電影《銀河護(hù)衛(wèi)隊(duì)》的觀眾總?cè)藬?shù)和周末的票房收入。
數(shù)據(jù)預(yù)處理
# 讀取文件 movie = pd.read_csv("/myfile/個(gè)人事務(wù)/數(shù)據(jù)分析學(xué)習(xí)/商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)/數(shù)據(jù)文件/第8章/Guardians.csv",sep=",") movie.head()
在西文表達(dá)中,數(shù)值被加入逗號分隔開,因此先要去除數(shù)字中的逗號并轉(zhuǎn)換為數(shù)值型,才能進(jìn)行計(jì)算。
1.求95%置信區(qū)間
# 總體標(biāo)準(zhǔn)差未知,使用t分布求解 from scipy.stats import t # import numpy as np def confidence_interval_t(sample_mean,sample_std,sample_size,confidence):alpha = 1 - confidencet_df = sample_size - 1 #自由度t_score = abs(t.ppf(alpha/2,t_df))# 根據(jù)概率求解t值,或者是求解陰影面積,它的逆操作是t.cdf(t_score) upper_limit = sample_mean + t_score * sample_std/np.sqrt(sample_size)lower_limit = sample_mean - t_score * sample_std/np.sqrt(sample_size)return [lower_limit,upper_limit]movie_mean = np.mean(m_num) movie_std = np.std(m_num,ddof = 1) #計(jì)算中使用的除數(shù)是N-ddof n_movie = len(m_num) m_limit = confidence_interval_t(movie_mean,movie_std,n_movie,0.95) m_limit2.每家影院的平均觀影人數(shù)
price = 8.11 mean_people = sum(m_num)/price/n_movie mean_people3.求觀影總?cè)藬?shù)和票房
cinema = 4080 sum_people = mean_people * cinema income_movie = sum_people * price print("觀看電影的觀眾總?cè)藬?shù)為{},周末的總票房為{}。".format(sum_people,income_movie))總結(jié)
以上是生活随笔為你收集整理的用python完成《商务与经济统计(第13版)》课后练习——第7章和第8章的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Humble Numbers USCAO
- 下一篇: 国内优秀的PHP后台管理系统(CMS)整