python常用导入函数及其他操作备忘录
生活随笔
收集整理的這篇文章主要介紹了
python常用导入函数及其他操作备忘录
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
python常用導(dǎo)入函數(shù)及其他操作備忘錄
- python常用導(dǎo)入函數(shù)
- 解壓縮zip并讀取csv文件
- 查看缺失值
- 權(quán)重系數(shù)取絕對值后排序(查看特征權(quán)重重要度)
python常用導(dǎo)入函數(shù)
from IPython.display import displayimport numpy as npimport pandas as pd from pandas import Series,DataFrame# 忽略警告 import warnings warnings.filterwarnings('ignore')from PIL import Image import matplotlib.pyplot as plt %matplotlib inline # 圖片大小的兩種方式 plt.rcParams['figure.figsize'] = (14.0, 8.0) plt.figure(figsize = (12,6))plt.rcParams['font.sans-serif']=['SimHei'] # 用來正常顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus']=False # 用來正常顯示負(fù)號(hào) # 將橫、縱坐標(biāo)軸標(biāo)準(zhǔn)化處理,確保餅圖是一個(gè)正圓,否則為橢圓 plt.axes(aspect='equal') # 設(shè)置x軸日期的顯示格式:月-日 date_format = mpl.dates.DateFormatter("%m-%d") ax.xaxis.set_major_formatter(date_format)# 設(shè)置x軸每個(gè)刻度的間隔個(gè)數(shù),例:每7個(gè)數(shù)作為間隔 xlocator = mpl.ticker.MultipleLocator(7) ax.xaxis.set_major_locator(xlocator)# 為了避免x軸刻度標(biāo)簽的緊湊,將刻度標(biāo)簽旋轉(zhuǎn)45度 plt.xticks(rotation=45)# 設(shè)置繪圖風(fēng)格(不妨使用R語言中的ggplot2風(fēng)格) plt.style.use('ggplot') # 調(diào)整子圖之間的水平間距和高度間距 plt.subplots_adjust(hspace=0.6, wspace=0.3) %config ZMQInteractiveShell.ast_node_interactivity='all' # nootbook使用from scipy import interp # 線性插值from selenium import webdriver # 我的環(huán)境變量沒有配置成功,每次都要調(diào)用路徑的Chromedriver path = "D:/box/chromedriver_win32/chromedriver" browser = webdriver.Chrome(executable_path=path, options=webdriver.ChromeOptions()) browser.get('http://www.baidu.com')from sklearn.tree import export_graphviz # 需要在電腦中安裝Graphviz # https://graphviz.gitlab.io/_pages/Download/Download_windows.html # 然后將解壓文件中的bin設(shè)置到環(huán)境變量中 # 不過我手工在環(huán)境變量中添加了bin路徑不行,運(yùn)行下邊這個(gè)語句 import os os.environ["PATH"] += os.pathsep + 'D:/software/graphviz-2.38/release/bin/' #注意修改你的路徑# 數(shù)據(jù)集拆分為訓(xùn)練集和測試集 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)# 標(biāo)準(zhǔn)化數(shù)據(jù),使每個(gè)維度的特征數(shù)據(jù)均值為0,方差為1 from sklearn.preprocessing import StandardScaler s = StandardScaler() x_train = s.fit_transform(X_train) x_test = s.transform(X_test) # 前面fit后,后面只需要transform即可# Display TF info logs tf.logging.set_verbosity(tf.logging.INFO)解壓縮zip并讀取csv文件
import pandas as pd pd.set_option('display.max_columns', 500) # 顯示最大列數(shù),如果超出,省略號(hào)表示import zipfile with zipfile.ZipFile('KaggleCredit2.zip', 'r') as z:f = z.open('KaggleCredit2.csv')data = pd.read_csv(f, index_col=0) # index_col=0表示不設(shè)置索引列,以默認(rèn)數(shù)字0,1,2,3... data.head()查看缺失值
data.isnull() # 缺失值判斷:是缺失值返回True,否則范圍False data.isnull().sum(axis=0) # 缺失值計(jì)算:返回每列包含的缺失值的個(gè)數(shù) data.dropna() # 缺失值刪除:直接刪除含有缺失值的行 data.dropna(inplace=True) # 刪除缺失值,并且用刪除之后的數(shù)據(jù)替換掉原數(shù)據(jù) data.dropna(axis = 1) # 缺失值刪除列:直接刪除含有缺失值的列 data.dropna(how = 'all') # 缺失值刪除行:只刪除全是缺失值的行 data.dropna(thresh = n) # 缺失值刪除判斷:保留至少有n個(gè)缺失值的行 data.dropna(subset = ['C']) # 缺失值刪除列:刪除含有缺失值的特定的列權(quán)重系數(shù)取絕對值后排序(查看特征權(quán)重重要度)
# 各個(gè)特征的權(quán)重系數(shù) pd.Series(lr.coef_[0],index=X.columns) # cls.coef_[0]一維數(shù)組,否則會(huì)出錯(cuò)# 取絕對值并排序 pd.Series(np.abs(lr.coef_[0]),index=X.columns).sort_values(ascending=False) # 降序排列 《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的python常用导入函数及其他操作备忘录的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 张三丰安排刷题
- 下一篇: Tensorflow基于minist数据