當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

python常用导入函数及其他操作备忘录

發(fā)布時(shí)間：2025/3/21 python 17 豆豆

生活随笔收集整理的這篇文章主要介紹了 python常用导入函数及其他操作备忘录小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

python常用導(dǎo)入函數(shù)及其他操作備忘錄

python常用導(dǎo)入函數(shù)
解壓縮zip并讀取csv文件
查看缺失值
權(quán)重系數(shù)取絕對值后排序（查看特征權(quán)重重要度）

python常用導(dǎo)入函數(shù)

from IPython.display import displayimport numpy as npimport pandas as pd from pandas import Series,DataFrame# 忽略警告 import warnings warnings.filterwarnings('ignore')from PIL import Image import matplotlib.pyplot as plt %matplotlib inline # 圖片大小的兩種方式 plt.rcParams['figure.figsize'] = (14.0, 8.0) plt.figure(figsize = (12,6))plt.rcParams['font.sans-serif']=['SimHei'] # 用來正常顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus']=False # 用來正常顯示負(fù)號(hào) # 將橫、縱坐標(biāo)軸標(biāo)準(zhǔn)化處理，確保餅圖是一個(gè)正圓，否則為橢圓 plt.axes(aspect='equal') # 設(shè)置x軸日期的顯示格式:月-日 date_format = mpl.dates.DateFormatter("%m-%d") ax.xaxis.set_major_formatter(date_format)# 設(shè)置x軸每個(gè)刻度的間隔個(gè)數(shù)，例：每7個(gè)數(shù)作為間隔 xlocator = mpl.ticker.MultipleLocator(7) ax.xaxis.set_major_locator(xlocator)# 為了避免x軸刻度標(biāo)簽的緊湊，將刻度標(biāo)簽旋轉(zhuǎn)45度 plt.xticks(rotation=45)# 設(shè)置繪圖風(fēng)格（不妨使用R語言中的ggplot2風(fēng)格） plt.style.use('ggplot') # 調(diào)整子圖之間的水平間距和高度間距 plt.subplots_adjust(hspace=0.6, wspace=0.3) %config ZMQInteractiveShell.ast_node_interactivity='all' # nootbook使用from scipy import interp # 線性插值from selenium import webdriver # 我的環(huán)境變量沒有配置成功，每次都要調(diào)用路徑的Chromedriver path = "D:/box/chromedriver_win32/chromedriver" browser = webdriver.Chrome(executable_path=path, options=webdriver.ChromeOptions()) browser.get('http://www.baidu.com')from sklearn.tree import export_graphviz # 需要在電腦中安裝Graphviz # https://graphviz.gitlab.io/_pages/Download/Download_windows.html # 然后將解壓文件中的bin設(shè)置到環(huán)境變量中 # 不過我手工在環(huán)境變量中添加了bin路徑不行，運(yùn)行下邊這個(gè)語句 import os os.environ["PATH"] += os.pathsep + 'D:/software/graphviz-2.38/release/bin/' #注意修改你的路徑# 數(shù)據(jù)集拆分為訓(xùn)練集和測試集 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)# 標(biāo)準(zhǔn)化數(shù)據(jù)，使每個(gè)維度的特征數(shù)據(jù)均值為0，方差為1 from sklearn.preprocessing import StandardScaler s = StandardScaler() x_train = s.fit_transform(X_train) x_test = s.transform(X_test) # 前面fit后，后面只需要transform即可# Display TF info logs tf.logging.set_verbosity(tf.logging.INFO)

解壓縮zip并讀取csv文件

import pandas as pd pd.set_option('display.max_columns', 500) # 顯示最大列數(shù)，如果超出，省略號(hào)表示import zipfile with zipfile.ZipFile('KaggleCredit2.zip', 'r') as z:f = z.open('KaggleCredit2.csv')data = pd.read_csv(f, index_col=0) # index_col=0表示不設(shè)置索引列，以默認(rèn)數(shù)字0,1,2,3... data.head()

查看缺失值

data.isnull() # 缺失值判斷：是缺失值返回True，否則范圍False data.isnull().sum(axis=0) # 缺失值計(jì)算：返回每列包含的缺失值的個(gè)數(shù) data.dropna() # 缺失值刪除：直接刪除含有缺失值的行 data.dropna(inplace=True) # 刪除缺失值，并且用刪除之后的數(shù)據(jù)替換掉原數(shù)據(jù) data.dropna(axis = 1) # 缺失值刪除列：直接刪除含有缺失值的列 data.dropna(how = 'all') # 缺失值刪除行：只刪除全是缺失值的行 data.dropna(thresh = n) # 缺失值刪除判斷:保留至少有n個(gè)缺失值的行 data.dropna(subset = ['C']) # 缺失值刪除列：刪除含有缺失值的特定的列

權(quán)重系數(shù)取絕對值后排序（查看特征權(quán)重重要度）

# 各個(gè)特征的權(quán)重系數(shù) pd.Series(lr.coef_[0],index=X.columns) # cls.coef_[0]一維數(shù)組，否則會(huì)出錯(cuò)# 取絕對值并排序 pd.Series(np.abs(lr.coef_[0]),index=X.columns).sort_values(ascending=False) # 降序排列《新程序員》：云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作，文字、視頻、音頻交互閱讀

總結(jié)

以上是生活随笔為你收集整理的python常用导入函数及其他操作备忘录的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：张三丰安排刷题
下一篇： Tensorflow基于minist数据