python基础课程6(看代码看注释)--pandas
生活随笔
收集整理的這篇文章主要介紹了
python基础课程6(看代码看注释)--pandas
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
##人生苦短,我用python
#pandas
##首先講講數據格式,csv文件格式,程序之間表格數據之間的轉移,如從數據庫導入到excel中csv是很合適的轉移格式。
#1.純文本,使用某個字符集,比如ascii,Unicode,EBCDID或者GB2312等
#2.由記錄組成(典型的是每行一條記錄)
#3.每條記錄被分隔符分割為字段(典型的分隔符有逗號、分好或者制表符、有時分隔符可以包括可選擇的空格)
#4.每條記錄都有同樣的字段序列
import pandas as pd
import numpy as np
df1 = "數據文件的路徑"
df = pd.read_csv(df1)
df.head(2)
type(df)##重中之重:DataFrame
df.colums#獲取列名
df.col[1]#獲取第1列
#獲取索引
df.index
#篩選:例如刪選數學成績大于80分的
df.數學>80
df[df.數學>80]#出現數學成績大于80的所有學生的信息
#與munpy比較
##復雜篩選:語數英同時大于80
(df.語文>80) & (df.數學>80) & (df.英語>80)#返回false或者true
df((df.語文>80) & (df.數學>80) & (df.英語>80))#返回語數外同時大于80的結果##排序
df.sort_values(['數學'],)#對數學成績進行排序
#對多列數據進行排序
df.sort_values(['數學','語文'])
##訪問:loc函數是按照索引進行定位的
#不存在這種訪問方式df[0]
df.loc[1]
##索引的概念
score = {'英語':[90,100,99],'語文':[90,90,90],'數學':[100,100,90]
}
df = pd.DataFrame(score,index=['one','two','three'])
df.index
#此時不存在數字索引,索引不能通過數字索引取訪問
#df.loc()
df.loc['one']
#實實在在的第幾行
df.iloc[0]#可以直接用數字索引
#ix[n]合并了loc和iloc的功能
df.ix[0]#實實在在訪問第0行##訪問多行
df.ix[:2]
#訪問某一行時直接使用df[0]是錯誤的,多行是可以的
df[:2]
df.value()
##匿名函數
[i + 100 for i in range(10)]
def func(x):return x + 100
list(map(lambda x:x+100,range(10)))
##根據多列生成一個列的操作
df['new_score']= df.apply(lambda x:x.數學+x.語文,axis=1)
##panda中的DataFrame的操作很大一部分都是跟numpy中的二維數組的操作是近似的
總結
以上是生活随笔為你收集整理的python基础课程6(看代码看注释)--pandas的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sr650服务器cpu型号,至强Gold
- 下一篇: python基础课程1(看代码看注释)-