當(dāng)前位置：首頁(yè) > 编程资源 > 综合教程 >内容正文

综合教程

《流畅的Python》读书笔记第二章数据结构(2) 231011

發(fā)布時(shí)間：2023/10/11 综合教程 105 老码农

生活随笔收集整理的這篇文章主要介紹了《流畅的Python》读书笔记第二章数据结构(2) 231011 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

2.5 對(duì)序列使用+和*

通常 + 號(hào)兩側(cè)的序列由相同類(lèi)型的數(shù)據(jù)所構(gòu)成，在拼接的過(guò)程中，兩個(gè)被操作的序列都不會(huì)被修改，Python 會(huì)新建一個(gè)包含同樣類(lèi)型數(shù)據(jù)的序列來(lái)作為拼接的結(jié)果

+和*都遵循這個(gè)規(guī)律，不修改原有的操作對(duì)象，而是構(gòu)建一個(gè)全新的序列

l1 = [1,2,3]

l2 = [4,5,6]

print(id(l1))

print(id(l2))

l3 = l1+l2

print(id(l3)) # 變了

l4 = l1 * 3

print(id(l4)) # 變了

print(id(l1)) # 沒(méi)變

print(id(l2)) # 沒(méi)變

2.5.1 建立由列表組成的列表

如果在 a * n 這個(gè)語(yǔ)句中，序列 a 里的元素是對(duì)其他可變對(duì)象的引用的話(huà)，你就需要格外注意了

你想用my_list = [[]] * 3 來(lái)初始化一個(gè)由列表組成的列表，但是你得到的列表里包含的 3 個(gè)元素其實(shí)是 3 個(gè)引用，而且這 3 個(gè)引用指向的都是同一個(gè)列表

這一段在Python官方的doc中就有描述

參考: https://docs.python.org/zh-cn/3.9/library/stdtypes.html

board = [['_'] * 3 for i in range(3)]

print(board)

board[1][2] = 'X'

print(board) 

other_board = [['_'] * 3] * 3

print(other_board)

other_board[1][2] = 'X'

print(other_board)

看完上面的代碼，你知道結(jié)果是什么嗎?

你要做啥，完全取決于你

# 第一個(gè)print

[['_', '_', '_'], ['_', '_', 'X'], ['_', '_', '_']]

# 第二個(gè)print

[['_', '_', 'X'], ['_', '_', 'X'], ['_', '_', 'X']]

2.6 序列的增量賦值

+= 背后的特殊方法是 __iadd__（用于“就地加法”）。但是如果一個(gè)類(lèi)沒(méi)有實(shí)現(xiàn)這個(gè)方法的話(huà)，Python 會(huì)退一步調(diào)用 __add__

看下面的示例代碼就能很好的說(shuō)明這段

class A:

    def __init__(self,age):

        self.age = age

    def __iadd__(self, other):

        print('calling iadd')

        self.age+=other.age

        return self

class B:

    def __init__(self,age):

        self.age = age

    def __add__(self, other):

        print('calling add')

        self.age+=other.age

        return self

a1 = A(1)

a2 = A(2)

a1+=a2 # calling iadd

print(a1.age) # 3

b1 = B(1)

b2 = B(2)

b1+=b2 # calling add

print(b1.age) # 3

a += b

對(duì) 可變序列（例如 list、bytearray 和 array.array）來(lái)說(shuō)，a 會(huì)就地改動(dòng)，就像調(diào)用了 a.extend(b) 一樣

但是如果 a 沒(méi)有實(shí)現(xiàn)__iadd__的話(huà)，a += b 這個(gè)表達(dá)式的效果就變得跟 a = a + b 一樣了：首先計(jì)算 a + b，得到一個(gè)新的對(duì)象，然后賦值給 a。也就是說(shuō)，在這個(gè)表達(dá)式中，變量名會(huì)不會(huì)被關(guān)聯(lián)到新的對(duì)象，完全取決于這個(gè)類(lèi)型有沒(méi)有實(shí)現(xiàn)__iadd__這個(gè)方法

總體來(lái)講，可變序列一般都實(shí)現(xiàn)了 __iadd__ 方法，因此 += 是就地加法。而不可變序列根本就不支持這個(gè)操作，對(duì)這個(gè)方法的實(shí)現(xiàn)也就無(wú)從談起

我覺(jué)得說(shuō)的有點(diǎn)啰嗦了，從"也就是說(shuō)，在這個(gè)..."中的"這個(gè)"是有點(diǎn)歧義的。可以概括為

可變序列調(diào)用a+=b，就地加法，a不變

不可變序列調(diào)用a+=b，就會(huì)產(chǎn)生一個(gè)新的對(duì)象a(來(lái)自a+b的賦值)

看下面的例子，ae是不可變的，因此做了+=后id都變了，而c是可變的，id沒(méi)有變化

a = 1

b = 2

print(id(a))

a += b

print(id(a))

c = [1]

print(id(c))

d = [2]

c +=d

print(id(c))

e = 'e'

print(id(e))

f = 'f'

e +=f

print(id(e))

+= 的概念也適用于 *=，不同的是，后者相對(duì)應(yīng)的是 __imul__

我在https://zhuanlan.zhihu.com/p/656429071 中對(duì)此參考官方文檔詳細(xì)的描述了

方法	說(shuō)明
`__iadd__(self, other)`	+=
`__isub__(self, other)`	-=
`__imul__(self, other)`	*=
`__imatmul__(self, other)`	@=
`__itruediv__(self, other)`	/=
`__ifloordiv__(self, other)`	//=
`__imod__(self, other)`	%=
`__ipow__(self, other[,modulo])`	**=
`__ilshift__(self, other)`	<<=
`__irshift__(self, other)`	>>=
`__iand__(self, other)`	&=
`__ixor__(self, other)`	^=
`__ior__(self, other)`	\|=

很重要的一句話(huà)

對(duì)不可變序列進(jìn)行重復(fù)拼接操作的話(huà)，效率會(huì)很低，因?yàn)槊看味加幸粋€(gè)新對(duì)象，而解釋器需要把原來(lái)對(duì)象中的元素先復(fù)制到新的對(duì)象里，然后再追加新的元素

2.6.1 一個(gè)關(guān)于+=的謎題

t = (1, 2, [30, 40])

t[2] += [50, 60]

到底會(huì)發(fā)生下面 4 種情況中的哪一種？

a. t 變成 (1, 2, [30, 40, 50, 60])。

b. 因?yàn)?tuple 不支持對(duì)它的元素賦值，所以會(huì)拋出 TypeError 異常。

c. 以上兩個(gè)都不是。

d. a 和 b 都是對(duì)的。

這種問(wèn)題一般來(lái)講，不用想，肯定是a、b中的一個(gè)，c可能性不大，d怎么都不可能（又異常又正常）

可答案就是d

稍作改動(dòng)你能看到異常也能看到改變后的t

t = (1, 2, [30, 40])

try:

    t[2] += [50, 60]

except TypeError as e:

    print(e)

    print(t)

書(shū)中還對(duì)此展開(kāi)了字節(jié)碼

>>> s = [1,2,[3,4]]

>>> s = (1,2,[30,40])

>>> b = [50,60]

>>> import dis

>>> dis.dis('s[2]+=b') # 此處 原文是s[a]

  1           0 LOAD_NAME                0 (s)

              2 LOAD_CONST               0 (2)

              4 DUP_TOP_TWO

              6 BINARY_SUBSCR①

              8 LOAD_NAME                1 (b)

             10 INPLACE_ADD②

             12 ROT_THREE

             14 STORE_SUBSCR③

             16 LOAD_CONST               1 (None)

             18 RETURN_VALUE

上面是我的結(jié)果，跟書(shū)中的不太一樣(這種我就不懂了，懂的大神可以說(shuō)說(shuō))

對(duì)上面的①②③作者闡述了

? 將 s[a] 的值存入 TOS（Top Of Stack，棧的頂端）。

? 計(jì)算 TOS += b。這一步能夠完成，是因?yàn)?TOS 指向的是一個(gè)可變對(duì)象（也就是示例 2-15

里的列表）。

? s[a] = TOS 賦值。這一步失敗，是因?yàn)?s 是不可變的元組（示例 2-15 中的元組 t）。

至此我得到了 3 個(gè)教訓(xùn)。

? 不要把可變對(duì)象放在元組里面。

? 增量賦值不是一個(gè)原子操作。我們剛才也看到了，它雖然拋出了異常，但還是完成了操作。

? 查看 Python 的字節(jié)碼并不難，而且它對(duì)我們了解代碼背后的運(yùn)行機(jī)制很有幫助

難倒是不難，就是看不懂有點(diǎn)愁，背后都是C，全忘了~

有讀者提出，如果寫(xiě)成 t[2].extend([50, 60]) 就能避免這個(gè)異常。確實(shí)是這樣，但這個(gè)例子是為了

展示這種奇怪的現(xiàn)象而專(zhuān)門(mén)寫(xiě)的

2.7 list.sort方法和內(nèi)置函數(shù)sorted

Python 的一個(gè)慣例：如果一個(gè)函數(shù)或者方法對(duì)對(duì)象進(jìn)行的是就地改動(dòng)，那它就應(yīng)該返回None，好讓調(diào)用者知道傳入的參數(shù)發(fā)生了變動(dòng)，而且并未產(chǎn)生新的對(duì)象

list.sort就是這么一個(gè)例子，還要random.shuffle等

以前有學(xué)員問(wèn)為何返回是None，我總是回復(fù)，這個(gè)在于對(duì)方的設(shè)計(jì)，現(xiàn)在總算有了一個(gè)新的說(shuō)辭，聽(tīng)著還蠻高大上的。

用返回 None 來(lái)表示就地改動(dòng)這個(gè)慣例有個(gè)弊端，那就是調(diào)用者無(wú)法將其串聯(lián)起來(lái)。而返回一個(gè)新對(duì)象的方法（比如說(shuō) str 里的所有方法）則正好相反，它們可以串聯(lián)起來(lái)調(diào)用，從而形成連貫接口（fluent interface）。詳情參見(jiàn)維基百科中有關(guān)連貫接口的討論（https://en.wikipedia.org/wiki/Fluent_

interface）

我習(xí)慣稱(chēng)之為鏈?zhǔn)秸{(diào)用，就像selenium庫(kù)中ActionChains類(lèi)的API的調(diào)用

list.sort 方法還是 sorted 函數(shù)，都有兩個(gè)可選的關(guān)鍵字參數(shù)

參數(shù)	說(shuō)明
reverse	如果被設(shè)定為 True，被排序的序列里的元素會(huì)以降序輸出（也就是說(shuō)把最大值當(dāng)作最小值來(lái)排序）。這個(gè)參數(shù)的默認(rèn)值是 False。
key	一個(gè)只有一個(gè)參數(shù)的函數(shù)，這個(gè)函數(shù)會(huì)被用在序列里的每一個(gè)元素上，所產(chǎn)生的結(jié)果將是排序算法依賴(lài)的對(duì)比關(guān)鍵字。比如說(shuō)，在對(duì)一些字符串排序時(shí)，可以用 key=str.lower 來(lái)實(shí)現(xiàn)忽略大小寫(xiě)的排序，或者是用 key=len 進(jìn)行基于字符串長(zhǎng)度的排序。這個(gè)參數(shù)的默認(rèn)值是恒等函數(shù)（identity function），也就是默認(rèn)用元素自己的值來(lái)排序

參數(shù)

說(shuō)明

reverse

如果被設(shè)定為 True，被排序的序列里的元素會(huì)以降序輸出（也就是說(shuō)把最大值當(dāng)作最小值來(lái)排序）。這個(gè)參數(shù)的默認(rèn)值是 False。

key

一個(gè)只有一個(gè)參數(shù)的函數(shù)，這個(gè)函數(shù)會(huì)被用在序列里的每一個(gè)元素上，所產(chǎn)生的結(jié)果將是排序算法依賴(lài)的對(duì)比關(guān)鍵字。比如說(shuō)，在對(duì)一些字符串排序時(shí)，可以用 key=str.lower 來(lái)實(shí)現(xiàn)忽略大小寫(xiě)的排序，或者是用 key=len 進(jìn)行基于字符串長(zhǎng)度的排序。這個(gè)參數(shù)的默認(rèn)值是恒等函數(shù)（identity function），也就是默認(rèn)用元素自己的值來(lái)排序

一個(gè)只有一個(gè)參數(shù)的函數(shù) 你會(huì)想到lambda吧~

作者給的例子

>>> fruits = ['grape', 'raspberry', 'apple', 'banana']

>>> sorted(fruits)

['apple', 'banana', 'grape', 'raspberry'] ?

>>> fruits

['grape', 'raspberry', 'apple', 'banana'] ?

>>> sorted(fruits, reverse=True)

['raspberry', 'grape', 'banana', 'apple'] ?

>>> sorted(fruits, key=len)

['grape', 'apple', 'banana', 'raspberry'] ?

>>> sorted(fruits, key=len, reverse=True)

['raspberry', 'banana', 'grape', 'apple'] ?

>>> fruits

['grape', 'raspberry', 'apple', 'banana'] ?

>>> fruits.sort() ?

>>> fruits

['apple', 'banana', 'grape', 'raspberry'] ?

我在https://zhuanlan.zhihu.com/p/658316452中也詳細(xì)闡述了一些簡(jiǎn)單的用法

可選參數(shù) key 還可以在內(nèi)置函數(shù) min() 和 max() 中起作用。另外，還有些標(biāo)準(zhǔn)庫(kù)里的函數(shù)也接受這個(gè)參數(shù)，像 itertools.groupby() 和 heapq.nlargest() 等

headq示例代碼

import heapq

# 創(chuàng)建一個(gè)列表

numbers = [1,-4,3,10,-15,9]

# 使用 heapq.nlargest() 并設(shè)置 key 參數(shù)為 square（平方）

largest_three = heapq.nlargest(3, numbers, key=lambda x: x ** 2)

print(largest_three)  # 輸出：[-15, 10, 9]

groupby示例代碼

from itertools import groupby

# 示例數(shù)據(jù)，假設(shè)這是一組學(xué)生的成績(jī)記錄，每個(gè)學(xué)生有姓名和數(shù)學(xué)成績(jī)

students = [('Alice', 90), ('Bob', 80), ('Charlie', 85), ('David', 90), ('Eva', 85)]

# 使用 lambda 函數(shù)將學(xué)生按照數(shù)學(xué)成績(jī)進(jìn)行分組

grouped_students = groupby(sorted(students, key=lambda x: x[1]), key=lambda x: x[1])

# 遍歷每個(gè)組并打印組名（數(shù)學(xué)成績(jī)）和組中的學(xué)生列表

for name, group in grouped_students:

    print(f"Group name: {name}")

    for student in group:

        print(f" - {student[0]}")

示例輸出

Group name: 80

 - Bob

Group name: 85

 - Charlie

 - Eva

Group name: 90

 - Alice

 - David

2.8 用bisect來(lái)管理已排序的序列

bisect 模塊包含兩個(gè)主要函數(shù)，bisect 和 insort，兩個(gè)函數(shù)都利用二分查找算法來(lái)在有序序列中查找或插入元素

2.8.1 用bisect來(lái)搜索

Bisection 二分法

bisect(haystack, needle)

haystack 干草垛是一個(gè)已經(jīng)排好序的序列
needle是待插入的針
插入完畢后的newstack依然是有序的
bisect(haystack, needle) 查找位置 index
haystack.insert(index,needle) 來(lái)插入新值
insort 可以一步到位，并且速度更快一些
bisect默認(rèn)情況下遇到等值，插入到右側(cè)(bisect = bisect_right)，bisect_left可以插入到左側(cè)
bisect_right(a, x, lo=0, hi=None) 完整的有4個(gè)參數(shù)，lo默認(rèn)是0即第一個(gè)數(shù)，hi默認(rèn)是len(a)

作者給的代碼，稍作更改

import bisect

import sys

HAYSTACK = [1, 4, 5, 6, 8, 12, 15, 20, 21, 23, 23, 26, 29, 30]

NEEDLES = [0, 1, 2, 5, 8, 10, 22, 23, 29, 30, 31]

ROW_FMT = 'Needle: {0:2d} ,index: {1:2d}==> {2}{0:<2d}'

def demo(bisect_fn):

    for needle in reversed(NEEDLES):

        position = bisect_fn(HAYSTACK, needle) #?

        offset = position * ' |' #?

        print(ROW_FMT.format(needle, position, offset)) #?

if __name__ == '__main__':

    if sys.argv[-1] == 'left': #?

        bisect_fn = bisect.bisect_left

    else:

        bisect_fn = bisect.bisect

    print('DEMO:', bisect_fn.__name__) #?

    print('haystack ->')

    print('                        ',' '.join('%2d' % n for n in HAYSTACK))

    demo(bisect_fn)

作者的解釋

? 用特定的 bisect 函數(shù)來(lái)計(jì)算元素應(yīng)該出現(xiàn)的位置。

? 利用該位置來(lái)算出需要幾個(gè)分隔符號(hào)。

? 把元素和其應(yīng)該出現(xiàn)的位置打印出來(lái)。

? 根據(jù)命令上最后一個(gè)參數(shù)來(lái)選用 bisect 函數(shù)。

? 把選定的函數(shù)在抬頭打印出來(lái)

你可能看到的輸出是這樣的

DEMO: bisect_right

haystack ->

                          1  4  5  6  8 12 15 20 21 23 23 26 29 30

Needle: 31 ,index: 14==>  | | | | | | | | | | | | | |31

Needle: 30 ,index: 14==>  | | | | | | | | | | | | | |30

Needle: 29 ,index: 13==>  | | | | | | | | | | | | |29

Needle: 23 ,index: 11==>  | | | | | | | | | | |23

Needle: 22 ,index:  9==>  | | | | | | | | |22

Needle: 10 ,index:  5==>  | | | | |10

Needle:  8 ,index:  5==>  | | | | |8

Needle:  5 ,index:  3==>  | | |5

Needle:  2 ,index:  1==>  |2

Needle:  1 ,index:  1==>  |1

Needle:  0 ,index:  0==> 0

你可以執(zhí)行python demo.py left 得到不一樣的結(jié)果，這個(gè)代碼接受參數(shù)，只不過(guò)它處理的是最后一個(gè)參數(shù)if sys.argv[-1] == 'left':

bisect一個(gè)經(jīng)典的案例，我在https://www.liujiangblog.com/course/python/57也看到過(guò)，第一次見(jiàn)的時(shí)候覺(jué)得還蠻厲害的，后來(lái)發(fā)現(xiàn)在官網(wǎng)就有了，https://docs.python.org/3/library/bisect.html

>>> def grade(score, breakpoints=[60, 70, 80, 90], grades='FDCBA'):

... i = bisect.bisect(breakpoints, score)

... return grades[i]

...

>>> [grade(score) for score in [33, 99, 77, 70, 89, 90, 100]]

['F', 'A', 'C', 'C', 'B', 'A', 'A']

通過(guò)計(jì)算score在breakpoints中的位置，得到對(duì)應(yīng)grades(必須要與breakpoints對(duì)應(yīng))的等級(jí)

雖然你可以用字典來(lái)做，但這個(gè)方法也是非常不錯(cuò)的案例

拓展閱讀

Raymond Hettinger 寫(xiě)了一個(gè)排序集合模塊（http://code.activestate.com/recipes/577197-sortedcollection

2.8.2 用bisect.insort插入新元素

insort(seq, item) 把變量 item 插入到序列 seq 中，并能保持 seq 的升序順序

import bisect

import random

SIZE=7

random.seed(1729)

my_list = []

for i in range(SIZE):

    new_item = random.randrange(SIZE*2)

    bisect.insort(my_list, new_item)

    print('%2d ->' % new_item, my_list)

輸出

10 -> [10]

 0 -> [0, 10]

 6 -> [0, 6, 10]

 8 -> [0, 6, 8, 10]

 7 -> [0, 6, 7, 8, 10]

 2 -> [0, 2, 6, 7, 8, 10]

10 -> [0, 2, 6, 7, 8, 10, 10]

insort的源碼很簡(jiǎn)單，底層就是bisect_right或bisect_left得到索引后用a.insert來(lái)插入

def insort_right(a, x, lo=0, hi=None):

    lo = bisect_right(a, x, lo, hi)

    a.insert(lo, x)

def insort_left(a, x, lo=0, hi=None):

    lo = bisect_left(a, x, lo, hi)

    a.insert(lo, x)

insort = insort_right

insort 跟 bisect 一樣，有 lo 和 hi 兩個(gè)可選參數(shù)用來(lái)控制查找的范圍

目前所提到的內(nèi)容都不僅僅是對(duì)列表或者元組有效，還可以應(yīng)用于幾乎所有的序列類(lèi)型上

如果是所有的序列類(lèi)型，那從源碼看，你得支持.insert才可以，元組其實(shí)就不支持了，你要實(shí)現(xiàn)必須轉(zhuǎn)換下

2.9 當(dāng)列表不是首選時(shí)

要存放1000 萬(wàn)個(gè)浮點(diǎn)數(shù)的話(huà)，數(shù)組（array）的效率要高得多，因?yàn)閿?shù)組在背后存的并不是 float

對(duì)象，而是數(shù)字的機(jī)器翻譯，也就是字節(jié)表述

如果需要頻繁對(duì)序列做先進(jìn)先出的操作，deque（雙端隊(duì)列）的速度應(yīng)該會(huì)更快。

如果在你的代碼里，包含操作（比如檢查一個(gè)元素是否出現(xiàn)在一個(gè)集合中）的頻率很高，用 set（集合）會(huì)更合適

用什么數(shù)據(jù)結(jié)構(gòu)是應(yīng)該利用數(shù)據(jù)結(jié)構(gòu)的特點(diǎn)再結(jié)合你的應(yīng)用場(chǎng)景而定的

下面這幾個(gè)我工作中反正是幾乎沒(méi)用過(guò)

2.9.1 數(shù)組 array

我也是一直把Python的list當(dāng)做array來(lái)處理的，其實(shí)不然

如果我們需要一個(gè)只包含數(shù)字的列表，那么 array.array 比 list 更高效

數(shù)組支持所有跟可變序列有關(guān)的操作，包括 .pop、.insert 和 .extend。另外，數(shù)組還提供從文件讀取和存

入文件的更快的方法，如 .frombytes 和 .tofile。

在Python的array.array函數(shù)中，第一個(gè)參數(shù)是一個(gè)表示類(lèi)型的代碼，它決定了數(shù)組中元素的數(shù)據(jù)類(lèi)型。以下是可以使用的類(lèi)型代碼：

'b'：布爾型（Boolean），取值為T(mén)rue（1）或False（0）。
'B'：無(wú)符號(hào)布爾型（Unsigned Byte），取值為0或1。
'u'：Unicode字符（Unicode Character）。
'i'：有符號(hào)整數(shù)（Signed Integer）。
'I'：無(wú)符號(hào)整數(shù)（Unsigned Integer）。
'l'：長(zhǎng)整數(shù)（Long Integer）。
'L'：無(wú)符號(hào)長(zhǎng)整數(shù)（Unsigned Long Integer）。
'f'：浮點(diǎn)數(shù)（Floating Point）。
'd'：十進(jìn)制浮點(diǎn)數(shù)（Decimal Floating Point）。
'g'：十進(jìn)制浮點(diǎn)數(shù)或定點(diǎn)數(shù)（General Purpose）。

這些類(lèi)型代碼的長(zhǎng)度也代表了數(shù)組中元素的數(shù)據(jù)類(lèi)型的長(zhǎng)度，例如'i'代表的是有符號(hào)的整數(shù)類(lèi)型，長(zhǎng)度為當(dāng)前平臺(tái)下int的對(duì)齊長(zhǎng)度，而'B'則代表的是無(wú)符號(hào)的8位整數(shù)類(lèi)型。

請(qǐng)注意，創(chuàng)建的數(shù)組只能包含一種數(shù)據(jù)類(lèi)型的元素。

array('b') 創(chuàng)建出的數(shù)組就只能存放一個(gè)字節(jié)大小的整數(shù)，范圍從 -128 到127，這樣在序列很大的時(shí)候，我們能節(jié)省很多空間。而且 Python 不會(huì)允許你在數(shù)組里存放除指定類(lèi)型之外的數(shù)據(jù)

書(shū)中給出的代碼(稍作更改)

from array import array # 1

from random import random

floats1 = array('d', (random() for i in range(10**7))) # 2

print(floats1[-1]) # 3

with open('floats.bin', 'wb') as fp1: # 4

    floats1.tofile(fp1)

floats2 = array('d') # 5

with open('floats.bin', 'rb') as fp2:

    floats2.fromfile(fp2, 10**7) # 6

print(floats2[-1]) # 7

print(floats1 == floats2) # 8

? 引入 array 類(lèi)型。

? 利用一個(gè)可迭代對(duì)象來(lái)建立雙精度浮點(diǎn)數(shù)組（類(lèi)型碼是 'd'），這里我們用的可迭代對(duì)象是一個(gè)生成器表達(dá)式。

? 查看數(shù)組的最后一個(gè)元素。

? 把數(shù)組存入一個(gè)二進(jìn)制文件里。

? 新建一個(gè)雙精度浮點(diǎn)空數(shù)組。

? 把 1000 萬(wàn)個(gè)浮點(diǎn)數(shù)從二進(jìn)制文件里讀取出來(lái)。

? 查看新數(shù)組的最后一個(gè)元素。

? 檢查兩個(gè)數(shù)組的內(nèi)容是不是完全一樣。

劃下重點(diǎn)

用 array.fromfile 從一個(gè)二進(jìn)制文件里讀出 1000 萬(wàn)個(gè)雙精度浮點(diǎn)數(shù)只需要 0.1 秒，這比從文本文件里讀取的速度要快60 倍。
使用 array.tofile 寫(xiě)入到二進(jìn)制文件，比以每行一個(gè)浮點(diǎn)數(shù)的方式把所有數(shù)字寫(xiě)入到文本文件要快 7倍
1000 萬(wàn)個(gè)這樣的數(shù)在二進(jìn)制文件里只占用 80 000 000 個(gè)字節(jié)（每個(gè)浮點(diǎn)數(shù)占用8 個(gè)字節(jié)，不需要任何額外空間），如果是文本文件的話(huà)，我們需要 181 515 739 個(gè)字節(jié)(20多倍)

另外一個(gè)快速序列化數(shù)字類(lèi)型的方法是使用 pickle（https://docs.python.org/3/library/pickle.html）模塊。pickle.dump 處理浮點(diǎn)數(shù)組的速度幾乎跟 array.tofile 一樣快。不過(guò)前者可以處理幾乎所有的內(nèi)置數(shù)字類(lèi)型，包含復(fù)數(shù)、嵌套集合，甚至用戶(hù)自定義的類(lèi)。前提是這些類(lèi)沒(méi)有什么特別復(fù)雜的實(shí)現(xiàn)

操作	列表	數(shù)組	說(shuō)明
`s.__add__(s2)`	√	√	s + s2 ，拼接
`s.__iadd__(s2)`	√	√	s += s2 ，就地拼接
s.append(e)	√	√	在尾部添加一個(gè)元素
s.byteswap		√	翻轉(zhuǎn)數(shù)組內(nèi)每個(gè)元素的字節(jié)序列，轉(zhuǎn)換字節(jié)序
s.clear()	√		刪除所有元素
`s.__contains__(e)`	√	√	s 是否含有 e
s.copy()	√		對(duì)列表淺復(fù)制
`s.__copy__()`		√	對(duì) copy.copy 的支持
s.count(e)	√	√	s 中 e 出現(xiàn)的次數(shù)
`s.__deepcopy__()`		√	對(duì) copy.deepcopy 的支持
`s.__delitem__(p)`	√	√	刪除位置 p 的元素
s.extend(it)	√	√	將可迭代對(duì)象 it 里的元素添加到尾部
s.frombytes(b)		√	將壓縮成機(jī)器值的字節(jié)序列讀出來(lái)添加到尾部
s.fromfile(f, n)		√	將二進(jìn)制文件 f 內(nèi)含有機(jī)器值讀出來(lái)添加到尾部，最多添加 n 項(xiàng)
s.fromlist(l)		√	將列表里的元素添加到尾部，如果其中任何一個(gè)元素導(dǎo)致了TypeError 異常，那么所有的添加都會(huì)取消
`s.__getitem__(p)`	√	√	s[p]，讀取位置 p 的元素
s.index(e)	√	√	找到 e 在序列中第一次出現(xiàn)的位置
s.insert(p, e)	√	√	在位于 p 的元素之前插入元素 e
s.itemsize		√	數(shù)組中每個(gè)元素的長(zhǎng)度是幾個(gè)字節(jié)
`s.__iter__()`	√	√	返回迭代器
`s.__len__()`	√	√	len(s)，序列的長(zhǎng)度
`s.__mul__(n)`	√	√	s * n，重復(fù)拼接
`s.__imul__(n)`	√	√	s *= n ，就地重復(fù)拼接
`s.__rmul__(n)`	√	√	n * s ，反向重復(fù)拼接 *
s.pop([p])	√	√	刪除位于 p 的值并返回這個(gè)值，p 的默認(rèn)值是最后一個(gè)元素的位置
s.remove(e)	√	√	刪除序列里第一次出現(xiàn)的 e 元素
s.reverse()	√	√	就地調(diào)轉(zhuǎn)序列中元素的位置
`s.__reversed__()`	√		返回一個(gè)從尾部開(kāi)始掃描元素的迭代器
`s.__setitem__(p, e)`	√	√	s[p] = e，把位于 p 位置的元素替換成 e
s.sort([key], [revers])	√		就地排序序列，可選參數(shù)有 key 和 reverse
s.tobytes()		√	把所有元素的機(jī)器值用 bytes 對(duì)象的形式返回
s.tofile(f)		√	把所有元素以機(jī)器值的形式寫(xiě)入一個(gè)文件
s.tolist()		√	把數(shù)組轉(zhuǎn)換成列表，列表里的元素類(lèi)型是數(shù)字對(duì)象
s.typecode		√	返回只有一個(gè)字符的字符串，代表數(shù)組元素在 C 語(yǔ)言中的類(lèi)型

從 Python 3.4 開(kāi)始，數(shù)組（array）類(lèi)型不再支持諸如 list.sort() 這種就地排序方法

要給數(shù)組排序的話(huà)，得用 sorted 函數(shù)新建一個(gè)數(shù)組：a = array.array(a.typecode, sorted(a))

2.9.2 內(nèi)存視圖 memoryview

memoryview 是一個(gè)內(nèi)置類(lèi)，它能讓用戶(hù)在不復(fù)制內(nèi)容的情況下操作同一個(gè)數(shù)組的不同切片

在數(shù)據(jù)結(jié)構(gòu)之間共享內(nèi)存。其中數(shù)據(jù)結(jié)構(gòu)可以是任何形式，比如 PIL 圖片、SQLite數(shù)據(jù)庫(kù)和 NumPy 的數(shù)組，等等。這個(gè)功能在處理大型數(shù)據(jù)集合的時(shí)候非常重要

示例 2-21 : 通過(guò)改變數(shù)組中的一個(gè)字節(jié)來(lái)更新數(shù)組里某個(gè)元素的值

>>> numbers = array.array('h', [-2, -1, 0, 1, 2])

>>> memv = memoryview(numbers) ?

>>> len(memv)

5

>>> memv[0] ?

-2

>>> memv_oct = memv.cast('B') ?

>>> memv_oct.tolist() ?

[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]

>>> memv_oct[5] = 4 ?

>>> numbers

array('h', [-2, -1, 1024, 1, 2]) ?

? 利用含有 5 個(gè)短整型有符號(hào)整數(shù)的數(shù)組（類(lèi)型碼是 'h'）創(chuàng)建一個(gè) memoryview。

? memv 里的 5 個(gè)元素跟數(shù)組里的沒(méi)有區(qū)別。

? 創(chuàng)建一個(gè) memv_oct，這一次是把 memv 里的內(nèi)容轉(zhuǎn)換成 'B' 類(lèi)型，也就是無(wú)符號(hào)字符。

? 以列表的形式查看 memv_oct 的內(nèi)容。

? 把位于位置 5 的字節(jié)賦值成 4。

? 因?yàn)槲覀儼颜?2 個(gè)字節(jié)的整數(shù)的高位字節(jié)改成了 4，所以這個(gè)有符號(hào)整數(shù)的值就變成

了 1024。

2.9.3 NumPy和SciPy

這部分多少有點(diǎn)跑偏，簡(jiǎn)單瞄一眼就行了，我基本就是CTRL+C/V

憑借著 NumPy 和 SciPy 提供的高階數(shù)組和矩陣操作，Python 成為科學(xué)計(jì)算應(yīng)用的主流語(yǔ)言

NumPy 實(shí)現(xiàn)了多維同質(zhì)數(shù)組（homogeneous array）和矩陣，這些數(shù)據(jù)結(jié)構(gòu)不但能處理數(shù)字，還能存放其他由用戶(hù)定義的記錄

SciPy 是基于 NumPy 的另一個(gè)庫(kù)，它提供了很多跟科學(xué)計(jì)算有關(guān)的算法，專(zhuān)為線(xiàn)性代數(shù)、數(shù)值積分和統(tǒng)計(jì)學(xué)而設(shè)計(jì)

SciPy 把基于C 和 Fortran 的工業(yè)級(jí)數(shù)學(xué)計(jì)算功能用交互式且高度抽象的 Python 包裝起來(lái)

這些跟計(jì)算有關(guān)的部分都源自于 Netlib 庫(kù)（http://www.netlib.org）

示例 2-22：NumPy 二維數(shù)組的基本操

>>> import numpy ?

>>> a = numpy.arange(12) ?

>>> a

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])

>>> type(a)

<class 'numpy.ndarray'>

>>> a.shape ?

(12,)

>>> a.shape = 3, 4 ?

>>> a

array([[ 0, 1, 2, 3],

[ 4, 5, 6, 7],

[ 8, 9, 10, 11]])

>>> a[2] ?

array([ 8, 9, 10, 11])

>>> a[2, 1] ?

9

>>> a[:, 1] ?

array([1, 5, 9])

>>> a.transpose() ?

array([[ 0, 4, 8],

[ 1, 5, 9],

[ 2, 6, 10],

[ 3, 7, 11]])

? 安裝 NumPy 之后，導(dǎo)入它（NumPy 并不是 Python 標(biāo)準(zhǔn)庫(kù)的一部分）。

? 新建一個(gè) 0~11 的整數(shù)的 numpy.ndarray，然后把它打印出來(lái)。

? 看看數(shù)組的維度，它是一個(gè)一維的、有 12 個(gè)元素的數(shù)組。

? 把數(shù)組變成二維的，然后把它打印出來(lái)看看。

? 打印出第 2 行。

? 打印第 2 行第 1 列的元素

? 把第 1 列打印出來(lái)。

? 把行和列交換，就得到了一個(gè)新數(shù)組

>>> import numpy

>>> floats = numpy.loadtxt('floats-10M-lines.txt') ?

>>> floats[-3:] ?

array([ 3016362.69195522, 535281.10514262, 4566560.44373946])

>>> floats *= .5 ?

>>> floats[-3:]

array([ 1508181.34597761, 267640.55257131, 2283280.22186973])

>>> from time import perf_counter as pc ?

>>> t0 = pc(); floats /= 3; pc() - t0 ?

0.03690556302899495

>>> numpy.save('floats-10M', floats) ?

>>> floats2 = numpy.load('floats-10M.npy', 'r+') ?

>>> floats2 *= 6

>>> floats2[-3:] ?

memmap([3016362.69195522, 535281.10514262, 4566560.44373946])

? 從文本文件里讀取 1000 萬(wàn)個(gè)浮點(diǎn)數(shù)。

? 利用序列切片來(lái)讀取其中的最后 3 個(gè)數(shù)。

? 把數(shù)組里的每個(gè)數(shù)都乘以 0.5，然后再看看最后 3 個(gè)數(shù)。

? 導(dǎo)入精度和性能都比較高的計(jì)時(shí)器（Python 3.3 及更新的版本中都有這個(gè)庫(kù)）。

? 把每個(gè)元素都除以 3，可以看到處理 1000 萬(wàn)個(gè)浮點(diǎn)數(shù)所需的時(shí)間還不足 40 毫秒。

? 把數(shù)組存入后綴為 .npy 的二進(jìn)制文件。

? 將上面的數(shù)據(jù)導(dǎo)入到另外一個(gè)數(shù)組里，這次 load 方法利用了一種叫作內(nèi)存映射的機(jī)制，

它讓我們?cè)趦?nèi)存不足的情況下仍然可以對(duì)數(shù)組做切片。

? 把數(shù)組里每個(gè)數(shù)乘以 6 之后，再檢視一下數(shù)組的最后 3 個(gè)數(shù)

2.9.4 雙向隊(duì)列和其他形式的隊(duì)列

利用 .append 和 .pop 方法，我們可以把列表當(dāng)作棧或者隊(duì)列來(lái)用（比如，把 .append和 .pop(0) 合起來(lái)用，就能模擬隊(duì)列的“先進(jìn)先出”的特點(diǎn)）

此處貼一下LeetCode 232 用棧實(shí)現(xiàn)隊(duì)列的某個(gè)題解，你能很好的理解上面這句話(huà)

class MyQueue:

    def __init__(self):

        self.A, self.B = [], []

    def push(self, x: int) -> None:

        self.A.append(x)

    def pop(self) -> int:

        peek = self.peek()

        self.B.pop()

        return peek

    def peek(self) -> int:

        if self.B: return self.B[-1]

        if not self.A: return -1

        # 將棧 A 的元素依次移動(dòng)至棧 B

        while self.A:

            self.B.append(self.A.pop())

        return self.B[-1]

    def empty(self) -> bool:

        return not self.A and not self.B

但是刪除列表的第一個(gè)元素（抑或是在第一個(gè)元素之前添加一個(gè)元素）之類(lèi)的操作是很耗時(shí)的，因?yàn)檫@些操作會(huì)牽扯到移動(dòng)列表里的所有元素。

常見(jiàn)的列表操作的復(fù)雜度

列表操作	時(shí)間復(fù)雜度
append	O(1)
list[0] 或 list[-1] 或 list[0] = 1	O(1) # 下標(biāo)訪(fǎng)問(wèn)或賦值
pop	O(1)
pop(index)	O(n)
insert	O(n)
del list[0]	O(n)
reverse	O(n)
sort	O(n log n)
sorted(list)	O(n log n)
remove	O(n)
list[a:b]	O(n) # 切片
len(list)	O(1)
count	O(n)
n in nums	O(n)

collections.deque 類(lèi)（雙向隊(duì)列）是一個(gè)線(xiàn)程安全、可以快速?gòu)膬啥颂砑踊蛘邉h除元素的數(shù)據(jù)類(lèi)型。而且如果想要有一種數(shù)據(jù)類(lèi)型來(lái)存放“最近用到的幾個(gè)元素”，deque 也是一個(gè)很好的選擇

示例 2-23 使用雙向隊(duì)列

>>> from collections import deque

>>> dq = deque(range(10), maxlen=10) ?

>>> dq

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)

>>> dq.rotate(3) ?

>>> dq

deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6], maxlen=10)

>>> dq[1]

8

>>> dq[-1]

6

>>> dq.rotate(-4)

>>> dq

deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 0], maxlen=10)

>>> dq.appendleft(-1) ?

>>> dq

deque([-1, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)

>>> dq.extend([11, 22, 33]) ?

>>> dq

deque([3, 4, 5, 6, 7, 8, 9, 11, 22, 33], maxlen=10)

>>> dq.extendleft([10, 20, 30, 40]) ?

>>> dq

deque([40, 30, 20, 10, 3, 4, 5, 6, 7, 8], maxlen=10)

? maxlen 是一個(gè)可選參數(shù)，代表這個(gè)隊(duì)列可以容納的元素的數(shù)量，而且一旦設(shè)定，這個(gè)屬性就不能修改了。

? 隊(duì)列的旋轉(zhuǎn)操作接受一個(gè)參數(shù) n，當(dāng) n > 0 時(shí)，隊(duì)列的最右邊的 n 個(gè)元素會(huì)被移動(dòng)到隊(duì)列的左邊。當(dāng) n < 0 時(shí)，最左邊的 n 個(gè)元素會(huì)被移動(dòng)到右邊。

? 當(dāng)試圖對(duì)一個(gè)已滿(mǎn)（len(d) == d.maxlen）的隊(duì)列做頭部appendleft添加操作的時(shí)候，它尾部的元素會(huì)被刪除掉。注意在下一行里，元素 0 被刪除了。

? 在尾部添加 3 個(gè)元素的操作會(huì)擠掉 -1、1 和 2(就是前三個(gè))。

? extendleft(iter) 方法會(huì)把迭代器里的元素逐個(gè)添加到雙向隊(duì)列的左邊，因此迭代器里的元素會(huì)逆序出現(xiàn)在隊(duì)列里。這非常有特點(diǎn)

雙向隊(duì)列實(shí)現(xiàn)了大部分列表所擁有的方法，也有一些額外的符合自身設(shè)計(jì)的方法，比如說(shuō)

popleft 和 rotate。但是為了實(shí)現(xiàn)這些方法，雙向隊(duì)列也付出了一些代價(jià)，從隊(duì)列中間刪

除元素的操作會(huì)慢一些，因?yàn)樗粚?duì)在頭尾的操作進(jìn)行了優(yōu)化。

append 和 popleft 都是原子操作，也就說(shuō)是 deque 可以在多線(xiàn)程程序中安全地當(dāng)作先進(jìn)先

出的隊(duì)列使用，而使用者不需要擔(dān)心資源鎖的問(wèn)題

操作	列表	雙向隊(duì)列	說(shuō)明
`s.__add__(s2)`	√		s + s2 ，拼接
`s.__iadd__(s2)`	√	√	s += s2 ，就地拼接
s.append(e)	√	√	添加一個(gè)元素到最右側(cè)（到最后一個(gè)元素之后）
s.appendleft(e)		√	添加一個(gè)元素到最左側(cè)（到第一個(gè)元素之前）
s.clear()	√	√	刪除所有元素
`s.__contains__(e)`	√		s 是否含有 e
s.copy()	√		對(duì)列表淺復(fù)制
`s.__copy__()`		√	對(duì) copy.copy （淺復(fù)制）的支持
s.count(e)	√	√	s 中 e 出現(xiàn)的次數(shù)
`s.__delitem__(p)`	√	√	刪除位置 p 的元素
s.extend(it)	√	√	將可迭代對(duì)象 it 里的元素添加到尾部
s.extendleft(i)		√	將可迭代對(duì)象 i 中的元素添加到頭部
`s.__getitem__(p)`	√	√	s[p]，讀取位置 p 的元素
s.index(e)	√		找到 e 在序列中第一次出現(xiàn)的位置
s.insert(p, e)	√		在位于 p 的元素之前插入元素 e
`s.__iter__()`	√	√	返回迭代器
`s.__len__()`	√	√	len(s)，序列的長(zhǎng)度
`s.__mul__(n)`	√		s * n，重復(fù)拼接
`s.__imul__(n)`	√		s *= n ，就地重復(fù)拼接
`s.__rmul__(n)`	√		n * s ，反向重復(fù)拼接 *
s.pop([p])	√	√	刪除位于 p 的值并返回這個(gè)值，p 的默認(rèn)值是最后一個(gè)元素的位置
s.popleft()		√	移除第一個(gè)元素并返回它的值
s.remove(e)	√	√	刪除序列里第一次出現(xiàn)的 e 元素
s.reverse()	√	√	就地調(diào)轉(zhuǎn)序列中元素的位置
`s.__reversed__()`	√	√	返回一個(gè)從尾部開(kāi)始掃描元素的迭代器
s.rotate(n)		√	把 n 個(gè)元素從隊(duì)列的一端移到另一端
`s.__setitem__(p, e)`	√	√	s[p] = e，把位于 p 位置的元素替換成 e
s.sort([key], [revers])	√		就地排序序列，可選參數(shù)有 key 和 reverse

a_list.pop(p) 這個(gè)操作只能用于列表，雙向隊(duì)列的這個(gè)方法不接收參數(shù)

其他形式的隊(duì)列的實(shí)現(xiàn)

其他形式	說(shuō)明
queue	提供了同步（線(xiàn)程安全）類(lèi) Queue、LifoQueue 和 PriorityQueue，不同的線(xiàn)程可以利用這些數(shù)據(jù)類(lèi)型來(lái)交換信息。這三個(gè)類(lèi)的構(gòu)造方法都有一個(gè)可選參數(shù) maxsize，它接收正整數(shù)作為輸入值，用來(lái)限定隊(duì)列的大小。但是在滿(mǎn)員的時(shí)候，這些類(lèi)不會(huì)扔掉舊的元素來(lái)騰出位置。相反，如果隊(duì)列滿(mǎn)了，它就會(huì)被鎖住，直到另外的線(xiàn)程移除了某個(gè)元素而騰出了位置。這一特性讓這些類(lèi)很適合用來(lái)控制活躍線(xiàn)程的數(shù)量
multiprocessing	這個(gè)包實(shí)現(xiàn)了自己的 Queue，它跟 queue.Queue 類(lèi)似，是設(shè)計(jì)給進(jìn)程間通信用的。同時(shí) 還有一個(gè)專(zhuān)門(mén)的 multiprocessing.JoinableQueue 類(lèi)型，可以讓任務(wù)管理變得更方便
asyncio	Python 3.4 新提供的包，里面有 Queue、LifoQueue、PriorityQueue 和 JoinableQueue，這些類(lèi)受到 queue 和 multiprocessing 模塊的影響，但是為異步編程里的任務(wù)管理提供了專(zhuān)門(mén)的便利
heapq	跟上面三個(gè)模塊不同的是，heapq 沒(méi)有隊(duì)列類(lèi)，而是提供了 heappush 和 heappop 方法，讓用戶(hù)可以把可變序列當(dāng)作堆隊(duì)列或者優(yōu)先隊(duì)列來(lái)使用

2.10 本章小結(jié)

Python 序列類(lèi)型最常見(jiàn)的分類(lèi)就是可變和不可變序列

另外一種分類(lèi)方式扁平序列和容器序列

前者的體積更小、速度更快而且用起來(lái)更簡(jiǎn)單，但是它只能保存一些原子性的數(shù)據(jù)，比如數(shù)字、字符和字節(jié)

后者更加靈活，如果用到可變對(duì)象，還要嵌套的數(shù)據(jù)結(jié)構(gòu)，尤其要注意

列表推導(dǎo)和生成器表達(dá)式則提供了靈活構(gòu)建和初始化序列的方式

元組它既可以用作無(wú)名稱(chēng)的字段的記錄，又可以看作不可變的列表

前者的使用中，拆包是一個(gè)典型的做法，*句法更加便利

具名元組的實(shí)例也很節(jié)省空間，同時(shí)提供了方便地通過(guò)名字來(lái)獲取元組各個(gè)字段信息的方式

Python 里最受歡迎的一個(gè)語(yǔ)言特性就是序列切片

用戶(hù)自定義的序列類(lèi)型也可以選擇支持 NumPy 中的多維切片和省略（...）

對(duì)切片賦值是一個(gè)修改可變序列的捷徑

增量賦值 += 和 *= 會(huì)區(qū)別對(duì)待可變和不可變序列

在遇到不可變序列時(shí)，這兩個(gè)操作會(huì)在背后生成新的序列。但如果被賦值的對(duì)象是可變的，那么這個(gè)序列會(huì)就地修改

序列的 sort 方法和內(nèi)置的 sorted 函數(shù)，都接受一個(gè)函數(shù)作為可選參數(shù)來(lái)指定排序算法如何比較大小

這個(gè)參數(shù)名為key

如果在插入新元素的同時(shí)還想保持有序序列的順序，那么需要用到 bisect.insort。bisect.bisect 的作用則是快速查找

返回索引

2.11 延伸閱讀

素材	URL	相關(guān)信息
Python 官方網(wǎng) 站的Sorting HOW TO	https://docs.python.org/3/howto/sorting.html	講解了 sorted 和 list.sort 的高級(jí)用法
PEP 3132 — Extended Iterable Unpacking	https://www.python.org/dev/peps/pep-3132/	使用 *extra 句法進(jìn)行平行賦值的權(quán)威指南
Missing *-unpacking generalizations	http://bugs.python.org/issue2292	關(guān)于如何更廣泛地使用可迭代對(duì)象拆包的討論和提議
PEP 448—Additional Unpacking Generalizations	https://www.python.org/dev/peps/pep-0448/	上面討論的直接結(jié)果
Less Copies in Python with the Buffer Protocol and memoryviews	http://eli.thegreenplace.net/2011/11/28/less-copies-in-python-with-the-buffer-protocol-and-memoryviews/
	利用 Python 進(jìn)行數(shù)據(jù)分析	Wes McKinney
8.3. collections — Container datatypes	https://docs.python.org/3/library/collections.html	有一些關(guān)于雙向隊(duì)列和其他集合類(lèi)型的使用技巧
Why Numbering Should Start at Zero	http://www.cs.utexas.edu/users/EWD/transcriptions/EWD08xx/EWD831.html

ABC 里的 compounds 類(lèi)型算得上是 Python 元組的鼻祖

容器”一詞來(lái)自“Data Model”文檔（https://docs.python.org/3/reference/datamodel.

html#objects-values-and-types）

有些對(duì)象里包含對(duì)其他對(duì)象的引用；這些對(duì)象稱(chēng)為容器

扁平序列因?yàn)橹荒馨訑?shù)據(jù)類(lèi)型，比如整數(shù)、浮點(diǎn)數(shù)或字符，所以不能嵌套使用

這個(gè)名字是本書(shū)作者創(chuàng)造的！主要是為了跟容器序列做對(duì)比

列表是可以同時(shí)容納不同類(lèi)型的元素的，但是實(shí)際上這樣做并沒(méi)有什么特別的好處

不推薦這么用

元組則恰恰相反，它經(jīng)常用來(lái)存放不同類(lèi)型的的元素

list.sort、sorted、max 和 min 函數(shù)的 key 參數(shù)是一個(gè)很棒的設(shè)計(jì)

用 key 參數(shù)能把事情變得簡(jiǎn)單且高效。

說(shuō)它更簡(jiǎn)單，是因?yàn)橹恍枰峁┮粋€(gè)單參數(shù)函數(shù)來(lái)提取或者計(jì)算一個(gè)值作為比較大小的標(biāo)準(zhǔn)即可

說(shuō)它更高效，是因?yàn)樵诿總€(gè)元素上，key 函數(shù)只會(huì)被調(diào)用一次。

sorted 和 list.sort 背后的排序算法是 Timsort，它是一種自適應(yīng)算法，會(huì)根據(jù)原始數(shù)據(jù)的順序特點(diǎn)交替使用插入排序和歸并排序，以達(dá)到最佳效率

https://en.wikipedia.org/wiki/Timsort

2009年起，Java 和 Android 也開(kāi)始使用這個(gè)算法

Timsort 的創(chuàng)始人是 Tim Peters，也是“Python 之禪”（import this）的作者

總結(jié)

以上是生活随笔為你收集整理的《流畅的Python》读书笔记第二章数据结构(2) 231011的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：嵌入式BI的精解与探索
下一篇： P34_数据请求 - GET和POST请