當前位置：首頁 > 编程语言 > python >内容正文

python

python小数据池，代码块的最详细、深入剖析

發布時間：2024/9/21 python 25 豆豆

生活随笔收集整理的這篇文章主要介紹了 python小数据池，代码块的最详细、深入剖析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一. id is ==
二. 代碼塊
三. 小數據池
四. 總結

一，id，is，==

　　在Python中，id是什么？id是內存地址，那就有人問了，什么是內存地址呢？你只要創建一個數據（對象）那么都會在內存中開辟一個空間，將這個數據臨時加在到內存中，那么這個空間是有一個唯一標識的，就好比是身份證號，標識這個空間的叫做內存地址，也就是這個數據（對象）的id，那么你可以利用id（）去獲取這個數據的內存地址：

name = '太白' print(id(name)) # 1585831283968

那么 is 是什么？ == 又是什么？

== 是比較的兩邊的數值是否相等，而 is 是比較的兩邊的內存地址是否相等。如果內存地址相等，那么這兩邊其實是指向同一個內存地址。

可以說如果內存地址相同，那么值肯定相同，但是如果值相同，內存地址不一定相同。

二，代碼塊。

根據官網提示我們可以獲知：

根據提示我們從官方文檔找到了這樣的說法： A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block. A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed. View Code

上面的主要意思是：

Python程序是由代碼塊構造的。塊是一個python程序的文本，他是作為一個單元執行的。

代碼塊：一個模塊，一個函數，一個類，一個文件等都是一個代碼塊。

而作為交互方式輸入的每個命令都是一個代碼塊。

什么叫交互方式？就是咱們在cmd中進入Python解釋器里面，每一行代碼都是一個代碼塊，例如：

而對于一個文件中的兩個函數，也分別是兩個不同的代碼塊：

　　那么，可能有的同學還有一些不理解代碼塊，可以這樣解釋：我們都上過學對吧，你們在初中的時候，有沒有過值周？就以一個班的學生用一星期的時間打掃整個學校，再比如有沒有運動會，無論是值周，還是運動會，還是組織什么活動，都是以什么為單位呢？對，都是以班級為單位，那么咱們學生就好比是代碼，班級就好比是代碼塊，我們想讓代碼運行起來，必須依靠班級去執行，也就是代碼塊。

OK，那么現在我們了解了代碼塊，這和小數據池有什么關系呢？且聽下面分析。

代碼塊的緩存機制

前提條件：在同一個代碼塊內。

機制內容：Python在執行同一個代碼塊的初始化對象的命令時，會檢查是否其值是否已經存在，如果存在，會將其重用。換句話說：執行同一個代碼塊時，遇到初始化對象的命令時，他會將初始化的這個變量與值存儲在一個字典中，在遇到新的變量時，會先在字典中查詢記錄，如果有同樣的記錄那么它會重復使用這個字典中的之前的這個值。所以在你給出的例子中，文件執行時（同一個代碼塊）會把i1、i2兩個變量指向同一個對象，滿足緩存機制則他們在內存中只存在一個，即：id相同。

適用對象：?int（float），str，bool。

對象的具體細則：（了解）

　　int(float):任何數字在同一代碼塊下都會復用。

　　bool:True和False在字典中會以1，0方式存在，并且復用。

　　str：幾乎所有的字符串都會符合緩存機制，具體規定如下（了解即可！）：

1，非乘法得到的字符串都滿足代碼塊的緩存機制：

s1 = '太白@！#*ewq' s2 = '太白@！#*ewq' print(s1 is s2) # True

2,乘法得到的字符串分兩種情況：

　　2.1 乘數為1時，任何字符串滿足代碼塊的緩存機制：

b1 = '太白@5847395QQ0743895*&^%$#((&_+(())' *1 a1 = '太白@5847395QQ0743895*&^%$#((&_+(())' *1print(a1 is b1) # True

　　2.2 乘數>=2時：僅含大小寫字母，數字，下劃線，總長度<=20，滿足代碼塊的緩存機制：

s1 = 'old_' * 5 s2 = 'old_' * 5 print(s1 is s2) # True

?優點：能夠提高一些字符串，整數處理人物在時間和空間上的性能；需要值相同的字符串，整數的時候，直接從‘字典’中取出復用，避免頻繁的創建和銷毀，提升效率，節約內存。

?三，小數據池

小數據池，不同代碼塊的緩存機制，也稱為小整數緩存機制，或者稱為駐留機制等等，博主認為，只要你在網上查到的這些名字其實說的都是一個意思，叫什么因人而異。

那么到底什么是小數據池？他有什么作用呢？

前提條件：在不同一個代碼塊內。

機制內容：官方對于整數，字符串的小數據池是這么說的:

對于整數，Python官方文檔中這么說： The current implementation keeps an array of integer objects for all integers between -5 and 256, when you create an int in that range you actually just get back a reference to the existing object. So it should be possible to change the value of 1. I suspect the behaviour of Python in this case is undefined.對于字符串： Incomputer science, string interning is a method of storing only onecopy of each distinct string value, which must be immutable. Interning strings makes some stringprocessing tasks more time- or space-efficient at the cost of requiring moretime when the string is created or interned. The distinct values are stored ina string intern pool. –引自維基百科 View Code

來，我給你們翻譯并匯總一下，這個表達的意思就是：

Python自動將-5~256的整數進行了緩存，當你將這些整數賦值給變量時，并不會重新創建對象，而是使用已經創建好的緩存對象。

python會將一定規則的字符串在字符串駐留池中，創建一份，當你將這些字符串賦值給變量時，并不會重新創建對象，而是使用在字符串駐留池中創建好的對象。

　　其實，無論是緩存還是字符串駐留池，都是python做的一個優化，就是將~5-256的整數，和一定規則的字符串，放在一個‘池’（容器，或者字典）中，無論程序中那些變量指向這些范圍內的整數或者字符串，那么他直接在這個‘池’中引用，言外之意，就是內存中之創建一個。

適用對象：?int（float），str，bool?

對象的具體細則：（了解即可）

int：那么大家都知道對于整數來說，小數據池的范圍是-5~256 ，如果多個變量都是指向同一個（在這個范圍內的）數字，他們在內存中指向的都是一個內存地址。

那么對于字符串的規定呢？

str:字符串要從下面這幾個大方向討論（了解即可！）：

1,字符串的長度為0或者1，默認都采用了駐留機制（小數據池）。

2,字符串的長度>1,且只含有大小寫字母，數字，下劃線時，才會默認駐留。

3,用乘法得到的字符串，分兩種情況。

　　3.1 乘數為1時：

僅含大小寫字母，數字，下劃線，默認駐留。

含其他字符，長度<=1,默認駐留。

含其他字符，長度>1,默認駐留。

　　3.2 乘數>=2時：

僅含大小寫字母，數字，下劃線，總長度<=20,默認駐留。

4，指定駐留。

from sys import intern a = intern('hello!@'*20) b = intern('hello!@'*20) print(a is b) #指定駐留是你可以指定任意的字符串加入到小數據池中，讓其只在內存中創建一個對象，多個變量都是指向這一個字符串。

滿足以上字符串的規則時，就符合小數據池的概念。

bool值就是True，False，無論你創建多少個變量指向True，False，那么他在內存中只存在一個。

看一下用了小數據池（駐留機制）的效率有多高：

顯而易見，節省大量內存在字符串比較時，非駐留比較效率o(n)，駐留時比較效率o(1)。

優點：能夠提高一些字符串，整數處理人物在時間和空間上的性能；需要值相同的字符串，整數的時候，直接從‘池’里拿來用，避免頻繁的創建和銷毀，提升效率，節約內存

四，小結。

　　如果在同一代碼塊下，則采用同一代碼塊下的換緩存機制。

　　如果是不同代碼塊，則采用小數據池的駐留機制。

# pycharm 通過運行文件的方式執行下列代碼：這是在同一個文件下也就是同一代碼塊下，采用同一代碼塊下的緩存機制。 i1 = 1000 i2 = 1000 print(i1 is i2) # 結果為True 因為代碼塊下的緩存機制適用于所有數字通過交互方式中執行下面代碼： # 這是不同代碼塊下，則采用小數據池的駐留機制。 >>> i1 = 1000 >>> i2 = 1000 >>> print(i1 is i2) False # 不同代碼塊下的小數據池駐留機制數字的范圍只是-5~256.

更多驗證：

# 雖然在同一個文件中，但是函數本身就是代碼塊，所以這是在兩個不同的代碼塊下，不滿足小數據池（駐存機制），則指向兩個不同的地址。 def func():i1 = 1000print(id(i1)) # 2288555806672def func2():i1 = 1000print(id(i1)) # 2288557317392 func() func2()

本文大量引用和參考鏈接如下：?

https://zhidao.baidu.com/question/494120409773699052.html??

http://mini.eastday.com/bdmip/180405084648167.html

轉載于:https://www.cnblogs.com/jin-xin/articles/9439483.html

總結

以上是生活随笔為你收集整理的python小数据池，代码块的最详细、深入剖析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。