Python 之代码块和小数据池

id，is，==，=

id 是内存地址，那什么是内存地址呢？你只要创建一个数据（对象），Python 会在内存中开辟一个空间，这个空间有一个唯一标识，这个标识就叫做内存地址，也就是这个数据（对象）的id，可以用 id() 获取这个数据的内存地址：
1
2
name = 'lp' print(id(name)) # 158xxxxxxxxx
== 比较两边的数值是否相等。
is 比较两边的内存地址是否相等。如果内存地址相等，那么这两边其实是指向同一个内存地址。
可以说如果内存地址相同，那么值肯定相同，但是如果值相同，内存地址不一定相同。
= 为赋值，赋予的是内存地址。

代码块

官方文档：

1
2

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.
A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed.

上面的意思是：

Python 程序是由代码块构造的。块是一个 Python 程序的文本，他是作为一个单元执行的。

代码块包括：一个模块，一个函数，一个类，一个文件等。交互方式输入的每个命令都是一个代码块。

什么叫交互方式？就是在 cmd 中进入 Python 解释器里面，每一行代码都是一个代码块，例如：

1
2
3

# 这是两个代码块
>>> b = "asdfsdafsfasfasgasgafasdfsdaasdgsadgasd123"
>>> a = "asdfsdafsfasfasgasgafasdfsdaasdgsadgasd123"

对于一个文件中的两个函数，也是两个不同的代码块：

# 这是两个代码块
def fun_a():
    pass
    
def fun_b():
    pass

代码块的缓存机制

前提条件：在同一个代码块内。

机制内容：Python 在执行同一个代码块的初始化对象的命令时，会检查是否其值是否已经存在，如果存在，会将其重用。换句话说：执行同一个代码块时，遇到初始化对象的命令时，他会将初始化的这个变量与值存储在一个字典中，在遇到新的变量时，会先在字典中查询记录，如果有同样的记录那么它会重复使用这个字典中的之前的这个值。满足缓存机制的变量在内存中只存在一个，对应着 id 相同。

适用对象：int（float）、str、bool。

int(float)：任何数字在同一代码块下都会复用。
bool：True 和 False 在字典中会以 1，0 方式存在，并且复用。
str：几乎所有的字符串都会符合缓存机制，具体规定如下：
- 非乘法得到的字符串都满足代码块的缓存机制。
- 乘法得到的字符串分两种情况：
  - 乘数为1时，任何字符串满足代码块的缓存机制。
  - 乘数>=2时：仅含大小写字母，数字，下划线，总长度<=20，满足代码块的缓存机制。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    s1 = 'abcd' s2 = 'abcd' print(s1 is s2) # True s3 = 'abcd' * 1 s4 = 'abcd' * 1 print(s3 is s4) # True s5 = 'abcd' * 5 s6 = 'abcd' * 5 print(s5 is s6) # True

优点：能够提高一些字符串，整数处理任务在时间和空间上的性能；需要值相同的字符串，整数的时候，直接从”字典”中取出复用，避免频繁的创建和销毁，提升效率，节约内存。

缺点: 在”字典”中创建或者插入新的内容会花费更多的时间。

小数据池

小数据池，不同代码块的缓存机制，也称为小整数缓存机制，或者称为驻留机制等等，只要你在网上查到的这些名字其实说的都是一个意思。

那么到底什么是小数据池？他有什么作用呢？

前提条件：在不同一个代码块内。

机制内容：

Python 自动将 -5~256 的整数进行了缓存，当你将这些整数赋值给变量时，并不会重新创建对象，而是使用已经创建好的缓存对象。
python 也会将一定规则的字符串在字符串驻留池中，创建一份，当你将这些字符串赋值给变量时，并不会重新创建对象，而是使用在字符串驻留池中创建好的对象。
其实，无论是缓存还是字符串驻留池，都是 Python 做的一个优化，就是将 ~5-256 的整数和一定规则的字符串，放在一个”池”（容器，或者字典）中，无论程序中那些变量指向这些范围内的整数或者字符串，那么他直接在这个”池”中引用。

适用对象：int（float）、str、bool。

bool：就是 True 和 False，无论创建多少个变量指向 True，False，在内存中都只存在一个。

int：对于整数来说，小数据池的范围是 -5~256，如果多个变量都是指向同一个（在这个范围内的）数字，他们在内存中指向的都是一个内存地址。

>>> i1 = 2
>>> i2 = 2
>>> i3 = 2345
>>> i4 = 2345
>>> id(i1), id(i2), id(i3), id(i4)  # i1 和 i2 相同， i3 和 i4 不同
(140731896340928, 140731896340928, 2863792405904, 2863792404656)

str：

字符串的长度为0或者1，默认都采用了驻留机制。
字符串的长度>1，且只含有大小写字母，数字，下划线时，才会默认驻留。

用乘法得到的字符串，分两种情况。

乘数为1时：仅含大小写字母，数字，下划线，默认驻留。

乘数>=2时：仅含大小写字母，数字，下划线，总长度<=20，默认驻留。

>>> s1 = "@"
>>> s2 = "@"
>>> s3 = "adf@"
>>> s4 = "adf@"
>>> s5 = "12345689_qwertyuiop_asdfghjkl"
>>> s6 = "12345689_qwertyuiop_asdfghjkl"
>>> s7 = s5 * 1
>>> s8 = s6 * 1
>>> s9 = s5 * 2
>>> s10 = s6 * 2
>>> id(s1),id(s2),id(s3),id(s4),id(s5),id(s6),id(s7),id(s8),id(s9),id(s10)
(1780956457520, 1780956457520, 1780998980144, 1780998980464, 1780998777072, 1780998777072, 1780998777072, 1780998777072, 1780998855120, 1780998751152)
# s1 和 s2 相同，s3 和 s4 不同，s5、s6、s7、s8 相同，s9 和 s10 不同。

指定驻留。指定驻留是你可以指定任意的字符串加入到小数据池中，让其只在内存中创建一个对象，多个变量都是指向这一个字符串
1
2
3
4
from sys import intern a = intern('hello!@'*20) b = intern('hello!@'*20) print(a is b) # True

优点：能够提高一些字符串，整数处理人物在时间和空间上的性能；需要值相同的字符串，整数的时候，直接从”池”里拿来用，避免频繁的创建和销毁，提升效率，节约内存

缺点: 在”池”中创建或者插入新的内容会花费更多的时间。

小结

如果在同一代码块下，则采用同一代码块下的换缓存机制。
如果是不同代码块，则采用小数据池的驻留机制。
缓存和小数据池只针对整数、字符串、布尔值。其他的数据类型不存在，如列表、元祖等，即使里面只有一个值，赋值时内存地址不一样。

Reference

https://www.shuzhiduo.com/A/VGzlQyQNJb/

Python

#Python

Python 之代码块和小数据池

https://flepeng.github.io/021-Python-41-原理-Python-之代码块和小数据池/

作者

Lepeng

发布于

2016年8月11日

许可协议

Python 之 dict 底层实现上一篇

Python 之垃圾回收机制下一篇