Python中比较两个对象是否相等,一共有两种方法,简单来说,它们的区别如下:
is
是比较两个引用是否指向了同一个对象(引用比较)。==
是比较两个对象是否相等。
1 2 3 4 5 6 7 8 9 10 11 |
>>> a = [1, 2, 3] >>> b = a >>> b is a # a的引用复制给b,他们在内存中其实是指向了用一个对象 True >>> b == a # 当然,他们的值也是相等的 True >>> b = a[:] # b通过a切片获得a的部分,这里的切片操作重新分配了对象, >>> b is a # 所以指向的不是同一个对象了 False >>> b == a # 但他们的值还是相等的 True |
实现原理
is
比较的是两者是否是同一个对象,所以比较的是内存地址(id是否相同)。
Python文档3.1 对象、值和类型中是这样说的:
每个变量都有标识、类型和值。对象一旦创建,它的标识绝不会变;你可以把标识理解为对象在内存中的地址。is运算符比较两个对象的标识;id()返回对象标识的证书标识。
对象ID真正的意义在不同的实现中也不同,在CPython中,id()返回的对象的内存地址,在其他解释器中可能是别的意义。但重要的是,它一定能表示唯一的对象并且在对象的生命周期内不变,不同对象的标识一定是不一样的。
==
是值比较。不可变对象,例如int,str,它会直接进行值比较。对于Python已知的对象,会调用他们的__eq__
函数来比较。(其实已知的对象应该也是通过内置的__eq__
函数来比较的)。对于自定义的对象,如果实现了__eq__
函数,就会使用它比较,如果没有实现,效果和==
是一样的。
对象缓存机制
Python会对比较小的对象缓存,下次用到比较小的对象时,会去缓存区查找,如果找到,不会再开辟新的内存,而是继续把小对象的地址赋给新的值。例子:
1 2 3 4 5 6 7 8 9 |
>>> c = 1 >>> d = 1 >>> print(c is d) True >>> 1000 is 10**3 False >>> 1000 == 10**3 True |
通过计算得到的赋值,不会使用缓存区。从第一个代码示例中可以看出。
对于字符串,你可以通过使用intern
函数强制使用缓存区。
总结
这一段总结引用自《Fluent Python》,我觉得写的非常好:
is运算符比==快,因为它不能被重载,所以Python不必寻找并调用特殊方法,而是直接比较两个证书id。而a == b 则是一个语法糖,等同于
a.__eq__(b)
。继承自object的__eq__
方法比较两个对象的id,结果与is一样。但是多数内置类型使用更有意义的方法覆盖了__eq__
方法,会考虑对象属性的值。相等性测试可能涉及大量处理工作,例如,比较大型集合或嵌套层级深的结构时。
参考
- Is there a difference between `==` and `is` in Python?
- python源码学习(八)——string对象的intern机制
- 比较python类的两个instance(对象) 是否相等
- 《Fluent Python》8.2 标志、相等性和别名