详解 Python 的 “==” 和 “is”

Python中比较两个对象是否相等,一共有两种方法,简单来说,它们的区别如下:

  1. is是比较两个引用是否指向了同一个对象(引用比较)。
  2. ==是比较两个对象是否相等。

实现原理

is比较的是两者是否是同一个对象,所以比较的是内存地址(id是否相同)。

Python文档3.1 对象、值和类型中是这样说的:

每个变量都有标识、类型和值。对象一旦创建,它的标识绝不会变;你可以把标识理解为对象在内存中的地址。is运算符比较两个对象的标识;id()返回对象标识的证书标识。

对象ID真正的意义在不同的实现中也不同,在CPython中,id()返回的对象的内存地址,在其他解释器中可能是别的意义。但重要的是,它一定能表示唯一的对象并且在对象的生命周期内不变,不同对象的标识一定是不一样的。

==是值比较。不可变对象,例如int,str,它会直接进行值比较。对于Python已知的对象,会调用他们的__eq__函数来比较。(其实已知的对象应该也是通过内置的__eq__函数来比较的)。对于自定义的对象,如果实现了__eq__函数,就会使用它比较,如果没有实现,效果和==是一样的。

对象缓存机制

Python会对比较小的对象缓存,下次用到比较小的对象时,会去缓存区查找,如果找到,不会再开辟新的内存,而是继续把小对象的地址赋给新的值。例子:

通过计算得到的赋值,不会使用缓存区。从第一个代码示例中可以看出。

对于字符串,你可以通过使用intern函数强制使用缓存区。

总结

这一段总结引用自《Fluent Python》,我觉得写的非常好:

is运算符比==快,因为它不能被重载,所以Python不必寻找并调用特殊方法,而是直接比较两个证书id。而a == b 则是一个语法糖,等同于a.__eq__(b)。继承自object的__eq__方法比较两个对象的id,结果与is一样。但是多数内置类型使用更有意义的方法覆盖了__eq__方法,会考虑对象属性的值。相等性测试可能涉及大量处理工作,例如,比较大型集合或嵌套层级深的结构时。

参考

  1. Is there a difference between `==` and `is` in Python?
  2. python源码学习(八)——string对象的intern机制
  3. 比较python类的两个instance(对象) 是否相等
  4. 《Fluent Python》8.2 标志、相等性和别名


Leave a comment

您的电子邮箱地址不会被公开。 必填项已用 * 标注