详解 Python 的 “==” 和 “is”

Python中比较两个对象是否相等,一共有两种方法,简单来说,它们的区别如下:

  1. is是比较两个引用是否指向了同一个对象(引用比较)。
  2. ==是比较两个对象是否相等。

实现原理

is比较的是两者是否是同一个对象,所以比较的是内存地址(id是否相同)。

Python文档3.1 对象、值和类型中是这样说的:

每个变量都有标识、类型和值。对象一旦创建,它的标识绝不会变;你可以把标识理解为对象在内存中的地址。is运算符比较两个对象的标识;id()返回对象标识的证书标识。

对象ID真正的意义在不同的实现中也不同,在CPython中,id()返回的对象的内存地址,在其他解释器中可能是别的意义。但重要的是,它一定能表示唯一的对象并且在对象的生命周期内不变,不同对象的标识一定是不一样的。

==是值比较。不可变对象,例如int,str,它会直接进行值比较。对于Python已知的对象,会调用他们的__eq__函数来比较。(其实已知的对象应该也是通过内置的__eq__函数来比较的)。对于自定义的对象,如果实现了__eq__函数,就会使用它比较,如果没有实现,效果和==是一样的。

对象缓存机制

Python会对比较小的对象缓存,下次用到比较小的对象时,会去缓存区查找,如果找到,不会再开辟新的内存,而是继续把小对象的地址赋给新的值。例子:

通过计算得到的赋值,不会使用缓存区。从第一个代码示例中可以看出。

对于字符串,你可以通过使用intern函数强制使用缓存区。

总结

这一段总结引用自《Fluent Python》,我觉得写的非常好:

is运算符比==快,因为它不能被重载,所以Python不必寻找并调用特殊方法,而是直接比较两个证书id。而a == b 则是一个语法糖,等同于a.__eq__(b)。继承自object的__eq__方法比较两个对象的id,结果与is一样。但是多数内置类型使用更有意义的方法覆盖了__eq__方法,会考虑对象属性的值。相等性测试可能涉及大量处理工作,例如,比较大型集合或嵌套层级深的结构时。

参考

  1. Is there a difference between == and is in Python?
  2. python源码学习(八)——string对象的intern机制
  3. 比较python类的两个instance(对象) 是否相等
  4. 《Fluent Python》8.2 标志、相等性和别名
 

Apache2 AH00558 警告解决办法

Apache2 在Ubuntu下有下面的警告:

如果是在服务器端,那么127.0.0.1就是你的服务器内网IP。

查了一下资料,在/etc/apache2/httpd.conf文件中添加一行ServerName localhost就可以解决,但是我在Ubuntu下并没有找到httpd.conf配置文件。


解决方法:在Ubuntu下,相应的文件应该是apache2配置目录(默认是/etc/apache2/)下面的apache2.conf。所以搞定这个警告的具体步骤如下:

参考:https://aslamnajeebdeen.com/how-to-fix-apache-could-not-reliably-determine-the-servers-fully-qualified-domain-name-using-127011-for-servername-error-on-ubuntu

 

Mac pyenv安装失败的解决办法

写了很久的Python2,今天被Python3 *等特性吸引了,忍不住想试一下。

在MAC OS X上Python的多版本共存,我们可以使用pyenv来解决,配合virtualenv,可以轻松搭建多个虚拟环境。

但是安装的时候,遇到了两个问题。

在官网的issues#429发现,用下面的方式解决。

然后又遇到了下面的问题:

然后又查到了issue#451,应该使用下面的命令来安装。

然后,就安装成功了。


如果需要使用虚拟环境,可以使用下面的命令安装pyenv-virtualenv插件,然后新建虚拟环境。

以这样的方式新建的虚拟环境,位置在~/.pyenv/versions如果使用pycharm的话,可以从这个路径导入。

 

Python对Json的解析

什么是Json

Json是一种常用的数据交换结构,由于轻量、易于阅读和编写等特点,在网络方面应用很广。

它的格式一般是这样的:

对象是一个无序的“‘名称/值’对”集合。一个对象以“{”(左括号)开始,“}”(右括号)结束。每个“名称”后跟一个“:”(冒号);“‘名称/值’ 对”之间使用“,”(逗号)分隔。

例如下面这样:

它的值可以是双引号括起来的字符串(string)、数值(number)、truefalsenull、对象(object)或者数组(array)。这些结构可以嵌套。

使用Python编码和解析Json

Python内置了json包来帮助我们完成对json的操作。

将Python的字典结构导出到json使用json.dumps(),将json读成Python的字典结构,使用json.loads()

如果不是针对string操作而是对文件操作,分别使用json.load()函数和json.dump()函数。

默认的类型对应如下:

JSON Python
object dict
array list
string unicode
number (int) int, long
number (real) float
true True
false False
null None

其他数据类型与Json之间的编码和解码

一般来说,Python对json的解析是listdict之间的操作,如果需要其他类型与json之间转换,就需要object_hook参数。先定义一个类,将类的字典初始化成json的key-value键值对。这样,json的参数就变成了类的属性。

还可以通过指定“函数”来进行转换。

用函数来指定序列化的方法,即将对象的“属性-值”对变成字典对,函数返回一个字典,然后json.dumps会格式化这个字典。

如果是通过函数将json变成对象,首先获得类名,然后通过__new__来创建一个对象(不调用初始化函数),然后将json字典的各个属性赋给对象。

使用方法如下:

参考

 

JavaScript异步执行的坑

今天被JavaScript的异步执行坑了一把。

情况是这样的,我要接入云片网的短信接口。此平台为了防止自己的客户被短信轰炸机利用,要求客户在发送验证码之前必须要求验证码验证。于是我写了个先验证验证码然后才能点击“发送短信”按钮的程序。

ifenglv-loginpage

用户输入验证码之后,点击按钮,手机收到验证码。图片验证码的输入检测是这样的:一旦焦点离开input,就发送ajax到后台验证是否正确:

然后发现问题了:如果访客在输入验证码之后直接点击“发送按钮”。那么,焦点就直接从input离开,然后触发了按钮事件,并不会触发ajax去后台验证(正常的流程应该是点击空白区域失去焦点,验证通过,然后再点击按钮)。

于是我的做法是,按钮点击之后,先验证验证码一次,然后再触发发送短信

然而,结果依然是不会验证,仿佛验证验证码的代码没有执行。我在验证码的函数中打印出调试信息,却显示的确执行了。


最后发现,原来是因为“异步执行”。

在浏览器端,耗时很长的操作都应该异步执行,避免浏览器失去响应,最好的例子就是Ajax操作。在服务器端,”异步模式”甚至是唯一的模式,因为执行环境是单线程的,如果允许同步执行所有http请求,服务器性能会急剧下降,很快就会失去响应。

所以说,ajax的代码是异步执行的。在执行“验证码函数”的时候,点击按钮事件函数依然继续执行。到快执行完的时候,ajax这边也得到服务器的回复了,通过了验证。然而按钮事件却以“验证码未通过”执行完了函数。

现在我才知道这个“异步执行”是什么意思了。函数为了不阻塞,把剩下的事情教给callback函数来做,自己继续做剩下的事情。这个“同步执行”的编程很不一样,无法控制他们先做完这个、再做这个。但是无疑这提高了浏览器的响应能力。

参考:Javascript异步编程的4种方法


170113更新:最近又被坑到了,还是要怪自己不注意啊。

开发的过程中遇到一个bug,困扰了好久,有一个日历,需要根据issue显示日历中每一天的事件,现象是有的时候显示得出来,有时候显示不出来。仔细研究了一下,发现原来有两个地方有ajax调用,两个ajax收到结果之后都会更新同一个变量,其中一次更新是对的,一次是错的。如果错的比快的慢,那么后返回的错误的结果就会覆盖正确的……,改掉就好了。