Java 问答：终极父类（四）——hashCode()

哈希码

问： hashCode()方法是用来做什么的？

答： hashCode()方法返回给调用者此对象的哈希码（其值由一个hash函数计算得来）。这个方法通常用在基于hash的集合类中，像java.util.HashMap,java.until.HashSet和java.util.Hashtable.

问：在类中覆盖equals()的时候，为什么要同时覆盖hashCode()？

答：在覆盖equals()的时候同时覆盖hashCode()可以保证对象的功能兼容于hash集合。这是一个好习惯，即使这些对象不会被存储在hash集合中。

问： hashCode()有什么一般规则？

答： hashCode()的一般规则如下：

在同一个Java程序中，对一个相同的对象，无论调用多少次hashCode()，hashCode()返回的整数必须相同，因此必须保证equals()方法比较的内容不会更改。但不必在另一个相同的Java程序中也保证返回值相同。
如果两个对象用equals()方法比较的结果是相同的，那么这两个对象调用hashCode()应该返回相同的整数值。
当两个对象使用equals()方法比较的结果是不同的，hashCode()返回的整数值可以不同。然而，hashCode()的返回值不同可以提高哈希表的性能。

问：如果覆盖了equals()却不覆盖hashCode()会有什么后果？

答：当覆盖equals()却不覆盖hashCode()的时候，在hash集合中存储对象时就会出现问题。例如，参考代码清单2.

import java.util.HashMap;
import java.util.Map;
 
final class Employee
{
   private String name;
   private int age;
 
   Employee(String name, int age)
   {
  this.name = name;
  this.age = age;
   }
 
   @Override
   public boolean equals(Object o)
   {
  if (!(o instanceof Employee))
 return false;
 
  Employee e = (Employee) o;
  return e.getName().equals(name) && e.getAge() == age;
   }
 
   String getName()
   {
  return name;
   }
 
   int getAge()
   {
  return age;
   }
}
 
public class HashDemo
{
   public static void main(String[] args)
   {
  Map<Employee, String> map = new HashMap<>();
  Employee emp = new Employee("John Doe", 29);
  map.put(emp, "first employee");
  System.out.println(map.get(emp));
  System.out.println(map.get(new Employee("John Doe", 29)));
   }
}

import java.util.HashMap;

import java.util.Map;

final class Employee

{

private String name;

private int age;

Employee(String name, int age)

{

this.name = name;

this.age = age;

}

@Override

public boolean equals(Object o)

{

if (!(o instanceof Employee))

return false;

Employee e = (Employee) o;

return e.getName().equals(name) && e.getAge() == age;

}

String getName()

{

return name;

}

int getAge()

{

return age;

}

public class HashDemo

{

public static void main(String[] args)

{

Map<Employee, String> map = new HashMap<>();

Employee emp = new Employee("John Doe", 29);

map.put(emp, "first employee");

System.out.println(map.get(emp));

System.out.println(map.get(new Employee("John Doe", 29)));

}

代码清单2声明了一个Employee类，覆盖了equals()方法但是没有覆盖hashCode()。同时声明了一个一个HashDemo类，来演示将Employee作为键存储时时产生的问题。

main()函数首先在实例化Employee之后创建了一个hashmap，将Employee对象作为键，将一个字符串作为值来存储。然后它将这个对象作为键来检索这个集合并输出结果。同样地，再通过新建一个具有相同内容的Employee对象作为键来检索集合，输出信息。

编译(javac HashDemo.java)并运行(java HashDemo)代码清单2，你将看到如下输出结果：

first employee
null

1 2	first employee null

如果hashCode()方法被正确的覆盖，你将在第二行看到first employee而不是null，因为这两个对象根据equals()方法比较的结果是相同的，根据上文中提到的规则2：如果两个对象用equals()方法比较的结果是相同的，那么这两个对象调用hashCode()应该返回相同的整数值。

问：如何正确的覆盖hashCode()？

答： Joshua Bloch的《Effective Java》第八版中给出了一个四步法来正确的覆盖hashCode()。下面的步骤和Bloch的方法类似。

声明一个int型的变量，命名为result（或者其他你喜欢的名字），然后初始化为一个不为零的常量（比如31）。使用一个不为零的常量会影响到所有的初始的哈希值（步骤2.1的结果）为零的值。【A nonzero value is used so that it will be affected by any initial fields whose hash value (computed in Step 2.1) is zero. 】如果初始的result为0的话，最后的哈希值不会被它影响到，所以冲突的几率会增加。这个非零result值是任意的。
对每一个对象中有意义的具体值（在equals（）中所涉及的值），f，进行以下步骤的处理：
1. 按照以下步骤计算f的基于int型的哈希值hc：
  - 对于一个boolean型变量，hc = f？ 0 ： 1；。
  - 对于一个byte,char,short,或者int型变量,hc = (int)f;.
  - 对于一个long型变量，hc = (int) (f ^ (f >>> 32));.这个表达式是将long型变量作为32位（long型最多有32位）来计算的；
  - 对于一个float型变量，hc = Float.floatToIntBits(f);.
  - 对于一个double型变量，long l = Double.doubleToLongBits(f); hc = (int) (l ^ (l >>> 32));.
  - 对于引用类型的变量，如果类中的equals()方法递归的调用equals()类比较成员变量，那么就递归调用hashCode()；如果需要更复杂的比较，就计算这个值的“标准表示”来脚酸标准的哈希值；如果引用类型的值为null，f = 0.
  - 对于一个数组类型的引用，将每一个元素视为单独的变量，对于每一个有意义的值，调用对应的方法计算其哈希值，最后如步骤2.2的描述那样将所有的哈希值合并。
2. 计算result = 37*result+hc，将所有的hc合并到哈希值中。乘法使哈希值取决于它的值的规则，当一个类中存在多种相似的值时，就增加了哈希表的离散性。
3. 返回result。
4. 完成hashCode()之后，要确保相同的对象调用hashCode()得到相同的哈希值。

举例说明上面这个方法，代码清单3是代码清单2的第二个版本，它的Employee类重写了hashCode()。

import java.util.HashMap;
import java.util.Map;
 
final class Employee
{
   private String name;
   private int age;
 
   Employee(String name, int age)
   {
      this.name = name;
      this.age = age;
   }
 
   @Override
   public boolean equals(Object o)
   {
      if (!(o instanceof Employee))
         return false;
 
      Employee e = (Employee) o;
      return e.getName().equals(name) && e.getAge() == age;
   }
 
   String getName()
   {
      return name;
   }
 
   int getAge()
   {
      return age;
   }
 
   @Override
   public int hashCode()
   {
      int result = 31;
      result = 37*result+name.hashCode();
      result = 37*result+age;
      return result;
   }
}
 
public class HashDemo
{
   public static void main(String[] args)
   {
      Map<Employee, String> map = new HashMap<>();
      Employee emp = new Employee("John Doe", 29);
      map.put(emp, "first employee");
      System.out.println(map.get(emp));
      System.out.println(map.get(new Employee("John Doe", 29)));
   }
}

import java.util.HashMap;

import java.util.Map;

final class Employee

{

private String name;

private int age;

Employee(String name, int age)

{

this.name = name;

this.age = age;

}

@Override

public boolean equals(Object o)

{

if (!(o instanceof Employee))

return false;

Employee e = (Employee) o;

return e.getName().equals(name) && e.getAge() == age;

}

String getName()

{

return name;

}

int getAge()

{

return age;

}

@Override

public int hashCode()

{

int result = 31;

result = 37*result+name.hashCode();

result = 37*result+age;

return result;

}

public class HashDemo

{

public static void main(String[] args)

{

Map<Employee, String> map = new HashMap<>();

Employee emp = new Employee("John Doe", 29);

map.put(emp, "first employee");

System.out.println(map.get(emp));

System.out.println(map.get(new Employee("John Doe", 29)));

}

代码清单3的Employee类中声明了两个在hashCode()都涉及到的值。覆盖的hashCode()方法首先初始化result为31，然后将String类型的name变量和int型的age变量的哈希值合并到result中，随后返回result。

编译(javac HashDemo.java)并运行(java HashDemo)代码清单3，你将看到如下输出结果：

first employee
first employee

1 2	first employee first employee

下期预告

在第三部分中，我会讨论toString（）方法和wait/notification方法。并探究Object中的方法在接口和Java8中的内容。

本文的代码可以在这里下载，代码运行环境为 Windows7，JDK7u6.

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Java 问答：终极父类（四）——hashCode()

哈希码

下期预告

相关文章:

“Java 问答：终极父类（四）——hashCode()”已经有2条评论

Leave a comment 取消回复