自定义对象作为HashMap的Key问题
作者:浮华饰浮华 时间:2022-11-06 02:52:30
自定义对象作为HashMap的Key
这个问题在很多面试者面试时都会被提及,本人也是最近在看effective java第九条:覆盖equals时总要覆盖hashcode回想到了当初面试时也被问到了这个问题.于是动手写了几行代码,还真发现了一些小的问题,所以拿出来分享一下!
首先我们自定义一个学生对象,它有姓名和年龄两个字段.
class Student{
public String name;
public Integer age;
Student(String name,Integer age){
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
//return true;
if(o==this)
return true;
if(!(o instanceof Student))
return false;
Student s = (Student)o;
return s.name.equals(name)&&s.age.equals(age);
}
@Override
public int hashCode() {
int result = 17;
result = 31 * result + name.hashCode();
result = 31 * result + age;
return result;
}
}
(PS)上面的代码是一个能作为hashMap的key对象的完整代码.包括重写了equals方法和hashCode方法.在重写equals方法时我还遇到了一个麻烦事,一开始我是下面这样写的:
@Override
public boolean equals(Object o) {
//***********
return s.name.equals(name)&&s.age==age;
}
相信都能找到原因,age是Integer对象而不是int所以比较的是地址值,于是乎无论如何都不能得到我想要的结果.
然后我们接着把对象装入HashMap结构中,并取出,看是否能够成功?
static void demo2(){
Map<Student, String> map = new HashMap<Student, String>();
long l1 = System.currentTimeMillis();
for(int i = 0;i<10000;i++){
map.put(new Student("dy"+i, i), ""+i);
}
long l2 = System.currentTimeMillis();
System.out.println(map.get(new Student("dy9999",9999)));
long l3 = System.currentTimeMillis();
System.out.println((l2-l1));
System.out.println((l3-l2));
}
结果如下
9999
8
0
已经成功了!
那么可能有点新的问题了!那就是Student对象的hashCode方法是怎么实现的呢?equals方法大家都会重写.那么究竟怎么一个算法能让不同的对象具有不同的散列值呢?下面这段描述摘抄自effective java给我们的建议:
1.把某个非零的常数值,比如说17(一个你喜欢的数字),保存在一个名为result的int类型的变量中.
2.对于对象中每个关键域(指equals方法中涉及的每个域),完成以下步骤:
a.为该域计算int类型的散列码c:
i.如果该域是boolean类型,则计算(f?1:0)
ii.如果该域是byte,char,short或者int类型,则计算(int)f.
iii.如果该域是long类型,则计算(int)(f^(f>>>32)).
iv.如果该域是float类型,则计算Float.floatToIntBits(f).
v.如果该域是double类型,则计算Double.doubleToLongBits(f),然后按照步骤2.a.iii,为得到的long类型值计算散列值.
vi.如果该域是一个对象引用,并且该类的equals方法通过递归地调用equals的方式来比较这个域,则同样为这个域递归地调用hashCode.如果需要更加复杂的比较,则为这个域计算一个"范式",然后针对这个范式调用hashCode.如果这个域的值为null,则返回0(或者其他某个常数,但通常是0).
vii.如果该域是一个数组,则要把每一个元素当做单独的域来处理.也就是说,递归地应用上述规则,对每个重要的元素计算一个散列码,然后根据步骤2.b中的做法把这些散列值组合起来.如果数组域中的每个元素都很重要,可以利用发行版本1.5中增加的其中一个Arrays.hashCode方法.
b.按照下面的公式,把步骤2.a中计算得到的散列码c合并到result中:
result = 31 * result +c;
3.返回result
当然如果我们不重写hashCode方法会出现什么情况呢?请看:
null
8
0
返回结果为null,因为Student类没有重写hashCode方法,从而导致两个相等的实例具有不相等的散列码,违反了hashCode的约定.因此put方法把对象放在一个散列桶中,而get方法却在另一个散列桶中取值.即使这两个实例恰好被放在同一个散列桶中,get方法也必定会返回null,因为HashMap有一项优化,可以将与每个相关联的散列码缓存起来,如果散列码不匹配,也不必检查对象的等同性!这正说明了effective java第九条:覆盖equals方法时总要覆盖hashCode.但是现在又有一个问题了,如果我重写的hashCode代码如下会如何呢?
@Override
public int hashCode() {
/*int result = 17;
result = 31 * result + name.hashCode();
result = 31 * result + age;*/
return 32;
}
运行的结果如下:
9999
2305
1
可以看到的是,由于每个对象都具有相同的散列值,因此,每个对象都被映射到同一个散列桶中,使散列表退化为链表,它使得本该线性时间运行的程序变成了以平方级时间在运行.
关于对象实现Compareable接口可以参考这篇文章(Java 8 HashMap键与Comparable接口).
HashMap使用自定义对象作为Key的注意点
1. 自定义对象不重写hashCode方法和equals会发生什么?
public class AboutHashMap {
public static void main(String[] args) {
Student s1 = new Student("张三",18);
Student s2 = new Student("张三",18);
System.out.println(s1.hashCode()); //21685669
System.out.println(s2.hashCode()); //2133927002
System.out.println(s1.hashCode() == s2.hashCode()); //false
System.out.println(s1.equals(s2)); //false
}
}
class Student {
private String name;
private int age;
// 省略getter,setter,有参构造
}
结论:
当我们不重写Student对象的hashCode方法和equals方法时,Student对象沿用的就是Object对象的hashCode方法和equals方法;从上面代码的测试来说,即使两个属性相同的对象他们的hash值都是不一样的,调用equals方法进行比较,他们也是不相同的。
总结:
Object对象的equals方法比较的是两个对象的内存地址。
Object类的hashCode返回对象的内存地址经过处理后得到的值,由于每个对象的内存地址都不一样,所以哈希码也不一样。
public native int hashCode();
public boolean equals(Object obj) {
return (this == obj);
}
2. 在HashMap中使用自定义对象作为key会发生什么?
public class AboutHashMap {
public static void main(String[] args) {
Student s1 = new Student("张三",18); // 两个相同属性的对象
Student s2 = new Student("张三",18);
Map<Student, Integer> hashMap = new HashMap<>();
hashMap.put(s1, 99);
// 使用属性相同的对象s2去调用get方法
System.out.println( hashMap.get(s2) ); // null
}
}
class Student {
private String name;
private int age;
// 省略getter,setter,有参构造方法,toString方法
}
分析:
我们可以发现,通过一个属性一模一样的s2去get哈希表中的元素竟然找不到前面put过的 s1-99!!!???
解释:
put入的元素在HashMap中数组结构的位置由key的hashCode方法返回值来决定,而此时自定义对象hashCode方法(未重写),返回值是由对象的内存地址值计算而来的,因此即使两个对象的属性完全相同,他们的哈希值也不同,所以即使两个属性完全相同的对象在HashMap中也完全找不到。
总结:
使用自定义对象作为HashMap的key不重写hashCode和equals方法会产生的问题
get方法:使用属性完全相同的对象作为key去get元素会找不到元素。
put方法:即使是有属性完全相同的对象put到HashMap中,也不会覆盖已有的value值,只会当作新元素加入到HashMap中
即使发生hash冲突,调用equal方法比较两个属性完全相同的对象也会返回false
所以要想顺利使用自定义对象作为hashMap的key就必须正确重写hashCode和equals方法。
3. 重写hashCode方法和equals方法的原则
equals
:
相等的两个key实例调用equals()必须返回true(相等指的是属性完全相等)。
hashCode
:
如果两个对象相等,则两个对象的hashCode()必须相等;
如果两个对象不相等,则两个对象的hashCode()尽量不要相等, (为了减少发生hash冲突的情况)。
ps:在IDEA中使用 ALT + INSERT可以快速帮我们实现equals和hashcode方法
class Student {
private String name;
private int age;
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return age == student.age && name.equals(student.name);
}
@Override
public int hashCode() {
return Objects.hash(name, age);
}
}
来源:https://blog.csdn.net/qq_33300026/article/details/83576134