HashMap就是这么简单【源码剖析】

阅读量：5352 次

发布时间：2019-06-15

本文共 2122 字，大约阅读时间需要 7 分钟。

前言

声明，本文用得是jdk1.8

前面已经讲了Collection的总览和剖析List集合以及散列表、Map集合、红黑树的基础了：

本篇主要讲解HashMap，以及涉及到一些与hashtable的比较~

看这篇文章之前最好是有点数据结构的基础：

当然了，如果讲得有错的地方还请大家多多包涵并不吝在评论去指正～

一、HashMap剖析

首先看看HashMap的顶部注释说了些什么：

162af937c93cdef6?w=1918&h=3204&f=png&s=401056

再来看看HashMap的类继承图：

162af938010aba80?w=653&h=336&f=png&s=10307

下面我们来看一下HashMap的属性：

162af937c760a707?w=941&h=810&f=png&s=70500

成员属性有这么几个：

162af937fb0ec0da?w=512&h=156&f=png&s=5947

再来看一下hashMap的一个内部类Node：

162af9380220c754?w=1076&h=764&f=png&s=41254

我们知道Hash的底层是散列表，而在Java中散列表的实现是通过数组+链表的~

再来简单看看put方法就可以印证我们的说法了：数组+链表-->散列表

162af93802eac5e0?w=820&h=86&f=png&s=5384

我们可以简单总结出HashMap：

无序，允许为null，非同步

底层由散列表(哈希表)实现

初始容量和装载因子对HashMap影响挺大的，设置小了不好，设置大了也不好

1.1HashMap构造方法

HashMap的构造方法有4个：

在上面的构造方法最后一行，我们会发现调用了tableSizeFor()，我们进去看看：

这是位运算算法，具体流程可参考：

看完上面可能会感到奇怪的是：为啥是将2的整数幂的数赋给threshold？

threshold这个成员变量是阈值，决定了是否要将散列表再散列。它的值应该是：capacity * load factor才对的。

其实这里仅仅是一个初始化，当创建哈希表的时候，它会重新赋值的：

162af938b6338ab4?w=1021&h=150&f=png&s=11210

至于别的构造方法都差不多，这里我就不细讲了：

162af938b67cf682?w=1164&h=716&f=png&s=38464

1.2put方法

put方法可以说是HashMap的核心，我们来看看：

162af938d92f7922?w=1199&h=193&f=png&s=14926

我们来看看它是怎么计算哈希值的：

162af93916375d72?w=1387&h=579&f=png&s=24464

为什么要这样干呢？？我们一般来说直接将key作为哈希值不就好了吗，做异或运算是干嘛用的？？

我们看下来：

162af93924747fde?w=1076&h=434&f=png&s=26670

我们是根据key的哈希值来保存在散列表中的，我们表默认的初始容量是16，要放到散列表中，就是0-15的位置上。也就是tab[i = (n - 1) & hash]。可以发现的是：在做&运算的时候，仅仅是后4位有效~那如果我们key的哈希值高位变化很大，低位变化很小。直接拿过去做&运算，这就会导致计算出来的Hash值相同的很多。

而设计者将key的哈希值的高位也做了运算(与高16位做异或运算，使得在做&运算时，此时的低位实际上是高位与低位的结合)，这就增加了随机性，减少了碰撞冲突的可能性！

下面我们再来看看流程是怎么样的：

162af93963a2de0e?w=1918&h=1575&f=png&s=191878