11 |散列表（哈希表）

一、散列思想

散列表的英文叫“Hash Table”，散列表用的是数组支持按照下标随机访问数据的特性，所以散列表其实就是数组的一种扩展，由数组演化而来。可以说，如果没有数组，就没有散列表。
散列表用的就是数组支持按照下标随机访问的时候，时间复杂度是 O(1) 的特性。通过散列函数把元素的键值映射为下标，然后将数据存储在数组中对应下标的位置。当按照键值查询元素时，用同样的散列函数，将键值转化数组下标，从对应的数组下标的位置取数据。

二、散列函数

散列函数，顾名思义，它是一个函数。我们可以把它定义成 hash(key)，其中 key 表示元素的键值，hash(key) 的值表示经过散列函数计算得到的散列值。

一.设计散列函数的基本要求

1、散列函数计算得到的散列值是一个非负整数；
2、如果key1=key2，那hash(key1)==hash(key2)；
3、如果key1≠key2，那hash(key1)≠hash(key2)；

第一点理解起来应该没有任何问题。因为数组下标是从 0 开始的，所以散列函数生成的散列值也要是非负整数。
第二点也很好理解。相同的 key，经过散列函数得到的散列值也应该是相同的。
第三点理解起来可能会有问题，就是不明白为什么要这么设计。这个要求看起来合情合理，但是在真实的情况下，要想找到一个不同的 key 对应的散列值都不一样的散列函数，几乎是不可能的。即便像业界著名的MD5、SHA、CRC等哈希算法，也无法完全避免这种散列冲突。而且，因为数组的存储空间有限，也会加大散列冲突的概率。（存在k1不等于k2，但是hash(k1)=hash(k2)的可能性，要尽量的避免这一点）

二.散列冲突

再好的散列函数也无法避免散列冲突。那究竟该如何解决散列冲突问题呢？我们常用的散列冲突解决方法有两类，开放寻址法（open addressing）和链表法（chaining）。

1、开放寻址法（open addressing）

开放寻址法的核心思想是，如果出现了散列冲突，重新探测一个空闲位置，将其插入。

1.线性探测（Linear Probing）

散列表中插入数据时，如果某个数据经过散列函数散列之后，存储位置已经被占用了，就从当前位置开始，依次往后查找，看是否有空闲位置，直到找到为止。

一、散列思想​

二、散列函数​

一.设计散列函数的基本要求​

二.散列冲突​

1、开放寻址法（open addressing）​

1.线性探测（Linear Probing）​