这篇文章将为大家详细讲解有关hash在MySQL中解决数据碰撞的方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
创新互联公司专业为企业提供盂县网站建设、盂县做网站、盂县网站设计、盂县网站制作等企业网站建设、网页设计与制作、盂县企业网站模板建站服务,10年盂县做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。
下面我们先讲讲hash的定义以及特点,再用它mysql中解决数据碰撞的问题。
Hash数据碰撞
考虑这个数据库表 user,表中一共有 7 个数据,我们需要检索 id=7 的数据,SQL 语法是:
select \* from user where id=7;
哈希算法首先计算存储 id=7 的数据的物理地址 addr=hash(7)=4231,而 4231 映射的物理地址是 0x77,0x77 就是 id=7 存储的额数据的物理地址,通过该独立地址可以找到对应 user_name='g'这个数据。这就是哈希算法快速检索数据的计算过程。
但是哈希算法有个数据碰撞的问题,也就是哈希函数可能对不同的 key 会计算出同一个结果,比如 hash(7)可能跟 hash(199)计算出来的结果一样,也就是不同的 key 映射到同一个结果了,这就是碰撞问题。解决碰撞问题的一个常见处理方式就是链地址法,即用链表把碰撞的数据接连起来。计算哈希值之后,还需要检查该哈希值是否存在碰撞数据链表,有则一直遍历到链表尾,直达找到真正的 key 对应的数据为止。
Hash定义
Hash也被称为散列、哈希,对应的英文都是Hash.他们的基本原理都是把任意长度的输入,通过Hash算法变成固定长度的输出.这个映射的规则就是对应的Hash算法,而原始数据映射之后的二进制串就是哈希值. 经常使用的Hash算法有MD5和SHA,他们都是历史悠久的Hash算法。
String s = "Hash算法"; System.err.println(md5(s)); // 输出结果:f1ab62697296f0b575b9229dba7ea1ba
Hash算法的特点
从Hash值不可以反向推导出原始的数据
经过Hash映射之后的数据和原始数据没有对应关系
Hash算法的执行效率要高效,长的文本或字符串能够很快的计算出哈希值
输入数据的微小变化会得到完全不同的Hash值,相同的数据会得到相同的值
这里也可以说Hash算法的**抗篡改能力:对于一个数据块,哪怕只修改一个比特位,其Hash值的改动也会非常大. **
在我们用公式计算不同项数值的时候,发现前面的数值和后面某一项的结果一致,在mysql处理数据时小编遇到了这种情况,这就要用到哈希算法来解决,因为涉及到的是数据碰撞的情况。
关于“hash在mysql中解决数据碰撞的方法”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。