hash算法

发布网友发布时间：2022-05-23 07:53

共2个回答

热心网友时间：2023-10-17 05:13

有一点你搞错了。Hash算法不是为了快速找出相同的元素，而是为了快速判断两个元素不相等。
所有散列函数都有如下一个基本特性：如果两个散列值是不相同的（根据同一函数），那么这两个散列值的原始输入也是不相同的。这个特性是散列函数具有确定性的结果。但另一方面，散列函数的输入和输出不是一一对应的，如果两个散列值相同，两个输入值很可能是相同的，但并不能绝对肯定二者一定相等。

例如：设计一个针对字符串的Hash算法，简单地返回字符串的首字母：
def Hash_string(str):
return str[0]
那么：
Hash_string(a)=Hash(gfdgfd)=g
Hash_string(b)=Hash(xzcfs)=x

这样就可以最快速地判断出两个字符串不相等。这个Hash算法常用于将大量文件分散存储。

对于首字母相同的两个字符串，本算法得到的Hash值肯定相同，这就是出现了命中冲突。解决命中冲突有很多策略，比如：再散列法、链地址法、公共溢出法……等等。

一个好的Hash算法，应该保证高命中率和均匀分布。

热心网友时间：2023-10-17 05:14

找相同字符：
把字符串分成单字符数组；
for(i=0;i<a.length();i++){
for(j=0;j<.length().j++){
if(a[i]=b[j])
print(a[i]);
}}