看一下MurmurHash3的128位变体。该算法的页面包含一些性能数字。应该可以将其纯粹地或作为C扩展移植到Python。(作者建议 使用128位变体,并丢弃不需要的位)。
如果MurmurHash2 64位适合您,则pyfasthash包中有一个Python实现(C扩展),其中包括一些其他非加密哈希变体,尽管其中一些仅提供32位输出。
我为Murmur3哈希函数做了一个快速的Python包装器。Github项目在这里,您也可以在Python Package Index上找到它; 它只需要一个C ++编译器即可构建;无需增强。
使用示例和时间比较:
import murmur3
import timeit
# without seed
print murmur3.murmur3_x86_64('samplebias')
# with seed value
print murmur3.murmur3_x86_64('samplebias', 123)
# timing comparison with str __hash__
t = timeit.Timer("murmur3.murmur3_x86_64('hello')", "import murmur3")
print 'murmur3:', t.timeit()
t = timeit.Timer("str.__hash__('hello')")
print 'str.__hash__:', t.timeit()
输出:
15662901497824584782
7997834649920664675
murmur3: 0.264422178268
str.__hash__: 0.219163894653