如果从字面上看您的歌曲示例,一种方法是将输入简化为位向量指纹,然后在数据库中查找该指纹??作为精确匹配。您可以通过从输入中提取多个指纹和/或尝试使用所有比您的指纹仅1或位错误的位向量来增加找到合适匹配项的机会。
如果您有权访问ACM数字图书馆,则可以在acm = 1321038137_73cd62cf2b16cd73ca9070e7d5ea0744“>http://delivery.acm.org/10.1145/1150000/1145312/上的“ Shazam音乐识别服务”中阅读这种方法的说明。 p44-wang.pdf?ip = 94.195.253.182&acc = ACTIVE%20SERVICE&CFID = 53180383&CFTOKEN = 41480065& = 1321038137_73cd62cf2b16cd73ca9070e7d5ea0744.http://www.music.mcgill.ca/~alastair/print- sumer/inger-sumer .pdf。
您描述的输入格式建议您可以使用http://en.wikipedia.org/wiki/Locality_sensitive_hashing中描述的随机投影方法执行某些操作。
要回答第二个问题,具体取决于位置的确切含义,您可以考虑降低数字以哈希由位或字符组成的指纹,并将其存储在文本搜索数据库中,例如Apache Lucene。