如果您应用某种集合论(如果我正确地解释了您的问题),您会发现想要的三元组只是元素的[2:5],[4:7],[6:8]等元素该token
列表。
您可以这样生成它们:
>>> new_trigrams = []
>>> c = 2
>>> while c < len(token) - 2:
... new_trigrams.append((token[c], token[c+1], token[c+2]))
... c += 2
>>> print new_trigrams
[('are', 'you', '?'), ('?', 'i', 'am'), ('am', 'fine', 'and')]