当您使用读取文件时readlines()
,生成的列表元素确实具有尾随换行符。这很可能就是您比预期少匹配的原因。
而不是写
for x in list:
写
for x in (s.strip() for s in list):
这将从中的字符串中删除前导和尾随空格list
。因此,它从字符串中删除结尾的换行符。
为了整合您的程序,您可以执行以下操作:
with open('c:/tmp/textfile.TXT') as f:
haystack = f.read()
if not haystack:
sys.exit("Could not read haystack data :-(")
with open('c:/tmp/list.txt') as f:
for needle in (line.strip() for line in f):
if needle in haystack:
print(needle, ',one_sentence')
else:
print(needle, ',another_sentence')
我不想做出太大的改变。最重要的区别是我在这里通过with
语句使用上下文管理器。它可以确保为您正确处理文件(主要是关闭文件)。同样,使用生成器表达式动态删除“ needle”行。上述方法逐行读取并处理针文件,而不是一次将整个文件加载到内存中。当然,这仅对大文件有所不同。