使用自动更正库,您需要遍历数据框的行,然后遍历给定行中的单词以应用该spell
方法。这是一个工作示例:
from autocorrect import spell
import pandas as pd
df = pd.DataFrame(["and this hass a spel error"], columns=["colTest"])
df.colTest.apply(lambda x: " ".join([spell(i) for i in x.split()]))
同样,正如@jpp在下面的注释中建议的那样,我们可以避免使用lambda
以下方法:
df["colTest"] = [' '.join([spell(i) for i in x.split()]) for x in df['colTest']]
输入内容如下所示:
colTest
0 and this hass a spel error
输出:
0 and this has a spell error
Name: colTest, dtype: object