保留TFIDF结果以使用Scikit for Python预测新内容

我通过保存成功保存了功能列表vectorizer.vocabulary_，并通过CountVectorizer(decode_error="replace",vocabulary=vectorizer.vocabulary_)

以下代码：

corpus = np.array(["aaa bbb ccc", "aaa bbb ddd"])
vectorizer = CountVectorizer(decode_error="replace")
vec_train = vectorizer.fit_transform(corpus)
#Save vectorizer.vocabulary_
pickle.dump(vectorizer.vocabulary_,open("feature.pkl","wb"))

#Load it later
transformer = TfidfTransformer()
loaded_vec = CountVectorizer(decode_error="replace",vocabulary=pickle.load(open("feature.pkl", "rb")))
tfidf = transformer.fit_transform(loaded_vec.fit_transform(np.array(["aaa ccc eee"])))

这样可行。tfidf具有与训练数据相同的特征长度。

python 2022/1/1 18:44:22 有313人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

JPA：如何将字符串保留到数据库字段中，键入MYSQL Text

JPA：如何将字符串保留到数据库字段中，键入MYSQL Text

MySQL 2022-01-01 858
即使一对多关系上的orphanRemoval = true，孤儿仍保留在数据库中（JPA /休眠）

即使一对多关系上的orphanRemoval = true，孤儿仍保留在数据库中（JPA /休眠）

其他 2022-01-01 970
重新使用保留字作为属性名称

重新使用保留字作为属性名称

其他 2022-01-01 651
CSS3-3D翻转动画-IE10转换原点：保留3D解决方法

CSS3-3D翻转动画-IE10转换原点：保留3D解决方法

CSS 2022-01-01 679
有没有办法删除div但保留其元素？

有没有办法删除div但保留其元素？

其他 2022-01-01 827
c＃在保留宽高比的同时将图像调整为不同大小

c＃在保留宽高比的同时将图像调整为不同大小

c# 2022-01-01 758
执行命令而不将其保留在历史记录中

执行命令而不将其保留在历史记录中

其他 2022-01-01 598
PHP：在保留键而不是重新索引的同时合并两个数组？

PHP：在保留键而不是重新索引的同时合并两个数组？

php 2022-01-01 805
在proguard中，如何保留一组类的方法名称？

在proguard中，如何保留一组类的方法名称？

其他 2022-01-01 753
将SQL保留在存储的Procs与代码中有什么优缺点？

将SQL保留在存储的Procs与代码中有什么优缺点？

SQLServer 2022-01-01 731
哪些操作可以保留顺序

哪些操作可以保留顺序

其他 2022-01-01 669
如何使用javascript擦除所有内联样式，而仅保留CSS样式表中指定的样式？

如何使用javascript擦除所有内联样式，而仅保留CSS样式表中指定的样式？

javascript 2022-01-01 611
“清除”是Javascript中的保留字吗？

“清除”是Javascript中的保留字吗？

javascript 2022-01-01 583
MAMP在哪里保留其php.ini？

MAMP在哪里保留其php.ini？

php 2022-01-01 577
在HTML中选择后持久保留范围对象的更改

在HTML中选择后持久保留范围对象的更改

其他 2022-01-01 587
MAP_NORESERVE的mmap是否保留物理内存？

MAP_NORESERVE的mmap是否保留物理内存？

其他 2022-01-01 622
JPA OneToMany与CascadeType一起保留。ALL不会保留子项

JPA OneToMany与CascadeType一起保留。ALL不会保留子项

dotnet 2022-01-01 585
使用JPA在PostgreSQL中保留UUID

使用JPA在PostgreSQL中保留UUID

SQLServer 2022-01-01 542
sed中的“保留空间”和“模式空间”的概念

sed中的“保留空间”和“模式空间”的概念

其他 2022-01-01 642
如何在Hibernate的HQL中转义保留字

如何在Hibernate的HQL中转义保留字

其他 2022-01-01 608

保留TFIDF结果以使用Scikit for Python预测新内容

撰写回答

推荐问题

JPA：如何将字符串保留到数据库字段中，键入MYSQL Text

即使一对多关系上的orphanRemoval = true，孤儿仍保留在数据库中（JPA /休眠）

重新使用保留字作为属性名称

CSS3-3D翻转动画-IE10转换原点：保留3D解决方法

有没有办法删除div但保留其元素？

c＃在保留宽高比的同时将图像调整为不同大小

执行命令而不将其保留在历史记录中

PHP：在保留键而不是重新索引的同时合并两个数组？

在proguard中，如何保留一组类的方法名称？

将SQL保留在存储的Procs与代码中有什么优缺点？

哪些操作可以保留顺序

如何使用javascript擦除所有内联样式，而仅保留CSS样式表中指定的样式？

“清除”是Javascript中的保留字吗？

MAMP在哪里保留其php.ini？

在HTML中选择后持久保留范围对象的更改

MAP_NORESERVE的mmap是否保留物理内存？

JPA OneToMany与CascadeType一起保留。ALL不会保留子项

使用JPA在PostgreSQL中保留UUID

sed中的“保留空间”和“模式空间”的概念

如何在Hibernate的HQL中转义保留字

分类汇总

您的鼓励是对我最大的支持