在Naive Bayes中使用稀疏矩阵/在线学习(Python,scikit)

5b51 2022/1/14 8:20:56 python 字数 2172 阅读 472 来源 www.jb51.cc/python

我正在尝试在数据集上做Naive Bayes,该数据集有超过6,000,000个条目,每个条目有150k的特征.我试图从以下链接实现代码：Implementing Bag-of-Words Naive-Bayes classifier in NLTK问题是(据我所知),当我尝试使用dok_matrix作为参数运行train-method时,它无法找到iter

概述

我正在尝试在数据集上做Naive Bayes,该数据集有超过6,000,000个条目,每个条目有150k的特征.我试图从以下链接实现代码：
Implementing Bag-of-Words Naive-Bayes classifier in NLTK

问题是(据我所知),当我尝试使用dok_matrix作为参数运行train-method时,它无法找到iterkeys(我已将OrderedDict的行与标签配对)：

Traceback (most recent call last):
  File "skitest.py",line 96,in 
  
   __getattr__
    return _cs_matrix.
   __getattr__(self,attr)
  File "/usr/lib/python2.6/dist-packages/scipy/sparse/base.py",line 429,in 
   __getattr__
    raise AttributeError,attr + " not found"
AttributeError: iterkeys not found

我的问题是,有没有办法通过条目(在线)教授分类器条目来避免使用稀疏矩阵,还是有一种稀疏矩阵格式,我可以在这种情况下有效地使用而不是dok_matrix？还是我错过了一些明显的东西？

谢谢你的时间.

总结

以上是编程之家为你收集整理的在Naive Bayes中使用稀疏矩阵/在线学习(Python,scikit)全部内容，希望文章能够帮你解决在Naive Bayes中使用稀疏矩阵/在线学习(Python,scikit)所遇到的程序开发问题。

如果您也喜欢它,动动您的小指点个赞吧

除非注明，文章均由 laddyq.com 整理发布，欢迎转载。

转载请注明：
链接：http://laddyq.com
来源：laddyq.com
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

在Naive Bayes中使用稀疏矩阵/在线学习(Python,scikit)

概述

总结

分类汇总

您的鼓励是对我最大的支持