这个问题似乎是一年前的事了,但是由于它仍然是公开的,所以这里有一个更新。pandas引入了categorical
dtype,其操作与factors
R中的非常相似。请参见此链接以获取更多信息:
http://pandas-docs.github.io/pandas-docs- travis/categorical.html
从上面的链接中复制一个片段,该片段显示了如何在熊猫中创建“ factor”变量。
In [1]: s = Series(["a","b","c","a"], dtype="category")
In [2]: s
Out[2]:
0 a
1 b
2 c
3 a
dtype: category
Categories (3, object): [a < b < c]