概述
ID year_month_id Class 1 201612 A 2 201612 D 3 201612 B 4 201612 Other 5 201612 Other 6 201612 Other 7 201612 A 8 201612 Other 9 201612 A 1 201701 B
因此,ID可以在特定月份的任何课程中,下个月他的课程可能会发生变化.
现在我要做的是为每个ID获取它在特定类下的月数以及它所属的最新类.如下所示:
ID Class_A Class_B Class_D Other Latest_Class 1 2 3 4 0 B 2 12 0 0 0 D
我如何在python中实现这一点.
有人可以帮我这个吗?
此外,由于真实数据集很大并且无法手动验证,我如何才能获得超过1类的ID列表?
ndf = df.pivot_table(index=['ID'],columns=['Class'],aggfunc='count',fill_value=0)\ .xs('year_month_id',axis=1,drop_level=True) ndf['latest'] = df.sort_values('ID').groupby('ID')['Class'].tail(1).values Class A B D Other latest ID 1 1 1 0 0 B 2 0 0 1 0 D 3 0 1 0 0 B 4 0 0 0 1 Other 5 0 0 0 1 Other 6 0 0 0 1 Other 7 1 0 0 0 A 8 0 0 0 1 Other 9 1 0 0 0 A
总结
以上是编程之家为你收集整理的python – 使用pandas按组获取计数全部内容,希望文章能够帮你解决python – 使用pandas按组获取计数所遇到的程序开发问题。
如果您也喜欢它,动动您的小指点个赞吧