概述
|group| |sequence|
A BX
A X
B SFS
B BCX
B BSS*B1S
A BBX
我想要一些方法来分组和找到每个角色的频率,得到这样的东西:
|group| |char| |freq|
A B 3
A X 3
B S 5
...
from itertools import chain
# Step 1 - flatten your dataframe
df = pd.DataFrame({
'group' : df['group'].repeat(df.sequence.str.len()),'char' : list(chain.from_iterable(df.sequence.tolist()))
})
# Step 2 - filter out characters and groupby on `group`
df[df.char.str.isalpha()].groupby(['group','char']).size().reset_index(name='freq')
group char freq
0 A B 3
1 A X 3
2 B B 3
3 B C 1
4 B F 1
5 B S 5
6 B X 1
总结
以上是编程之家为你收集整理的Python – 拆分字符串列,groupby和count字符全部内容,希望文章能够帮你解决Python – 拆分字符串列,groupby和count字符所遇到的程序开发问题。
如果您也喜欢它,动动您的小指点个赞吧