NLTK将实体识别命名为Python列表

nltk.ne_chunk返回嵌套nltk.tree.Tree对象，因此您必须遍历该Tree对象才能到达网元。

看看带有正则表达式的命名实体识别：NLTK

>>> from nltk import ne_chunk, pos_tag, word_tokenize
>>> from nltk.tree import Tree
>>> 
>>> def get_continuous_chunks(text):
...     chunked = ne_chunk(pos_tag(word_tokenize(text)))
...     continuous_chunk = []
...     current_chunk = []
...     for i in chunked:
...             if type(i) == Tree:
...                     current_chunk.append(" ".join([token for token, pos in i.leaves()]))
...             if current_chunk:
...                     named_entity = " ".join(current_chunk)
...                     if named_entity not in continuous_chunk:
...                             continuous_chunk.append(named_entity)
...                             current_chunk = []
...             else:
...                     continue
...     return continuous_chunk
... 
>>> my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, the top federal prosecutor in Brooklyn, spoke forcefully about the pain of a broken trust that African-Americans felt and said the responsibility for repairing generations of miscommunication and mistrust fell to law enforcement."
>>> get_continuous_chunks(my_sent)
['WASHINGTON', 'New York', 'Loretta E. Lynch', 'Brooklyn']


>>> my_sent = "How's the weather in New York and Brooklyn"
>>> get_continuous_chunks(my_sent)
['New York', 'Brooklyn']

python 2022/1/1 18:30:22 有407人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

对于HTML表单输入字段，disabled =“ disabled”和readonly =“ readonly”有什么区别？

对于HTML表单输入字段，disabled =“ disabled”和readonly =“ readonly”有什么区别？

其他 2022-01-01 950
Swift-使用downloadTaskWithURL下载视频

Swift-使用downloadTaskWithURL下载视频

Swift 2022-01-01 818
两套物品。A组的每个元素与B组的唯一匹配。在O（nlogn）时间内将A组的每个项目与B组的项目进行匹配

两套物品。A组的每个元素与B组的唯一匹配。在O（nlogn）时间内将A组的每个项目与B组的项目进行匹配

其他 2022-01-01 748
DropdownList数据源

DropdownList数据源

其他 2022-01-01 787
带OGNL的Struts 2动态消息

带OGNL的Struts 2动态消息

其他 2022-01-01 766
Jenkins中不推荐使用JNLP Connections，将Windows从站连接到jenkins的新推荐方法是什么？

Jenkins中不推荐使用JNLP Connections，将Windows从站连接到jenkins的新推荐方法是什么？

其他 2022-01-01 690
Jenkins：如何在Nginx反向代理后面配置Jenkins，以便JNLP从站进行连接

Jenkins：如何在Nginx反向代理后面配置Jenkins，以便JNLP从站进行连接

其他 2022-01-01 870
CSS Only饼图-如何在切片之间添加间距/填充？

CSS Only饼图-如何在切片之间添加间距/填充？

CSS 2022-01-01 740
类型“ Readonly <{}>”上不存在“ ValueChanging”

类型“ Readonly <{}>”上不存在“ ValueChanging”

其他 2022-01-01 622
无法提交JPA事务：事务标记为rollbackOnly

无法提交JPA事务：事务标记为rollbackOnly

其他 2022-01-01 818
CSS中是否存在`pointer-events：hoverOnly`或类似的东西？

CSS中是否存在`pointer-events：hoverOnly`或类似的东西？

CSS 2022-01-01 681
SwiftUI MVVM协调器/路由器/ NavigationLink

SwiftUI MVVM协调器/路由器/ NavigationLink

Swift 2022-01-01 630
尝试在脚本标签上触发onload事件

尝试在脚本标签上触发onload事件

其他 2022-01-01 610
HTML5中是否有一个minlength验证属性？

HTML5中是否有一个minlength验证属性？

其他 2022-01-01 648
在哪里可以下载JNLP.jar？

在哪里可以下载JNLP.jar？

其他 2022-01-01 653
在ASP.net Web.Config中设置jsonSerialization maxJsonLength会产生500错误

在ASP.net Web.Config中设置jsonSerialization maxJsonLength会产生500错误

.net 2022-01-01 695
window.onload与body.onload与document.onready [重复]

window.onload与body.onload与document.onready [重复]

其他 2022-01-01 673
WebClient.DownloadString（）返回带有特殊字符的字符串

WebClient.DownloadString（）返回带有特殊字符的字符串

其他 2022-01-01 653
刷新页面后如何保持Dropdownlist值相同

刷新页面后如何保持Dropdownlist值相同

其他 2022-01-01 624
如何使用Struts2标签和OGNL比较两个字符串？

如何使用Struts2标签和OGNL比较两个字符串？

其他 2022-01-01 584

NLTK将实体识别命名为Python列表

撰写回答

推荐问题

对于HTML表单输入字段，disabled =“ disabled”和readonly =“ readonly”有什么区别？

Swift-使用downloadTaskWithURL下载视频

两套物品。A组的每个元素与B组的唯一匹配。在O（nlogn）时间内将A组的每个项目与B组的项目进行匹配

DropdownList数据源

带OGNL的Struts 2动态消息

Jenkins中不推荐使用JNLP Connections，将Windows从站连接到jenkins的新推荐方法是什么？

Jenkins：如何在Nginx反向代理后面配置Jenkins，以便JNLP从站进行连接

CSS Only饼图-如何在切片之间添加间距/填充？

类型“ Readonly <{}>”上不存在“ ValueChanging”

无法提交JPA事务：事务标记为rollbackOnly

CSS中是否存在`pointer-events：hoverOnly`或类似的东西？

SwiftUI MVVM协调器/路由器/ NavigationLink

尝试在脚本标签上触发onload事件

HTML5中是否有一个minlength验证属性？

在哪里可以下载JNLP.jar？

在ASP.net Web.Config中设置jsonSerialization maxJsonLength会产生500错误

window.onload与body.onload与document.onready [重复]

WebClient.DownloadString（）返回带有特殊字符的字符串

刷新页面后如何保持Dropdownlist值相同

如何使用Struts2标签和OGNL比较两个字符串？

分类汇总

您的鼓励是对我最大的支持