您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

如何索引html内容,保持位置(如xpath,css选择器等)

如何索引html内容,保持位置(如xpath,css选择器等)

您的问题是关于突出显示xhtml-Dokument的结果xpath。

我不知道在solr或elasticsearch中正在运行的解决方案。在Lucene(旧版本)的基础上,可扩展文本框架(“ XTF”)的内容非常相似。在XTF中,您可以在原始xml文件中将高亮显示为标签。因此,编写xsl-Transformation生成相应的xpath应该很容易。

简而言之,主要思想是将EPUB- book分成重叠的块,并将xml结构作为特殊字符存储在已索引和存储的字段中。通过突出显示信息,您可以然后重新转换原始xml结构以找到您的xpath。

CSS 2022/1/1 18:15:26 有508人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶