sed从html文件中删除标签

您可以使用许多HTML到文本转换器之一，可以使用Perl regex，<.+?>或者必须sed使用<[^>]*>

sed -e 's/<[^>]*>//g' file.html

如果没有错误的余地，请改用HTML解析器。例如，当元素分布在两行上时

<div
>Lorem ipsum</div>

此正则表达式将不起作用。

这正则表达式由三个部分组成<，[^>]*，>

后面跟着零个或多个字符*（不是结尾）>[...]是字符类，当它开始^查找不在类中的字符时

最后寻找关闭 >

更简单的正则表达式<.*>将不起作用，因为它会搜索可能的最长匹配项，即>输入行中的最后一个结束符。例如，当输入行中有多个标签时

<name>Olaf</name> answers questions.

将导致

回答问题。

代替

奥拉夫回答问题。

另请参阅与Star和Plus重复，特别是当心贪婪！接下来，进行详细说明。

其他 2022/1/1 18:15:03 有589人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

Greasemonkey 1.0中的jQuery与使用jQuery的网站冲突

Greasemonkey 1.0中的jQuery与使用jQuery的网站冲突

JS 2022-01-01 1214
强制JsonConvert.SerializeXmlNode将节点值序列化为Integer或Boolean

强制JsonConvert.SerializeXmlNode将节点值序列化为Integer或Boolean

Node 2022-01-01 1139
JDBC ResultSet获取具有表别名的列

JDBC ResultSet获取具有表别名的列

其他 2022-01-01 1159
Jenkins XmlParser报告未找到根节点属性的此类字段

Jenkins XmlParser报告未找到根节点属性的此类字段

其他 2022-01-01 953
无法获取Servlet以UTF-8格式处理请求内容

无法获取Servlet以UTF-8格式处理请求内容

Jave 2022-01-01 982
我可以在php中的SESSION数组上使用array_push吗？

我可以在php中的SESSION数组上使用array_push吗？

php 2022-01-01 1172
带有React的ESLint会给出“ no-unused-vars”错误

带有React的ESLint会给出“ no-unused-vars”错误

其他 2022-01-01 1185
Spring Boot Jersey和监视URL

Spring Boot Jersey和监视URL

Java 2022-01-01 1022
无法在Ubuntu上将ElasticSearch作为服务运行

无法在Ubuntu上将ElasticSearch作为服务运行

其他 2022-01-01 970
如何提高Elasticsearch函数得分的字段长度范数？

如何提高Elasticsearch函数得分的字段长度范数？

其他 2022-01-01 1027
我如何重新连接使用selenium的webdriver打开的浏览器？

我如何重新连接使用selenium的webdriver打开的浏览器？

其他 2022-01-01 1077
如何使用Servlet和Ajax？

如何使用Servlet和Ajax？

Jave 2022-01-01 1194
elasticsearch-返回字段的标记

elasticsearch-返回字段的标记

其他 2022-01-01 997
Spring Security自定义过滤器

Spring Security自定义过滤器

Java 2022-01-01 979
什么是selenium，什么是WebDriver？

什么是selenium，什么是WebDriver？

其他 2022-01-01 986
尝试使用selenium和python登录网页时出错

尝试使用selenium和python登录网页时出错

python 2022-01-01 1016
从Servlet内检索从JSON发送为JSON的数据

从Servlet内检索从JSON发送为JSON的数据

Jave 2022-01-01 965
在移动设备上进行selenium测试值得吗？

在移动设备上进行selenium测试值得吗？

其他 2022-01-01 878
如何制作URL过滤器以使用Servlet路由动作？

如何制作URL过滤器以使用Servlet路由动作？

Jave 2022-01-01 901
非阻塞getch（），ncurses

非阻塞getch（），ncurses

其他 2022-01-01 1120

sed从html文件中删除标签

撰写回答

推荐问题

Greasemonkey 1.0中的jQuery与使用jQuery的网站冲突

强制JsonConvert.SerializeXmlNode将节点值序列化为Integer或Boolean

JDBC ResultSet获取具有表别名的列

Jenkins XmlParser报告未找到根节点属性的此类字段

无法获取Servlet以UTF-8格式处理请求内容

我可以在php中的SESSION数组上使用array_push吗？

带有React的ESLint会给出“ no-unused-vars”错误

Spring Boot Jersey和监视URL

无法在Ubuntu上将ElasticSearch作为服务运行

如何提高Elasticsearch函数得分的字段长度范数？

我如何重新连接使用selenium的webdriver打开的浏览器？

如何使用Servlet和Ajax？

elasticsearch-返回字段的标记

Spring Security自定义过滤器

什么是selenium，什么是WebDriver？

尝试使用selenium和python登录网页时出错

从Servlet内检索从JSON发送为JSON的数据

在移动设备上进行selenium测试值得吗？

如何制作URL过滤器以使用Servlet路由动作？

非阻塞getch（），ncurses

分类汇总

您的鼓励是对我最大的支持