您能否提供一些示例，说明为什么用正则表达式很难解析XML和HTML？

这是一些有趣的有效XML：

<!DOCTYPE x [ <!ENTITY y "a]>b"> ]>
<x>
    <a b="&y;>" />
    <![CDATA[[a>b <a>b <a]]>
    <?x <a> <!-- <b> ?> c --> d
</x>

这一点欢乐就是有效的HTML：

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd" [
    <!ENTITY % e "href='hello'">
    <!ENTITY e "<a %e;>">
]>
    <title>x</TITLE>
</head>
    <p id  =  a:b center>
    <span / hello </span>
    &amp<br left>
    <!---- >t<!---> < -->
    &e link </a>
</body>

更不用说针对无效构造的所有特定于浏览器的解析。

祝您好运，正则表达式！

编辑（JörgW Mittag）：这是格式良好，有效的HTML 4.01的另一个不错的片段：

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
  "http://www.w3.org/TR/html4/strict.dtd"> 
<HTML/
  <HEAD/
    <TITLE/>/
    <P/>

其他 2022/1/1 18:33:28 有467人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

您能否提供一些示例，说明为什么用正则表达式很难解析XML和HTML？

您能否提供一些示例，说明为什么用正则表达式很难解析XML和HTML？

其他 2022-01-01 467
您能解决这个简单的SQL查询吗？

您能解决这个简单的SQL查询吗？

SQLServer 2022-01-01 527
为什么我的代码从18而不是10打印出来，您能提供任何解决方案吗？

为什么我的代码从18而不是10打印出来，您能提供任何解决方案吗？

其他 2022-01-01 468
带有React 16.6 Suspense的React Router“向“路由”提供了类型为“对象”的无效道具“组件”，预期为“功能”。）

带有React 16.6 Suspense的React Router“向“路由”提供了类型为“对象”的无效道具“组件”，预期为“功能”。）

其他 2022-01-01 913
可以移动Docker容器（不提供Docker映像）吗？

可以移动Docker容器（不提供Docker映像）吗？

其他 2022-01-01 918
如何配置Tomcat从Webapps外部的外部文件夹提供图像？

如何配置Tomcat从Webapps外部的外部文件夹提供图像？

其他 2022-01-01 877
Hibernate5序列发生器未提供正确的值

Hibernate5序列发生器未提供正确的值

其他 2022-01-01 664
为Selenium创建HTTP基本身份验证Chrome扩展（提供MWE）

为Selenium创建HTTP基本身份验证Chrome扩展（提供MWE）

其他 2022-01-01 838
使用Gorilla工具箱通过根URL提供静态内容

使用Gorilla工具箱通过根URL提供静态内容

Go 2022-01-01 657
如何禁用通过IIS提供的单页应用程序HTML文件的缓存？

如何禁用通过IIS提供的单页应用程序HTML文件的缓存？

其他 2022-01-01 673
Spring Boot是否可以通过独立的JAR包装提供JSP服务

Spring Boot是否可以通过独立的JAR包装提供JSP服务

Java 2022-01-01 565
spring如何使用Tomcat提供的JNDI数据源？

spring如何使用Tomcat提供的JNDI数据源？

Java 2022-01-01 559
直接提供HTML页面时，如何应用servlet过滤器？

直接提供HTML页面时，如何应用servlet过滤器？

Jave 2022-01-01 679
如何使用PHP从Web根目录外部提供文档？

如何使用PHP从Web根目录外部提供文档？

php 2022-01-01 706
如何使用Go Web服务器提供静态html文件？

如何使用Go Web服务器提供静态html文件？

Go 2022-01-01 765
有没有办法在JavaScript的函数调用中提供命名参数？

有没有办法在JavaScript的函数调用中提供命名参数？

javascript 2022-01-01 801
Python-sqlite3.ProgrammingError：提供的绑定数量不正确。当前语句使用1，并且提供了74

Python-sqlite3.ProgrammingError：提供的绑定数量不正确。当前语句使用1，并且提供了74

SQLServer 2022-01-01 630
带有嵌入式码头的Webapp提供例外

带有嵌入式码头的Webapp提供例外

其他 2022-01-01 608
使用Spring Cloud连接器访问CloudFoundry用户提供的服务

使用Spring Cloud连接器访问CloudFoundry用户提供的服务

Java 2022-01-01 631
spring-boot如何提供特定的网址？

spring-boot如何提供特定的网址？

Java 2022-01-01 591
javax.servlet.ServletException：javax.servlet.jsp.JspTagException：不知道如何在提供的“项目”中进行迭代

javax.servlet.ServletException：javax.servlet.jsp.JspTagException：不知道如何在提供的“项目”中进行迭代

java 2022-01-01 679
更改Socket.IO静态文件的提供路径

更改Socket.IO静态文件的提供路径

其他 2022-01-01 567
MySQL Entity Framework错误-在配置中找不到指定的存储提供程序，或者该存储提供程序无效

MySQL Entity Framework错误-在配置中找不到指定的存储提供程序，或者该存储提供程序无效

MySQL 2022-01-01 630

您能否提供一些示例，说明为什么用正则表达式很难解析XML和HTML？

撰写回答

推荐问题

您能否提供一些示例，说明为什么用正则表达式很难解析XML和HTML？

您能解决这个简单的SQL查询吗？

为什么我的代码从18而不是10打印出来，您能提供任何解决方案吗？

带有React 16.6 Suspense的React Router“向“路由”提供了类型为“对象”的无效道具“组件”，预期为“功能”。）

可以移动Docker容器（不提供Docker映像）吗？

如何配置Tomcat从Webapps外部的外部文件夹提供图像？

Hibernate5序列发生器未提供正确的值

为Selenium创建HTTP基本身份验证Chrome扩展（提供MWE）

使用Gorilla工具箱通过根URL提供静态内容

如何禁用通过IIS提供的单页应用程序HTML文件的缓存？

Spring Boot是否可以通过独立的JAR包装提供JSP服务

spring如何使用Tomcat提供的JNDI数据源？

直接提供HTML页面时，如何应用servlet过滤器？

如何使用PHP从Web根目录外部提供文档？

如何使用Go Web服务器提供静态html文件？

有没有办法在JavaScript的函数调用中提供命名参数？

Python-sqlite3.ProgrammingError：提供的绑定数量不正确。当前语句使用1，并且提供了74

带有嵌入式码头的Webapp提供例外

使用Spring Cloud连接器访问CloudFoundry用户提供的服务

spring-boot如何提供特定的网址？

javax.servlet.ServletException：javax.servlet.jsp.JspTagException：不知道如何在提供的“项目”中进行迭代

更改Socket.IO静态文件的提供路径

MySQL Entity Framework错误-在配置中找不到指定的存储提供程序，或者该存储提供程序无效

分类汇总

您的鼓励是对我最大的支持