so
我真正喜欢使用的另一个html解析器是jsoup。您可以
在2行代码中获得所有元素。
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements ps = doc.select("p");
然后再将其写到文件中
out.write(ps.text()); //it will append all of the p elements together in one long string
或者,如果您希望它们位于单独的行中,则可以遍历元素并将其分别写出。