HTML 使用Html Agility Pack从HTML BODY节点中提取内部文本
要使用Html Agility Pack从HTML BODY节点中提取内部文本,首先需要安装Html Agility Pack库,在C#项目中,可以通过NuGet包管理器安装。
安装完成后,可以使用以下步骤来提取HTML BODY节点中的内部文本:
1、引入命名空间:
using HtmlAgilityPack;
2、创建一个HtmlDocument对象,加载HTML内容:
var html = "<html><body>这是一个示例文本</body></html>"; var document = new HtmlDocument(); document.LoadHtml(html);
3、获取BODY节点:
var bodyNode = document.DocumentNode.SelectSingleNode("//body");
4、提取BODY节点中的内部文本:
var innerText = bodyNode.InnerText; Console.WriteLine(innerText); // 输出: 这是一个示例文本
以下是完整的示例代码:
using System; using HtmlAgilityPack; namespace HtmlAgilityPackDemo { class Program { static void Main(string[] args) { var html = "<html><body>这是一个示例文本</body></html>"; var document = new HtmlDocument(); document.LoadHtml(html); var bodyNode = document.DocumentNode.SelectSingleNode("//body"); var innerText = bodyNode.InnerText; Console.WriteLine(innerText); // 输出: 这是一个示例文本 } } }
版权声明
本文仅代表作者观点,不代表博信信息网立场。
上一篇:Flume版本兼容性问题如何解决 下一篇:python为什么在桌面打不开