学堂 学堂 学堂公众号手机端

HTML 使用Html Agility Pack从HTML BODY节点中提取内部文本

lewis 3年前 (2022-11-08) 阅读数 4 #技术

要使用Html Agility Pack从HTML BODY节点中提取内部文本,首先需要安装Html Agility Pack库,在C#项目中,可以通过NuGet包管理器安装。

安装完成后,可以使用以下步骤来提取HTML BODY节点中的内部文本:

1、引入命名空间:


using HtmlAgilityPack;

2、创建一个HtmlDocument对象,加载HTML内容:

var html = "<html><body>这是一个示例文本</body></html>";
var document = new HtmlDocument();
document.LoadHtml(html);

3、获取BODY节点:

var bodyNode = document.DocumentNode.SelectSingleNode("//body");

4、提取BODY节点中的内部文本:

var innerText = bodyNode.InnerText;
Console.WriteLine(innerText); // 输出: 这是一个示例文本

以下是完整的示例代码:

using System;
using HtmlAgilityPack;
namespace HtmlAgilityPackDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var html = "<html><body>这是一个示例文本</body></html>";
            var document = new HtmlDocument();
            document.LoadHtml(html);
            var bodyNode = document.DocumentNode.SelectSingleNode("//body");
            var innerText = bodyNode.InnerText;
            Console.WriteLine(innerText); // 输出: 这是一个示例文本
        }
    }
}
版权声明

本文仅代表作者观点,不代表博信信息网立场。

热门