BeautifulSoup如何解析XML文档中的XML NMTOKEN属性

lewis 1年前 (2024-05-16) 阅读数 22 #技术

要解析XML文档中的XML NMTOKEN属性，可以使用BeautifulSoup库中的find()或find_all()方法来查找具有特定属性的标签，并使用get()方法来获取该属性的值。

例如，假设XML文档如下所示：

<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>

要找到所有具有id属性的book标签，可以使用以下代码来解析XML文档并获取id属性的值：

from bs4 import BeautifulSoup

xml_doc = """
<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>
"""

soup = BeautifulSoup(xml_doc, 'xml')
books = soup.find_all('book')

for book in books:
    book_id = book.get('id')
    print(f"Book ID: {book_id}")

运行上述代码将输出：

Book ID: 1
Book ID: 2

这样就可以成功解析XML文档中的XML NMTOKEN属性。

版权声明

本文仅代表作者观点，不代表博信信息网立场。

上一篇：服务器虚拟化怎么使用的下一篇：Java建造者模式实例分析 - 开发技术

BeautifulSoup如何解析XML文档中的XML NMTOKEN属性

版权声明

作者文章