学堂 学堂 学堂公众号手机端

BeautifulSoup如何解析XML文档中的XML NMTOKEN属性

lewis 12个月前 (05-16) 阅读数 16 #技术

要解析XML文档中的XML NMTOKEN属性,可以使用BeautifulSoup库中的find()或find_all()方法来查找具有特定属性的标签,并使用get()方法来获取该属性的值。

例如,假设XML文档如下所示:

<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>

要找到所有具有id属性的book标签,可以使用以下代码来解析XML文档并获取id属性的值:


from bs4 import BeautifulSoup

xml_doc = """
<bookstore>
  <book id="1" title="Python Programming">
    <author>Nicole Smith</author>
  </book>
  <book id="2" title="JavaScript Basics">
    <author>John Doe</author>
  </book>
</bookstore>
"""

soup = BeautifulSoup(xml_doc, 'xml')
books = soup.find_all('book')

for book in books:
    book_id = book.get('id')
    print(f"Book ID: {book_id}")

运行上述代码将输出:

Book ID: 1
Book ID: 2

这样就可以成功解析XML文档中的XML NMTOKEN属性。

版权声明

本文仅代表作者观点,不代表博信信息网立场。

热门