BeautifulSoupでxml:id属性を与える方法の備忘録です。
以下の方法ではエラーが発生してしまいます。
from bs4 import BeautifulSoup
soup = BeautifulSoup(features="xml")
soup.append(soup.new_tag("p", abc="xyz", xml:id="abc"))
print(soup)
以下のように記述すると正しく実行できました。
from bs4 import BeautifulSoup
soup = BeautifulSoup(features="xml")
soup.append(soup.new_tag("p", **{"abc": "xyz", "xml:id":"aiu"}))
print(soup)
Google Colabの実行例は以下です。
https://github.com/nakamura196/ndl_ocr/blob/main/BeautifulSoupでxml_id属性を与える方法.ipynb
参考になりましたら幸いです。