在python中用ElementTree提取XML中的内容

<article-title>K
<sup>+</sup>
Channel Regulator KCR1 Suppresses Heart Rhythm by Modulating the Pacemaker Current I <sub>f</sub>
</article-title>
我要提取标签<article-title>中的内容,即K+ Channel Regulator KCR1 Suppresses Heart Rhythm by Modulating the Pacemaker Current If,应该在Python怎么写代码?有没有通用的一些程序,即可以直接提取标签<article-title>中的内容?

from xml.etree import ElementTree
str_ = '' #文件中的xml字符串
xml_obj = ElementTree.fromstring(str_)

然后通过对xml_obj进行操作,xml_obj本身也是一个xml节点。

xml_obj.getchildren() 获取根节点的子节点列表

xml_obj.findall(node_name) 搜索xml_obj节点下名为node_name的所有节点 

xml_obj.tag 节点的标签

xml_obj.text 节点的文本信息 ,本例中可以获得K这个文本。

xml_obj.tail 节点尾部的文本信息,本例中获取Channel Regulator KCR1 Suppresses Heart Rhythm by Modulating the Pacemaker Current I  
就需要搜索到标签为sup的节点,然后取节点的tail文本获得。

温馨提示:内容为网友见解,仅供参考
无其他回答

用python获取xml标签中的内容
import xml.etree.ElementTreee = xml.etree.ElementTree.parse('x.xml').getroot()for atype in e.findall('mysqlhost'): print(atype.text)

利用python读取xml中的数据
在Python中处理XML数据,有多种方法可供选择。其中,cElementTree是常用的一种方式,但需要注意的是,如果XML文件中的、和标签顺序不固定,直接读取可能会导致数据获取错误。例如,如果最后一组数据的顺序被打乱,输出结果就可能不符合预期。另一种方法是利用read_xml()函数,这种方法相对更为直接,可以更...

python中如何同时获得父节点以及子节点下的文本
python中同时获得父节点以及子节点下的文本方法如下:1、首先使用xmletreeElementTree模块中的find和findall方法。2、其次获取指定XML文件的父节点和子节点下的文本。3、然后使用find方法查找XML文件中的父节点,并使用.findall方法查找所有的子节点。4、最后使用子节点的名称来查找相应的元素即可在python中同...

python ElementTree模块使用详情
构造已存在节点的子节点,使用SubElement(parent, tag, attrib={}, **extra)。元素的内容可通过Element.text和SubElement.text访问,标签和属性则通过Element.tag和Element.attrib获取。要将数据写入XML文件,使用ElementTree.write(file, ..., xml_declaration=None, ..., method='xml')。解析和修改XML...

如何用Python解析三层结构XML?几种常见方法介绍!
使用ElementTree模块,我们还能在XML文件中搜索、提取文本、修改和删除元素。添加、修改或删除元素时,可以使用text、SubElement()、pop()和clear()等方法。ElementTree提供了一个直观的方法来处理复杂的三层结构XML文件。另一种解析XML的方法是使用Minidom模块。Minidom模块提供了DOM(文档对象模型)视图,允许...

深入解读Python解析XML的几种方式
在XML解析方面,Python贯彻了自己“开箱即用”(batteries included)的原则。在自带的标准库中,Python提供了大量可以用于处理XML语言的包和工具,数量之多,甚至让Python编程新手无从选择。本文将介绍深入解读利用Python语言解析XML文件的几种方式,并以笔者推荐使用的ElementTree模块为例,演示具体使用方法和场景。文中所使用的...

浅谈Python解析XML的利器——xml.etree.ElementTree
ElementTree不仅支持文件的读写操作,而且Element,作为树的叶子,负责处理单个XML元素及其子元素的交互。Element的常见属性包括:Tag:str,对应XML标签,如device_typeAttrib:dict,存储XML属性,如desc="platform"Text:元素内容,如cisco_iosChild elements:包含在一对标签中的子节点,如R1和SW3中的内容...

Python XML处理初级篇:入门lxml库
在实际操作中,lxml提供了多种解析XML文档的方式,如从文件、字符串或网络链接。例如,解析字符串XML的步骤如下:通过导入etree模块,将包含XML数据的字符串xml_data传入etree.fromstring()函数,即可将数据转化为ElementTree对象,便于进一步操作。访问和操作XML元素是核心环节。如需获取元素信息,可以使用find...

python lxml中etree.html和etree.parse有什么区别
在Python的lxml库中,`etree.parse`和`etree.HTML`是两个不同的功能。`etree.parse`主要是用来解析XML文档的。它接受一个已经存在的XML文件,例如:当你使用tree = ET.parse('country_data.xml')时,它会读取并解析这个文件,返回一个ElementTree对象,你可以通过root = tree.getroot()获取到文档的...

Python编写一个程序以尝试解析XML\/HTML标签.
要给这段文字添加一个 root 标签,然后对里面的 node 进行遍历。root 标签的名字可以任意定(但是必须添加一个),我这里使用的 root 命名,对于其它的名字也一样。如果你是直接读取的 XML 文件,而不是字符串,可以将文件打开,然后把文件句柄传入 ElementTree.parse() 函数,最后对其返回值进行遍历。

相似回答