XML包导入和处理XML数据格式|R包

xml encoding="utf-8" ?>

1193.png

什么是XML

XML 指可扩展标记语言(EXtensible Markup Language)
XML 是一种标记语言,很类似 HTML
XML 的设计宗旨是传输数据,而非显示数据
XML 标签没有被预定义。您需要自行定义标签。
XML 被设计为具有自我描述性。
XML 是 W3C 的推荐标准

关于XML更详细的介绍,参见链接:http://www.w3school.com.cn/xml/xml_intro.asp

R语言如何解析XML

R语言提供了XML包解析XML数据格式,包括导入XML数据和处理XML数据,举例说明如下。

## 加载XML包
library('XML')
## 自定义一个XML数据内容
content <-   
'<note>  
<name>shujuren</name>  
<url>http://shujuren.org</url>  
<date>2016-01-01</date>  
</note>'
doc <- xmlParse(content, encoding="UTF-8")xmlToList(doc)
# use an R-level node representationdoc1 <- xmlTreeParse(content)xmlToList(doc1)
## 转换成DataFrame类型xmlToDataFrame(doc)

数据框的结果如下:

            text1            
            shujuren2 
            http://shujuren.org3          
            2016-01-01

思考:
手机上面的通讯录可以导成XML数据格式,如何用R语言的XML进行导入和处理?
参考链接:
http://www.sxiaw.com/xml_rss-353691.html

以上就是XML包导入和处理XML数据格式|R包 的内容,更多相关内容请关注硕下网(www.sxiaw.com)!