2022-11-08 19:58来源:m.sf1369.com作者:宇宇
1、对于网页为csv文件的页面,可以直接用read.csv函数导入网页数据并转为数据框的形式。html格式的网页也可以读取。
例如:
data <- read.csv(text="it is a page")#text是要查看的文本
head(data,10)
#读取网页数据的代码data <- read.csv("page"),page可以是要查看的网址或文本。
2、R基础包中的readLines可以读取网页或文本数据。
#输入文本
cat("asqsd\n1213",file="a1")
readLines("a1") #读取文本数据
#cat中"\n"表示换行。
3、RCurl包中的getURL()函数获取网页数据。
library(RCurl)
data<-getURL("a1")#a1为某个具体的网址。
head(data)
4、通过getURL直接获取的数据有些凌乱,可以借助library(XML)解析树函数htmlTreeParse处理。
library(XML)#解析树函数htmlTreeParse
data_Parse<-htmlTreeParse(data)
head(data_Parse,2)
5、对于复杂网站的文本数据,用rvest包中的read_html函数来提取文本数据。
library(rvest)
page<-read_html("a1")#a1为某个具体的网址
data<-html_nodes(page,"table")
head(data)
#本例中没有输入网址,所以结果为空。
6、通过html_nodes获得的数据不能直接投入使用。
table<-html_table(data);table #提取表格数据,可以得到多个表格结果
table[1]#查看第1个表
text<-html_text(data);text #提取文本数据
#在实际应用中,可以发现提取表格后的数据或文本是非常便于分析的。
网上有很多数据分析的课程~ 1元的 9.9元的都有。
可以去学一下
先学点皮毛就能受益匪浅了。
《R语言实战》百度网盘txt 最新全集下载:
链接:
提取码:MIKF书名:R语言实战
作者:卡巴科弗 (Robert I.Kabacoff)
译者:高涛
豆瓣评分:8.8
出版社:人民邮电出版社
出版年份:2013-1
页数:388
内容简介:
数据时代已经到来,但数据分析、数据挖掘人才却十分短缺。由于“大数据”对每个领域的决定性影响, 相对于经验和直觉,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学、客观的决策越来越重要。开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。 本书从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗?想要科学分析数据并正确决策吗?不妨从本书开始,挑战大数据,用R开始炫酷的数据统计与分析吧! 本书内容: R安装与操作
R语言实战 链接:
提取码:MIKF