本文共 1772 字,大约阅读时间需要 5 分钟。
1.读取文件
(1) getwd() 返回当前工作目录;
setwd() 更改工作目录 注: R语言中文件路径的分割符号为“/”或“\ \” 例:getwd() setwd("E:/DATA")
(2)read.table()
read.table()几个值得注意的参数的缺省值 file 当文件储存在工作目录下时,无需写出路径,写出文件名称即可 header=FALSE sep=”” 表示分隔符为空格 (.csv文件中的分隔符为“,”所以读取csv文件时应修改该参数的值,或使用read.csv()函数)另外与此 相似的指令还包括 read.csv和read.delim.
(3)scan()
更灵活 更适合读取大数据量矩阵 scanscan(file = "", what = double(), nmax = -1, n = -1, sep = "", quote = if(identical(sep, "\n")) "" else "'\"", dec =".",skip = 0, nlines = 0, na.strings = "NA", flush = FALSE, fill = FALSE, strip.white = FALSE, quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE, comment.char = "", allowEscapes = FALSE, fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
主要的几个参数 what 指定读取的数据类型
skip 可以跳过文件的开始不读行数 seq分隔符(4)读取excel数据
① 利用剪贴板 在Excel中选中所需的数据复制,此时数据就被存放在剪贴板中,再>data.excel<-read.delim("clipboard")
② RODBC包 通过它可以实现R与Access、Excel、dBASE和SQL Server等多中软件的连接.
其中连接excel 的函数为: 0dbcConnectExcel()和odbcConnectExcel2007()分别读取xls和xlsx后缀的文件 sqlFetch()直接读取Excel中的一个表library(RODBC)channel1<-odbcConnectExcel2007("Salary.xlsx")data2<-sqlFetch(channel1,"sheet1")
③ readxl包
read_excel()函数library(readxl)l<-read_excel("E:\\length\\all.xlsx")
(5)读取数据库文件
①RODBC包 odbcDataSources()函数查看可用的数据源 odbcConnect()函数 如odbcConnectAccess()、odbcConnectAccess2007()odbcConnectAccess2007(access.file,uid="",pwd="",...)
(uid 为用户名 pwd为用户密码)
一系列SQL语句的操作: sqlFetch() 读取ODBC连接中的一个表到R的数据框中 sqlQuery() 在ODBC连接上执行查询语句 并返回结果 sqlTables() 给出ODBC连接对应的数据库的数据表 sqlCopy() 复制ODBC连接的查询结果到另一个ODBC连接中 sqlDrop() 删除ODBC连接中的一个表 sqlClear() 清空ODBC连接中的指定数据表内容 ② RMySQL/DBI包 ③RJDBC包 (以后再学)(6) 读取网页数据
XML包中的readHTMLTable() (7) 读入R格式的文件(.Rdata) load() (8)读SPSS数据 (.sav) foreign包 read.spss()函数2.数据保存
(1)cat()函数 (2)write或write.table()函数 保存为.txt文件 (3)save(data,file) 保存R格式文件转载地址:http://ehrii.baihongyu.com/