版权声明:本套课程材料开源,使用和分享必须遵守「创作共用许可协议 CC BY-NC-SA」(来源引用-非商业用途使用-以相同方式共享)。
x y
1 1 a
2 2 b
3 3 c
4 4 d
[1] "x" "y"
[1] 2
[1] 2
[1] 4
'data.frame': 4 obs. of 2 variables:
$ x: int 1 2 3 4
$ y: chr "a" "b" "c" "d"
[1] 1 2 3 4
[1] "a" "b" "c" "d"
[1] "a" "b" "c" "d"
[1] "a"
'data.frame': 4 obs. of 3 variables:
$ x : int 1 2 3 4
$ y : chr "a" "b" "c" "d"
$ univ: Factor w/ 4 levels "BNU","ECNU","PKU",..: 2 1 3 4
y univ
1 a ECNU
2 b BNU
3 c PKU
4 d THU
y univ
1 a ECNU
2 b BNU
x y univ
1 1 a ECNU
2 2 b BNU
y univ
1 a ECNU
## 数据框组合
d$univ = NULL # 删除变量
d1 = data.frame(x=5:8, y=c("e", "f", "g", "h"))
d.d1 = rbind(d, d1) # rbind()行合并
d.d1 x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 f
7 7 g
8 8 h
x y z
1 1 a 5
2 2 b 6
3 3 c 7
4 4 d 8
[1] "x" "y" "z"
[1] "y"
xxx yyy z
1 1 a 5
2 2 b 6
3 3 c 7
4 4 d 8
var.1 var.2 var.3
1 1 a 5
2 2 b 6
3 3 c 7
4 4 d 8
bruceR包的import()和export()函数提供了“一站式”数据导入导出功能
read_xxx()函数,节省时间,提升效率!
import()帮助文档
A B SCORE
1 1 1 3
2 1 1 6
3 1 1 4
4 1 1 3
5 1 2 4
6 1 2 6
7 1 2 4
8 1 2 2
9 1 3 5
10 1 3 7
11 1 3 5
12 1 3 2
13 2 1 4
14 2 1 5
15 2 1 3
16 2 1 3
17 2 2 8
18 2 2 9
19 2 2 8
20 2 2 7
21 2 3 12
22 2 3 13
23 2 3 12
24 2 3 11
export(between.2, file="data.csv") # 导出到CSV逗号分隔值纯文本文件
export(between.2, file="data.sav") # 导出到SPSS数据文件
export(list(between.1, between.2, between.3), file="data.xlsx")
# 导出到Excel文件(Sheet1、Sheet2、Sheet3)
export(
list(between.1, between.2, between.3),
sheet = c("d1", "d2", "d3"), # 设定每个数据导出的Sheet名称
file = "data_named.xlsx"
)
# 导出到Excel文件(Sheet名称:d1、d2、d3)library(bruceR)
d1 = import("data_named.xlsx", sheet="d1")
d2 = import("data_named.xlsx", sheet="d2")
d3 = import("data_named.xlsx", sheet="d3")
df = import("data.csv")
dt = import("data.csv", as="data.table") # 导入为data.table对象
class(df) # data.frame[1] "data.frame"
[1] "data.table" "data.frame"
Classes 'data.table' and 'data.frame': 24 obs. of 3 variables:
$ A : int 1 1 1 1 1 1 1 1 1 1 ...
$ B : int 1 1 1 1 2 2 2 2 3 3 ...
$ SCORE: int 3 6 4 3 4 6 4 2 5 7 ...
- attr(*, ".internal.selfref")=<externalptr>
"gzip":快速压缩(最快,默认)"bzip2":中度压缩(较快)"xz":极限压缩(较慢)save(d1, d2, d3, file="datasets1.RData") # 保存为RData
save(d1, d2, d3,
file = "datasets2.RData",
compress = "xz", # "gzip", "bzip2", "xz"
compression_level = 9) # 压缩程度:1~9
rm(d1, d2, d3) # 移除环境中的数据对象
load("datasets1.RData") # 载入RData中压缩存储的数据对象
str(d1) # 已载入到环境'data.frame': 32 obs. of 2 variables:
$ A : num 1 1 1 1 1 1 1 1 2 2 ...
$ SCORE: num 3 6 4 3 5 7 5 2 4 6 ...
'data.frame': 24 obs. of 3 variables:
$ A : num 1 1 1 1 1 1 1 1 1 1 ...
$ B : num 1 1 1 1 2 2 2 2 3 3 ...
$ SCORE: num 3 6 4 3 4 6 4 2 5 7 ...
'data.frame': 32 obs. of 4 variables:
$ A : num 1 1 1 1 1 1 1 1 1 1 ...
$ B : num 1 1 1 1 1 1 1 1 2 2 ...
$ C : num 1 1 1 1 2 2 2 2 1 1 ...
$ SCORE: num 3 6 4 3 5 7 5 2 4 6 ...
library(rvest)
url = "https://psy.ecnu.edu.cn/17437/list.htm" # 网页链接
xml = url %>% read_html() # 读取网页所有信息
xml %>% html_elements(".column-item-link .column-name") %>% html_text2() [1] "各级人才工程" "认知与神经科学系"
[3] "毕生发展与学习科学系" "社会与管理心理学系"
[5] "健康与临床心理学系" "人工智能与人因工程系(筹)"
[7] "实验员/专任助理研究员" "党政管理"
[9] "兼职教师" "全职博士后"
[11] "荣休教师" "永远怀念教师名录"
[1] "华东师范大学特聘教授" "国家级人才项目"
[3] "国家级青年人才项目" "中国科协托举人才"
[5] "教育部新世纪人才" "上海市曙光学者"
[7] "上海市浦江学者" "上海市青年科技启明星项目"
[9] "上海市晨光计划" "上海市扬帆计划"
[1] "周晓林 博士" "蒯曙光 博士" "周晓林 博士" "蔡清 博士"
[5] "郝宁 博士" "蒯曙光 博士" "高晓雪 博士" "罗艺 博士"
[9] "崔丽娟 博士" "刘永芳 博士" "庞维国 博士" "郝宁 博士"
[13] "刘俊升 博士" "陆静怡 博士" "蔡清 博士" "包寒吴霜 博士"
[17] "李先春 博士" "刘俊升 博士" "孟慧 博士" "庞维国 博士"
[21] "宋永宁博士" "王弘毅 博士" "王青 博士" "席居哲 博士"
[25] "谢鑫宇博士" "周宁宁 博士" "张琪 博士" "包寒吴霜 博士"
[29] "梁一鸣 博士" "陆静怡 博士" "王青 博士" "杨莹 博士"
[33] "周晗昱 博士" "陈 曦 博士" "梁一鸣 博士" "李世佳 博士"
[37] "杨莹 博士" "周晗昱 博士"
作业要求:
平台提交:
import()函数)及导入后的数据结构(使用str()函数)截图