版权声明:本套课程材料开源,使用和分享必须遵守「创作共用许可协议 CC BY-NC-SA」(来源引用-非商业用途使用-以相同方式共享)。
正则表达式 / 规律表达式(regular/pattern expression,RegEx)
text = "笔记本上安装SPSS22或20,授权码复制不上,导致安装失败。已经试了多次了,都安装不上SpSS,请问有遇到这种情况的吗?电脑是64位的,Spss是32位的,是这个原因吗?之前SpsS在其他笔记本和台式电脑上都安装成功了。"
cat(text)笔记本上安装SPSS22或20,授权码复制不上,导致安装失败。已经试了多次了,都安装不上SpSS,请问有遇到这种情况的吗?电脑是64位的,Spss是32位的,是这个原因吗?之前SpsS在其他笔记本和台式电脑上都安装成功了。
[[1]]
[1] "SPSS"
[[1]]
[1] "SPSS" "Spss"
[[1]]
[1] "S" "P" "S" "S" "S" "p" "S" "S" "S" "p" "s" "s" "S" "p" "s" "S"
[[1]]
[1] "S" "P" "S" "S" "S" "p" "S" "S" "S" "p" "s" "s" "S" "p" "s" "S"
[[1]]
[1] "SPSS" "SpSS" "Spss" "SpsS"
[[1]]
[1] "2" "2" "2" "0" "6" "4" "3" "2"
[[1]]
[1] "22" "20" "64" "32"
[[1]]
[1] "64位" "32位"
text = "笔记本上安装SPSS22或20,授权码复制不上,导致安装失败。已经试了多次了,都安装不上SpSS,请问有遇到这种情况的吗?电脑是64位的,Spss是32位的,是这个原因吗?之前SpsS在其他笔记本和台式电脑上都安装成功了。"
cat(text)笔记本上安装SPSS22或20,授权码复制不上,导致安装失败。已经试了多次了,都安装不上SpSS,请问有遇到这种情况的吗?电脑是64位的,Spss是32位的,是这个原因吗?之前SpsS在其他笔记本和台式电脑上都安装成功了。
[[1]]
[1] "64位" "32位"
[[1]]
[1] "SPSS" "SpSS" "Spss" "SpsS"
[[1]]
[1] "SPSS"
[[1]]
[1] "S" "SS" "SpSS" "Spss" "SpsS"
[[1]]
[1] "Sps" "Sps"
[[1]]
[1] "Spss" "Sps"
text = "笔记本上安装SPSS22或20,授权码复制不上,导致安装失败。已经试了多次了,都安装不上SpSS,请问有遇到这种情况的吗?电脑是64位的,Spss是32位的,是这个原因吗?之前SpsS在其他笔记本和台式电脑上都安装成功了。"
cat(text)笔记本上安装SPSS22或20,授权码复制不上,导致安装失败。已经试了多次了,都安装不上SpSS,请问有遇到这种情况的吗?电脑是64位的,Spss是32位的,是这个原因吗?之前SpsS在其他笔记本和台式电脑上都安装成功了。
[[1]]
[1] "64位" "32位"
[[1]]
[1] "64" "32"
[[1]]
[1] "22" "20"
[[1]]
[1] "22"
[[1]]
[1] "20" "64" "32"
stringr包
string:字符串输入pattern:正则表达式str_detect()str_count()str_extract()、str_extract_all()str_replace()、str_replace_all()str_remove()、str_remove_all()str_split()str_subset()## 数据采集
## 已加载rvest包:library(rvest)
url = "https://psy.ecnu.edu.cn/17437/list.htm" # 学院师资队伍页面
xml = url %>% read_html() # 读取网页所有信息
xml{html_document}
<html class="webplus-list">
[1] <head>\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8 ...
[2] <body class="wp-column-page">\r\n<!--头部开始-->\r\n<header class="wp-wrapper ...
[3] <script type="text/javascript" src="/_upload/tpl/0b/a5/2981/template2981/ ...
[4] <script type="text/javascript">\r\n$(function(){\r\n\t// 初始化SDAPP\r\n\tne ...
## 字符串处理(1):院系名称
menu = xml %>% html_elements(".column-item-link .column-name") %>% html_text2()
menu [1] "各级人才工程" "认知与神经科学系"
[3] "毕生发展与学习科学系" "社会与管理心理学系"
[5] "健康与临床心理学系" "人工智能与人因工程系(筹)"
[7] "实验员/专任助理研究员" "党政管理"
[9] "兼职教师" "全职博士后"
[11] "荣休教师" "永远怀念教师名录"
[1] "认知与神经科学系" "毕生发展与学习科学系"
[3] "社会与管理心理学系" "健康与临床心理学系"
[5] "人工智能与人因工程系(筹)"
[1] "认知与神经科学系" "毕生发展与学习科学系" "社会与管理心理学系"
[4] "健康与临床心理学系"
[1] "认知与神经科学系" "毕生发展与学习科学系" "社会与管理心理学系"
[4] "健康与临床心理学系"
[1] "认知与神经科学系" "毕生发展与学习科学系" "社会与管理心理学系"
[4] "健康与临床心理学系"
[1] NA "认知与神经科学" "毕生发展与学习科学"
[4] "社会与管理心理学" "健康与临床心理学" NA
[7] NA NA NA
[10] NA NA NA
[1] "认知与神经科学" "毕生发展与学习科学" "社会与管理心理学"
[4] "健康与临床心理学"
attr(,"na.action")
[1] 1 6 7 8 9 10 11 12
attr(,"class")
[1] "omit"
[1] "华东师范大学特聘教授" "国家级人才项目"
[3] "国家级青年人才项目" "中国科协托举人才"
[5] "教育部新世纪人才" "上海市曙光学者"
[7] "上海市浦江学者" "上海市青年科技启明星项目"
[9] "上海市晨光计划" "上海市扬帆计划"
[1] "国家级人才项目" "国家级青年人才项目" "中国科协托举人才"
[4] "教育部新世纪人才"
[1] "中国科协托举人才" "教育部新世纪人才"
[1] "上海市曙光学者" "上海市浦江学者"
[3] "上海市青年科技启明星项目" "上海市晨光计划"
[5] "上海市扬帆计划"
[1] "上海市曙光学者" "上海市浦江学者"
[3] "上海市青年科技启明星项目" "上海市晨光计划"
[5] "上海市扬帆计划"
[1] "曙光" "浦江" "晨光" "扬帆"
attr(,"na.action")
[1] 1 2 3 4 5 8
attr(,"class")
[1] "omit"
[1] "周晓林 博士" "蒯曙光 博士" "周晓林 博士" "蔡清 博士"
[5] "郝宁 博士" "蒯曙光 博士" "高晓雪 博士" "罗艺 博士"
[9] "崔丽娟 博士" "刘永芳 博士" "庞维国 博士" "郝宁 博士"
[13] "刘俊升 博士" "陆静怡 博士" "蔡清 博士" "包寒吴霜 博士"
[17] "李先春 博士" "刘俊升 博士" "孟慧 博士" "庞维国 博士"
[21] "宋永宁博士" "王弘毅 博士" "王青 博士" "席居哲 博士"
[25] "谢鑫宇博士" "周宁宁 博士" "张琪 博士" "包寒吴霜 博士"
[29] "梁一鸣 博士" "陆静怡 博士" "王青 博士" "杨莹 博士"
[33] "周晗昱 博士" "陈 曦 博士" "梁一鸣 博士" "李世佳 博士"
[37] "杨莹 博士" "周晗昱 博士"
name
包寒吴霜 博士 蔡清 博士 陈 曦 博士 崔丽娟 博士 高晓雪 博士
2 2 1 1 1
郝宁 博士 蒯曙光 博士 李世佳 博士 李先春 博士 梁一鸣 博士
2 2 1 1 2
刘俊升 博士 刘永芳 博士 陆静怡 博士 罗艺 博士 孟慧 博士
2 1 2 1 1
庞维国 博士 宋永宁博士 王弘毅 博士 王青 博士 席居哲 博士
2 1 1 2 1
谢鑫宇博士 杨莹 博士 张琪 博士 周晗昱 博士 周宁宁 博士
1 2 1 2 1
周晓林 博士
2
[1] "周晓林 博士" "蒯曙光 博士" "蔡清 博士" "郝宁 博士"
[5] "高晓雪 博士" "罗艺 博士" "崔丽娟 博士" "刘永芳 博士"
[9] "庞维国 博士" "刘俊升 博士" "陆静怡 博士" "包寒吴霜 博士"
[13] "李先春 博士" "孟慧 博士" "宋永宁博士" "王弘毅 博士"
[17] "王青 博士" "席居哲 博士" "谢鑫宇博士" "周宁宁 博士"
[21] "张琪 博士" "梁一鸣 博士" "杨莹 博士" "周晗昱 博士"
[25] "陈 曦 博士" "李世佳 博士"
[1] "包寒吴霜 博士" "蔡清 博士" "陈 曦 博士" "崔丽娟 博士"
[5] "高晓雪 博士" "郝宁 博士" "蒯曙光 博士" "李世佳 博士"
[9] "李先春 博士" "梁一鸣 博士" "刘俊升 博士" "刘永芳 博士"
[13] "陆静怡 博士" "罗艺 博士" "孟慧 博士" "庞维国 博士"
[17] "宋永宁博士" "王弘毅 博士" "王青 博士" "席居哲 博士"
[21] "谢鑫宇博士" "杨莹 博士" "张琪 博士" "周晗昱 博士"
[25] "周宁宁 博士" "周晓林 博士"
[1] "包寒吴霜" "蔡清" "陈曦" "崔丽娟" "高晓雪" "郝宁"
[7] "蒯曙光" "李世佳" "李先春" "梁一鸣" "刘俊升" "刘永芳"
[13] "陆静怡" "罗艺" "孟慧" "庞维国" "宋永宁" "王弘毅"
[19] "王青" "席居哲" "谢鑫宇" "杨莹" "张琪" "周晗昱"
[25] "周宁宁" "周晓林"
[1] "郝宁" "宋永宁" "周宁宁"
[1] "李世佳" "李先春"
[1] "王弘毅" "王青" "周晗昱" "周宁宁" "周晓林"
[1] "Psychology"
[1] "P"
[1] "Psych"
作业要求:
stringr包提供的字符串示例数据fruit(80个水果名称),运用str_detect()、str_subset()、str_extract_all()、str_replace_all()等stringr包函数中的至少2个,任意完成至少2种字符串处理任务,并对代码和结果进行简单的注释和解读平台提交:
[1] "apple" "apricot" "avocado"
[4] "banana" "bell pepper" "bilberry"
[7] "blackberry" "blackcurrant" "blood orange"
[10] "blueberry" "boysenberry" "breadfruit"
[13] "canary melon" "cantaloupe" "cherimoya"
[16] "cherry" "chili pepper" "clementine"
[19] "cloudberry" "coconut" "cranberry"
[22] "cucumber" "currant" "damson"
[25] "date" "dragonfruit" "durian"
[28] "eggplant" "elderberry" "feijoa"
[31] "fig" "goji berry" "gooseberry"
[34] "grape" "grapefruit" "guava"
[37] "honeydew" "huckleberry" "jackfruit"
[40] "jambul" "jujube" "kiwi fruit"
[43] "kumquat" "lemon" "lime"
[46] "loquat" "lychee" "mandarine"
[49] "mango" "mulberry" "nectarine"
[52] "nut" "olive" "orange"
[55] "pamelo" "papaya" "passionfruit"
[58] "peach" "pear" "persimmon"
[61] "physalis" "pineapple" "plum"
[64] "pomegranate" "pomelo" "purple mangosteen"
[67] "quince" "raisin" "rambutan"
[70] "raspberry" "redcurrant" "rock melon"
[73] "salal berry" "satsuma" "star fruit"
[76] "strawberry" "tamarillo" "tangerine"
[79] "ugli fruit" "watermelon"