R語(yǔ)言基礎及應用
-
【作 者】主 編 涂旭東 黃源
【I S B N 】978-7-5170-9567-5
【責任編輯】石永峰
【適用讀者群】本專(zhuān)通用
【出版時(shí)間】2021-05-22
【開(kāi) 本】16開(kāi)
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁(yè) 數】240
【千字數】374
【印 張】15
【定 價(jià)】¥45
【叢 書(shū)】普通高等教育數據科學(xué)與大數據技術(shù)專(zhuān)業(yè)教材
【備注信息】
簡(jiǎn)介
本書(shū)特色
前言
章節列表
精彩閱讀
下載資源
相關(guān)圖書(shū)
本書(shū)以理論與實(shí)踐操作相結合的方式深入講解R語(yǔ)言的基本理論和實(shí)現方法,在內容設計上既有上課時(shí)老師講述的部分(包括詳細的理論與典型的案例),又有最新的實(shí)訓案例分析,雙管齊下,極大地激發(fā)了學(xué)生的學(xué)習積極性和主動(dòng)創(chuàng )造性,增加了趣味性,讓學(xué)生在課堂上跟上老師的思維,從而學(xué)到更多的知識和技能。
本書(shū)的編寫(xiě)目的是向讀者介紹R語(yǔ)言的基本概念與應用。本書(shū)共9章:R語(yǔ)言簡(jiǎn)介、數據類(lèi)型與數據對象、控制語(yǔ)句與函數、數據的讀寫(xiě)與預處理、R語(yǔ)言基本圖形、ggplot2繪圖基礎和R語(yǔ)言高級繪圖、R語(yǔ)言數據分析基礎、R語(yǔ)言機器學(xué)習基礎、R語(yǔ)言訪(fǎng)問(wèn)SQL數據庫。
本書(shū)可作為大數據專(zhuān)業(yè)、人工智能專(zhuān)業(yè)、云計算專(zhuān)業(yè)的教材,也可作為大數據愛(ài)好者的參考書(shū)。
內容實(shí)用——理論與實(shí)踐結合,重點(diǎn)突出應用
體系完善——構建完整的大數據專(zhuān)業(yè)解決方案
產(chǎn)教融合——高校企業(yè)共參與,對標行業(yè)標準
資源豐富——微課、課件、教案、源碼、答案
大數據作為新一輪工業(yè)革命中最為活躍的技術(shù)創(chuàng )新要素正在對全球競爭、國家治理、經(jīng)濟發(fā)展、產(chǎn)業(yè)轉型、社會(huì )生活等產(chǎn)生全面而深刻的影響;移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò )、數字家庭、電子商務(wù)等新一代信息技術(shù)的應用每天都在源源不斷地產(chǎn)生大量的數據,對大數據的處理分析正成為新一代信息技術(shù)融合應用的結合點(diǎn)。而靈活性、開(kāi)放性、優(yōu)秀的統計分析能力和卓越的繪圖功能、收錄超過(guò)1.4萬(wàn)個(gè)數據分析工具包、幾乎涵蓋各個(gè)行業(yè)數據分析中的所有方法使R語(yǔ)言成為大數據時(shí)代的新寵,越來(lái)越被學(xué)界和業(yè)界所重視,多種大數據架構平臺上已經(jīng)提供基于R語(yǔ)言的擴展和插件。借助R語(yǔ)言的高效性,大數據分析可實(shí)現事半功倍。
本書(shū)以理論與實(shí)踐操作相結合的方式深入講解R語(yǔ)言的基本理論和實(shí)現方法,在內容設計上既有上課時(shí)老師講述的部分(包括詳細的理論與典型的案例),又有最新的實(shí)訓案例分析,雙管齊下,極大地激發(fā)了學(xué)生的學(xué)習積極性和主動(dòng)創(chuàng )造性,增加了趣味性,讓學(xué)生在課堂上跟上老師的思維,從而學(xué)到更多的知識和技能。
本書(shū)特色如下:
(1)采用“理實(shí)一體化”教學(xué)方式:課堂上既有老師的講述內容又有學(xué)生獨立思考、上機操作的內容。
(2)豐富的教學(xué)案例:包含教學(xué)課件、習題答案等多種教學(xué)資源。
(3)緊跟時(shí)代潮流,關(guān)注最新技術(shù)和前沿熱點(diǎn),書(shū)中既包含最新熱點(diǎn)數據的案例分析,又包含唯美的數據可視化技術(shù)。
(4)編寫(xiě)本書(shū)的老師都具有多年教學(xué)經(jīng)驗,做到重難點(diǎn)突出,能夠激發(fā)學(xué)生的學(xué)習熱情。
(5)配有微課視頻:對本書(shū)中的重難點(diǎn)進(jìn)行細致講解,方便學(xué)生課后學(xué)習。
本書(shū)可作為大數據專(zhuān)業(yè)、人工智能專(zhuān)業(yè)、云計算專(zhuān)業(yè)的教材,也可作為大數據愛(ài)好者的參考書(shū)。
本書(shū)建議學(xué)時(shí)為60學(xué)時(shí),具體分布見(jiàn)下表。
章節 建議學(xué)時(shí)
R語(yǔ)言簡(jiǎn)介 2
數據類(lèi)型與數據對象 6
控制語(yǔ)句與函數 8
數據的讀寫(xiě)與預處理 12
R語(yǔ)言基本圖形 6
ggplot2繪圖基礎和R語(yǔ)言高級繪圖 8
R語(yǔ)言數據分析基礎 8
R語(yǔ)言機器學(xué)習基礎 6
R語(yǔ)言訪(fǎng)問(wèn)SQL數據庫 4
本書(shū)由涂旭東、黃源任主編。其中,黃源編寫(xiě)第1章、第2章和第8章并負責策劃與統稿工作,涂旭東編寫(xiě)第3章至第7章和第9章。
本書(shū)是校企合作的結果,在編寫(xiě)過(guò)程中得到重慶譽(yù)存大數據有限公司黃遠江博士的大力支持,同時(shí)編者參閱了大量相關(guān)資料,在此一并表示感謝。
由于編者水平有限,書(shū)中難免存在疏漏甚至錯誤之處,懇請讀者批評指正,編者電子郵箱:2103069667@qq.com。
編 者
2021年2月
1.1 R語(yǔ)言概述 2
1.1.1 什么是R語(yǔ)言 2
1.1.2 R語(yǔ)言的特點(diǎn) 2
1.2 R的下載與運行 2
1.2.1 R的下載 3
1.2.2 R的運行 4
1.2.3 在R中查看幫助 6
1.3 R語(yǔ)言包 8
1.3.1 R語(yǔ)言包的安裝 9
1.3.2 R語(yǔ)言包的載入 9
1.3.3 R語(yǔ)言包的使用 9
1.4 實(shí)訓 10
1.5 本章小結 11
練習1 11
第2章 數據類(lèi)型與數據對象 12
2.1 數據類(lèi)型 13
2.1.1 什么是數據類(lèi)型 13
2.1.2 常見(jiàn)的數據類(lèi)型 13
2.2 變量與標量 14
2.2.1 變量 14
2.2.2 標量 15
2.3 R語(yǔ)言中的數據對象 16
2.3.1 向量 16
2.3.2 矩陣 20
2.3.3 數組 23
2.3.4 列表 24
2.3.5 因子 26
2.3.6 數據框 26
2.4 R語(yǔ)言中數據類(lèi)型的轉換 31
2.4.1 類(lèi)型轉換函數介紹 31
2.4.2 R中數據類(lèi)型轉換實(shí)例 32
2.5 實(shí)訓 32
2.6 本章小結 33
練習2 34
第3章 控制語(yǔ)句與函數 35
3.1 條件結構 36
3.1.1 條件表達式 36
3.1.2 if語(yǔ)句 36
3.1.3 switch語(yǔ)句 38
3.2 循環(huán)結構 39
3.2.1 for循環(huán) 39
3.2.2 while循環(huán) 40
3.2.3 break語(yǔ)句 40
3.2.4 repeat語(yǔ)句 40
3.3 函數 41
3.3.1 自定義R函數 41
3.3.2 返回值 42
3.3.3 函數的參數 42
3.3.4 程序的向量化實(shí)現 43
3.3.5 apply()函數族 44
3.3.6 養成良好的代碼編寫(xiě)習慣 49
3.4 實(shí)訓 49
3.5 本章小結 51
練習3 51
第4章 數據的讀寫(xiě)與預處理 53
4.1 數據的輸入 54
4.1.1 工作目錄 54
4.1.2 向量的輸入 54
4.1.3 數據文件的讀取 55
4.1.4 讀取數據文件的注意事項 57
4.2 數據的輸出 58
4.2.1 屏幕輸出 58
4.2.2 向量的輸出 58
4.2.3 數據文件的輸出 59
4.3 R工作空間的保存和加載 61
4.3.1 R工作空間的保存 61
4.3.2 R工作空間的加載 61
4.4 變量的預處理 62
4.4.1 變量重編碼 62
4.4.2 變量重命名 63
4.4.3 變量的排序 63
4.4.4 變量類(lèi)型的轉換 64
4.5 字符串的處理 65
4.5.1 字符串分割 65
4.5.2 字符串拼接 66
4.5.3 字符串長(cháng)度計算 67
4.5.4 字符串截取 68
4.5.5 字符串替換 69
4.5.6 字符串大小寫(xiě)轉換 70
4.5.7 字符串匹配 71
4.5.8 字符串格式化輸出 72
4.5.9 使用stringr包處理字符串 73
4.6 日期變量的處理和轉換 75
4.6.1 取系統日期和時(shí)間 75
4.6.2 把字符串解析成日期和時(shí)間 76
4.6.3 把日期和時(shí)間解析成字符串 76
4.6.4 對日期中相關(guān)信息的提取與比較 77
4.6.5 使用lubridate包處理日期變量 77
4.7 清洗重復數據 80
4.7.1 查找是否有重復值 80
4.7.2 查找重復值的索引值 80
4.7.3 去除重復值 81
4.8 缺失數據處理 81
4.8.1 缺失數據的識別 81
4.8.2 缺失數據的處理 82
4.9 異常值識別和處理 83
4.9.1 簡(jiǎn)單統計量分析 83
4.9.2 根據3σ原則檢測異常值 84
4.9.3 根據箱型圖檢測異常值 84
4.9.4 蓋帽法 85
4.10 數據集的合并與拆分 86
4.10.1 數據集的合并 86
4.10.2 數據集的拆分 89
4.10.3 數據集的抽取 89
4.10.4 使用tidyr包 92
4.11 實(shí)訓 94
4.12 本章小結 99
練習4 99
第5章 R語(yǔ)言基本圖形 100
5.1 R語(yǔ)言常見(jiàn)圖形 101
5.1.1 散點(diǎn)圖 101
5.1.2 點(diǎn)圖 102
5.1.3 折線(xiàn)圖 102
5.1.4 曲線(xiàn)圖 103
5.1.5 條形圖 104
5.1.6 餅圖 105
5.1.7 箱線(xiàn)圖 107
5.1.8 直方圖 109
5.2 R語(yǔ)言圖形修飾 109
5.2.1 設置符號和線(xiàn)條 110
5.2.2 設置顏色 111
5.2.3 設置文本屬性 111
5.2.4 添加標題 112
5.2.5 添加圖例 113
5.2.6 添加線(xiàn) 113
5.2.7 添加坐標軸 115
5.2.8 添加文本標注 115
5.3 圖形的布局和保存 116
5.3.1 一頁(yè)多圖 116
5.3.2 保存圖形 117
5.4 實(shí)訓 117
5.5 本章小結 123
練習5 123
第6章 ggplot2繪圖基礎和R語(yǔ)言高級繪圖 125
6.1 ggplot2繪圖基礎 126
6.1.1 數據(Data) 126
6.1.2 映射(Mapping) 127
6.1.3 幾何對象(Geometric) 128
6.1.4 標尺(Scale) 131
6.1.5 統計變換(Statistics) 132
6.1.6 坐標系統(Coordinate) 133
6.1.7 圖層(Layer) 134
6.1.8 分面(Facet) 135
6.1.9 主題(Theme) 135
6.1.10 ggplot2繪圖的一般步驟 136
6.2 R語(yǔ)言高級繪圖 136
6.2.1 散點(diǎn)圖矩陣 136
6.2.2 關(guān)系矩陣圖和相關(guān)系數矩陣 137
6.2.3 橢圓 138
6.2.4 三維散點(diǎn)圖 139
6.2.5 氣泡圖 139
6.2.6 網(wǎng)絡(luò )圖 140
6.2.7 馬賽克圖 141
6.2.8 關(guān)鍵字云 142
6.2.9 雷達圖 143
6.2.10 山巒圖 144
6.2.11 交互圖 146
6.3 實(shí)訓 146
6.4 本章小結 155
練習6 155
第7章 R語(yǔ)言數據分析基礎 156
7.1 描述性統計分析 157
7.1.1 常用統計量簡(jiǎn)介 157
7.1.2 描述性統計的函數實(shí)現 159
7.2 R語(yǔ)言數據分析常用函數 161
7.3 t-檢驗 164
7.3.1 單樣本t-檢驗 164
7.3.2 配對樣本t-檢驗 165
7.4 相關(guān)分析 166
7.4.1 相關(guān)性概念 166
7.4.2 相關(guān)分析 167
7.5 聚類(lèi)分析 169
7.5.1 聚類(lèi)分析的概念 169
7.5.2 計算樣本間的距離 169
7.5.3 計算類(lèi)與類(lèi)之間的距離 171
7.5.4 相似系數 171
7.5.5 聚類(lèi)分析的主要步驟 172
7.5.6 分層聚類(lèi) 172
7.5.7 k-means聚類(lèi) 173
7.5.8 聚類(lèi)分析的實(shí)現 174
7.6 主成分分析 175
7.6.1 主成分分析的基本思想 175
7.6.2 主成分分析的幾何解釋 176
7.6.3 主成分分析的數學(xué)模型 177
7.6.4 主成分分析的實(shí)現 177
7.7 實(shí)訓 179
7.8 本章小結 182
練習7 183
第8章 R語(yǔ)言機器學(xué)習基礎 184
8.1 機器學(xué)習概述 185
8.1.1 認識機器學(xué)習 185
8.1.2 機器學(xué)習的應用 185
8.2 機器學(xué)習分類(lèi) 186
8.2.1 監督學(xué)習 186
8.2.2 無(wú)監督學(xué)習 187
8.2.3 半監督學(xué)習 188
8.3 機器學(xué)習常用算法 189
8.3.1 線(xiàn)性回歸 189
8.3.2 邏輯回歸 196
8.3.3 聚類(lèi) 201
8.3.4 神經(jīng)網(wǎng)絡(luò ) 204
8.4 機器學(xué)習基本流程 206
8.4.1 數據的收集 206
8.4.2 數據預處理與特征工程 208
8.4.3 模型的選擇與訓練 209
8.4.4 模型的評估 209
8.5 實(shí)訓 210
8.6 本章小結 214
練習8 214
第9章 R語(yǔ)言訪(fǎng)問(wèn)SQL數據庫 215
9.1 R語(yǔ)言訪(fǎng)問(wèn)數據庫的基本原理 216
9.2 R語(yǔ)言訪(fǎng)問(wèn)SQLite數據庫 216
9.3 R語(yǔ)言訪(fǎng)問(wèn)MySQL數據庫 219
9.4 R語(yǔ)言訪(fǎng)問(wèn)Oracle數據庫 222
9.5 ODBC和RODBC包介紹 224
9.6 實(shí)訓 227
9.7 本章小結 229
練習9 230
參考文獻 231
- 輸水管線(xiàn)工程風(fēng)險管理 [張勇 黨亥生 著(zhù)]
- 民用航空飛機標準線(xiàn)路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著(zhù)]
- 實(shí)用運籌學(xué) [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統研究與開(kāi)發(fā) [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著(zhù)]
- 石墨烯在太赫茲及中紅外頻段電磁器件設計中的應用 [李艷秀 莊華偉 著(zhù)]
- 電子技術(shù)(第二版) [主編 覃愛(ài)娜 李飛]
- 辦公自動(dòng)化高級應用 [陳萍 朱曉玉]
- 信息處理技術(shù)員考試32小時(shí)通關(guān) [薛大龍]
- 電子產(chǎn)品設計案例教程(微課版)—基于嘉立創(chuàng )EDA(專(zhuān)業(yè)版) [王靜 莫志宏 陳學(xué)昌 丁紅]
- C程序設計實(shí)踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- Web技術(shù)開(kāi)發(fā)教程(基于.NET開(kāi)源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務(wù)英語(yǔ)翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術(shù)與應用 [洪旭 著(zhù)]
- 建設工程法規實(shí)務(wù) [主編 余瀅]
- 商務(wù)秘書(shū)理論與實(shí)務(wù)(第三版) [主編 張同欽]
- 程序設計基礎實(shí)踐教程(C/C++語(yǔ)言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動(dòng)爭議處理實(shí)務(wù) [主編 王秀卿 羅靜]
- 工程數學(xué) [主編 郭立娟 王海]
- 語(yǔ)音識別理論與實(shí)踐 [主編 莫宏偉]
- 信息系統項目管理師章節習題與考點(diǎn)特訓(第二版) [主編 薛大龍]
- 武術(shù)基礎教程 [主編 李代勇 謝志民]
- 計算機網(wǎng)絡(luò )實(shí)訓教程 [主編 張浩軍 趙玉娟]
- 畫(huà)法幾何與機械制圖習題集(多學(xué)時(shí)) [主編 趙軍]
- HCIA-Datacom認證題庫分類(lèi)精講 [主 編 韓立剛]
- SwiftUI完全開(kāi)發(fā) [李智威 著(zhù)]
- 網(wǎng)絡(luò )規劃設計師備考一本通 [夏杰 編著(zhù)]