Python數據分析
-
【作 者】主編 馮志輝 趙磊 李放
【I S B N 】978-7-5226-2166-1
【責任編輯】魏淵源
【適用讀者群】本專(zhuān)通用
【出版時(shí)間】2024-03-05
【開(kāi) 本】16開(kāi)
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁(yè) 數】208
【千字數】333
【印 張】13
【定 價(jià)】¥42
【叢 書(shū)】普通高等教育數據科學(xué)與大數據技術(shù)專(zhuān)業(yè)教材
【備注信息】
簡(jiǎn)介
本書(shū)特色
前言
章節列表
精彩閱讀
下載資源
相關(guān)圖書(shū)
本書(shū)從開(kāi)發(fā)環(huán)境配置入手,以先理論后實(shí)踐的形式講解Python數據分析,理論部分內容包括Python簡(jiǎn)介及數據分析概述、Python語(yǔ)言基礎、科學(xué)計算庫NumPy、數據處理庫Pandas、數據可視化和數據分析方法,由淺入深地引出實(shí)踐部分的三個(gè)經(jīng)典數據分析實(shí)戰案例,并將理論知識綜合應用到數據分析案例中,進(jìn)一步加深知識理解。全書(shū)理論部分可以作為理論課知識進(jìn)行教學(xué),案例內容可以用于實(shí)訓課教學(xué)。全書(shū)章節可以拆分重組,為不同背景知識的學(xué)生提供合適的知識組合,為教師組織教學(xué)提供便利。本書(shū)內容表達圖文并茂、通俗易懂,以實(shí)踐操作應用為導向,側重知識的內在認知邏輯引導,適合于理論與實(shí)踐相結合的教學(xué)方式。
本書(shū)適合作為本科或高職院校的計算機科學(xué)技術(shù)、數據科學(xué)與大數據技術(shù)、人工智能、信息管理、電子商務(wù)、應用數學(xué)、信息與計算科學(xué)、統計學(xué)、金融工程、市場(chǎng)營(yíng)銷(xiāo)等專(zhuān)業(yè)的教學(xué)用書(shū),同時(shí)也適合作為其他相關(guān)專(zhuān)業(yè)的選修課程教材。本書(shū)提供微課視頻,并配套程序源代碼、教學(xué)課件和習題答案。
內容實(shí)用——理論與實(shí)踐結合,重點(diǎn)突出應用
體系完善——構建完整的大數據專(zhuān)業(yè)解決方案
產(chǎn)教融合——高校企業(yè)共參與,對標行業(yè)標準
資源豐富——微課、課件、教案、源碼、答案
“Python數據分析”是信息管理、計算機科學(xué)技術(shù)等專(zhuān)業(yè)的大數據方向及人工智能方向的專(zhuān)業(yè)核心課程之一,課程設置學(xué)期位于職業(yè)能力形成階段,主要講解大數據分析基礎理論、分析工具、分析方法
等。課程目標是使學(xué)生能夠熟練運用Python工具來(lái)解決實(shí)際問(wèn)題,同時(shí)讓學(xué)生掌握在不同領(lǐng)域使用Python擴展模塊解決大數據處理問(wèn)題的方法,要求學(xué)生通過(guò)課堂教學(xué)和實(shí)驗訓練后,具有初步處理數據、獨立分析數據的能力。數據分析作為一種從數據中提煉信息的方法,在就業(yè)方面也是多個(gè)崗位要求掌握的技能。
本書(shū)致力于推動(dòng)數據分析的普及教育,深入淺出地介紹了數據分析相關(guān)知識,使用通俗易懂的語(yǔ)言進(jìn)行講述,內容包括Python語(yǔ)言的語(yǔ)法特點(diǎn)以及數據分析的流程思路,并結合典型應用展開(kāi)闡述,從基本知識和數據分析的邏輯關(guān)系角度,使讀者建立起數據分析的知識體系和框架。本書(shū)不局限于知識和技能的介紹,更注重從數理思維的角度引發(fā)讀者探索數據世界的興趣,激發(fā)求知欲,使其通過(guò)理論學(xué)習和實(shí)踐過(guò)程的反復迭代,在認識客觀(guān)世界的方法上有更加深刻的認識,這也是辯證唯物主義實(shí)踐觀(guān)和認識觀(guān)的一種學(xué)習體驗。
本書(shū)共9章,前6章為理論部分,包括Python簡(jiǎn)介及數據分析概述、Python語(yǔ)言基礎、科學(xué)計算庫NumPy、數據處理庫Pandas、數據可視化、數據分析方法;后面3章結合數據分析的典型案例,進(jìn)行數據分析實(shí)戰演練。
本書(shū)的編寫(xiě)注重可讀性和邏輯性,并在章節中增加了課程思政的案例和內容,將知識傳授、能力培養和價(jià)值塑造有機融合。本書(shū)由馮志輝、趙磊、李放擔任主編,魚(yú)明、陳慧穎、陳祥擔任副主編。本書(shū)的Pandas講解及案例編程部分得到了東北師范大學(xué)趙志銘的支持和幫助,另外在本書(shū)編寫(xiě)過(guò)程中,智慧云未來(lái)科技(北京)有限公司黃智慧總經(jīng)理和北京普開(kāi)數據技術(shù)有限公司劉生副總經(jīng)理給予了技術(shù)指導,中國水利水電出版社的領(lǐng)導和編輯也給予了很大的支持與幫助,并付出了辛勤勞動(dòng),在此一并向他們表示衷心感謝。
由于編者水平有限,加之時(shí)間倉促,書(shū)中難免存在錯誤和不妥之處,懇請讀者批評指正。
編 者
2023年9月
第1章 Python簡(jiǎn)介及數據分析概述 1
1.1 Python簡(jiǎn)介 1
1.1.1 Python語(yǔ)言的特點(diǎn) 1
1.1.2 Python語(yǔ)言的應用領(lǐng)域 2
1.2 Python開(kāi)發(fā)環(huán)境部署 3
1.2.1 下載對應版本安裝文件 4
1.2.2 Python的安裝及相關(guān)文件介紹 6
1.3 擴展庫的安裝 9
1.4 開(kāi)發(fā)環(huán)境應用示例 12
1.4.1 Anaconda的功能介紹及安裝 12
1.4.2 JupyterLab的使用及文本數據分析
實(shí)例演示 14
1.5 數據分析概述 18
1.5.1 數據分析的過(guò)程 18
1.5.2 數據分析常用擴展庫 19
本章小結 20
練習1 20
第2章 Python語(yǔ)言基礎 22
2.1 數據類(lèi)型 22
2.1.1 數值 22
2.1.2 字符串 24
2.1.3 列表 25
2.1.4 元組 25
2.1.5 集合 26
2.1.6 字典 26
2.2 數據類(lèi)型的共有方法 27
2.2.1 索引 27
2.2.2 切片 28
2.2.3 提取長(cháng)度 28
2.2.4 統計 28
2.2.5 確認成員身份 29
2.2.6 刪除變量 29
2.3 字符串、列表、元組、集合及字典的方法 30
2.3.1 字符串的方法 30
2.3.2 列表的方法 33
2.3.3 元組的方法 35
2.3.4 集合的方法 36
2.3.5 字典的方法 38
2.4 內置函數、內置模塊與自定義函數 40
2.4.1 內置函數 40
2.4.2 高級函數 41
2.4.3 help()函數 43
2.4.4 內置函數與內置模塊的區別 44
2.4.5 常用的內置模塊 44
2.4.6 自定義函數 44
2.5 類(lèi)和對象 47
2.5.1 類(lèi)和對象的概念 47
2.5.2 類(lèi)和對象的使用 47
2.5.3 類(lèi)和對象實(shí)例演示 48
2.6 讀取數據文件 50
本章小結 51
練習2 51
第3章 科學(xué)計算庫NumPy 54
3.1 NumPy簡(jiǎn)介 54
3.2 NumPy中的對象 55
3.2.1 ndarray對象 56
3.2.2 array對象的屬性和方法 58
3.2.3 NumPy創(chuàng )建數組 58
3.3 NumPy中數組的索引 62
3.3.1 數組的維度和基本索引 62
3.3.2 高級索引 63
3.4 Numpy中的統計函數 64
3.5 Numpy中的矩陣操作 66
本章小結 67
練習3 68
第4章 數據處理庫Pandas 70
4.1 Pandas簡(jiǎn)介 70
4.1.1 Pandas的安裝與導入 70
4.1.2 數據類(lèi)型Series 71
4.1.3 數據類(lèi)型DataFrame 71
4.2 數據文件讀取 72
4.2.1 excel文件讀取 72
4.2.2 csv文件讀取 73
4.3 數據類(lèi)型Series和DataFrame 73
4.3.1 Series常見(jiàn)的屬性與方法 73
4.3.2 DataFrame常見(jiàn)的屬性與方法 84
4.4 Pandas的高級操作 95
4.4.1 Pandas的高級操作簡(jiǎn)介 95
4.4.2 Pandas數據分析案例1 97
4.4.3 Pandas數據分析案例2 99
本章小結 107
練習4 107
第5章 數據可視化 109
5.1 數據可視化簡(jiǎn)介 109
5.2 Matplotlib可視化 110
5.2.1 Matplotlib散點(diǎn)圖示例 111
5.2.2 Matplotlib線(xiàn)圖示例 112
5.2.3 Matplotlib柱狀圖示例 113
5.2.4 Matplotlib餅圖示例 114
5.2.5 Matplotlib箱線(xiàn)圖示例 115
5.2.6 Matplotlib直方圖示例 116
5.2.7 Matplotlib多子圖示例 117
5.3 Pandas繪圖 120
本章小結 125
練習5 125
第6章 數據分析方法 127
6.1 數據分析方法概述 127
6.1.1 ETL(Extract-Transform-Load) 127
6.1.2 數據分析中常用的方法 128
6.2 數據預處理 128
6.2.1 異常值處理 128
6.2.2 缺失值處理 129
6.2.3 歸一化處理 129
6.3 分類(lèi)與預測 130
6.3.1 決策樹(shù) 130
6.3.2 樸素貝葉斯 134
6.3.3 支持向量機 136
6.3.4 神經(jīng)網(wǎng)絡(luò ) 139
6.4 回歸 142
6.4.1 線(xiàn)性回歸 142
6.4.2 非線(xiàn)性回歸 143
6.5 聚類(lèi) 144
6.5.1 層次聚類(lèi) 144
6.5.2 非層次聚類(lèi) 146
本章小結 147
練習6 147
第7章 電影數據分析 150
7.1 項目簡(jiǎn)介 150
7.2 代碼實(shí)現 150
7.2.1 數據清洗 150
7.2.2 編程打分 153
7.2.3 其他數據類(lèi)型處理 157
7.2.4 建模分析 162
本章小結 165
練習7 165
第8章 客戶(hù)價(jià)值分析 166
8.1 項目簡(jiǎn)介 166
8.2 代碼實(shí)現 167
8.2.1 數據清洗 167
8.2.2 客戶(hù)屬性與客戶(hù)流失的關(guān)系分析 171
8.2.3 產(chǎn)品屬性與客戶(hù)流失的關(guān)系分析 175
8.2.4 客戶(hù)行為與客戶(hù)流失的關(guān)系分析 179
本章小結 187
練習8 187
第9章 房?jì)r(jià)預測分析 188
9.1 項目簡(jiǎn)介 188
9.2 代碼實(shí)現 189
9.2.1 線(xiàn)性回歸 194
9.2.2 隨機森林 197
9.2.3 支持向量機 199
9.2.4 模型評估比較 201
本章小結 201
練習9 201
參考文獻 202
- Python程序設計及實(shí)踐教程 [肖朝暉]
- C語(yǔ)言程序設計 [魏琴 劉祖珉 趙仕波 肖陽(yáng)春]
- C語(yǔ)言程序設計實(shí)驗教程 [張小剛 司春景]
- 電氣控制與PLC程序設計(第二版) [胡冠山]
- Java Web項目化設計實(shí)踐教程 [邱云 曾陳萍]
- 人工智能開(kāi)發(fā)框架應用 [主編 王明超 蘆婭云]
- C語(yǔ)言程序設計(第三版) [主編 丁紅 王立新 蔡開(kāi)立]
- 民航客艙服務(wù)實(shí)用英語(yǔ)教程 [主編 田靜 徐亞玲]
- 大學(xué)信息技術(shù) [曾翰穎 編著(zhù)]
- Python程序設計與應用(第二版) [主編 張廣淵]
- 多維視域下的高校籃球教學(xué)創(chuàng )新研究 [張利超 李寧 著(zhù)]
- 創(chuàng )新創(chuàng )業(yè)訓練實(shí)踐教程 [主編 王日華 陳武 黃喆誠]
- 實(shí)用運籌學(xué) [主編 邢育紅 于晉臣]
- 電子技術(shù)(第二版) [主編 覃愛(ài)娜 李飛]
- C程序設計實(shí)踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- 程序設計基礎實(shí)踐教程(C/C++語(yǔ)言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動(dòng)爭議處理實(shí)務(wù) [主編 王秀卿 羅靜]
- 工程數學(xué) [主編 郭立娟 王海]
- 語(yǔ)音識別理論與實(shí)踐 [主編 莫宏偉]
- 武術(shù)基礎教程 [主編 李代勇 謝志民]
- 計算機網(wǎng)絡(luò )實(shí)訓教程 [主編 張浩軍 趙玉娟]
- 畫(huà)法幾何與機械制圖習題集(多學(xué)時(shí)) [主編 趙軍]
- SwiftUI完全開(kāi)發(fā) [李智威 著(zhù)]
- 電工電子技術(shù)基礎 [主編 劉 軍 楊國龍 劉天成]
- MySQL數據庫項目式教程 [陳亞峰]
- 機械設計基礎(第二版) [主編 田亞平 李?lèi)?ài)姣]
- 畫(huà)法幾何與機械制圖 [主編 趙軍]
- C語(yǔ)言程序設計習題與實(shí)驗指導(第二版) [主編 甄增榮 張賓]