博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python 数据分析 数据挖掘 学习路径图
阅读量:6070 次
发布时间:2019-06-20

本文共 955 字,大约阅读时间需要 3 分钟。

hot3.png

话不多说,相信看到这篇文章的你一定是对数据分析,数据挖掘有兴趣,或者想从事和方面。本文不再累述python对数据分析的重要,数据分析这门的由来之类的。

在这里,我单刀直入,已我学习数据挖掘3年来的经历告诉大家怎么去学,以让大家少走弯路。纯个人见解,如有不对,还请各位留言指教。

话不多说,直接放图。

 

一  学好工具

python语言

推荐看。

数据分析python基础

如list,tuple,dic,set等。我之后的博客会写到。

 

二  获取数据

python爬虫

推荐一本书:《Python网络数据采集》(web Scraping with Python)   Ryan Mitchell 写的,非常好。读完这本书+实战几次爬虫你就算熟练了。我之后写的爬虫博客也会以读这本书时的读书笔记来写。

实战推荐,也可以看我之后写的爬虫实战博客,我是按照他大框架来进行学习的。

 

三 数据的存储与读取

数据的IO,EXCEL,CSV,JSON,SQL数据库。HDF5等。

 

四 NUMPY PANDAS SCIPY MATPLOTLIB

Numpy数组

Pandas 数据分析

Scipy 矩阵

Matplotlib 数据可视化

这一部分推荐看《Python数据分析》(Python Data Analysis)Lvan Idris写的。

 

五 数据预处理

对采集来或现成的数据进行预处理,数据清洗(推荐看《干净的数据=Clean data:数据清洗入门与实践》作者:Megan Squire),数据集成,数据变换,数据规约等。这一部分有兴趣可以看一本书 《Python数据分析与挖掘实战》。这本书看个框架就行。其实写的不咋的。浪费了我好久时间。

 

六 建模 机器学习

学习各种机器学习,数据分析算法。

算法原理推荐看《数据挖掘十大算法》作者:Xindong Wu,Vipin Kumar

python实现推荐看《Python数据分析与挖掘实战》+《Python数据分析》+《机器学习实战》

 

七 神经网络

再往深就是深度学习,神经网络。

 

寄语:

学习每一个都需要付出很大量时间,精力与努力。希望你是真的对数据挖掘,数据分析有兴趣。

转载于:https://my.oschina.net/jiangchike/blog/1628218

你可能感兴趣的文章
开年巨制!千人千面回放技术让你“看到”Flutter用户侧问题
查看>>
开源磁盘加密软件VeraCrypt教程
查看>>
本地vs云:大数据厮杀的最终幸存者会是谁?
查看>>
阿里云公共镜像、自定义镜像、共享镜像和镜像市场的区别 ...
查看>>
shadowtunnel v1.7 发布:新增上级负载均衡支持独立密码
查看>>
Java线程:什么是线程
查看>>
mysql5.7 创建一个超级管理员
查看>>
【框架整合】Maven-SpringMVC3.X+Spring3.X+MyBatis3-日志、JSON解析、表关联查询等均已配置好...
查看>>
要想成为高级Java程序员需要具备哪些知识呢?
查看>>
带着问题去学习--Nginx配置解析(一)
查看>>
onix-文件系统
查看>>
java.io.Serializable浅析
查看>>
我的友情链接
查看>>
多线程之线程池任务管理通用模板
查看>>
CSS3让长单词与URL地址自动换行——word-wrap属性
查看>>
CodeForces 580B Kefa and Company
查看>>
开发规范浅谈
查看>>
Spark Streaming揭秘 Day29 深入理解Spark2.x中的Structured Streaming
查看>>
鼠标增强软件StrokeIt使用方法
查看>>
本地连接linux虚拟机的方法
查看>>