社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

2周年了,聊聊自己的高效学习法,快速拿下数据分析、Python

Python之禅 • 5 年前 • 672 次点击  
之前发过很多关于数据分析的文章,收到大家不少的好评,不过也有一些困惑:
  • 入门数据分析该学哪些知识点?该看哪些书?
  • 是从Python入手还是R语言?常用的算法有哪些?
  • 可以练手做项目的数据库去哪里找?好用的爬虫工具又有哪些?
  • 网上看了很多文章,但感觉没有个系统,号主有系统性的资料推荐吗?


的确,我当时学数据分析也有同样的苦恼,网上关于数据分析的学习资料非常多,但缺乏系统性,没有老师时时给你解答问题,很多时候都感觉自己要放弃了。


但,我不得不说一句:学数据分析绝对没错,坚持下去你会看到一个完全不一样的自己。


之前在百度的曹政举了他身边的例子,令人印象深刻,蛮多看上去并不优秀的人却都能靠着数据分析C位出道。
十来年前我在百度招聘过一个人大本科应届的小伙子邓明生,从学历背景看在百度并不占优势,当时开始跟我做数据分析,写程序分析百度的业务数据,后来慢慢独挡一面,因为对百度所有业务线的数据都清晰,后来百度出现一些人事危机的时候开始成为救火队长,连续在不同业务部门担纲重要职位,一路升到联盟事业部总经理,今年离职出来创办御势资本,青出于蓝而胜于蓝,人家现在比我厉害很多了。
还是十来年前,又有一个应届生吴海生,从百度产品部门申请内部调动去做数据分析,开始经验不足,写报告还被我嘲讽过的那种。好多年不见,最近看新闻才知道,已经某新近上市的金融公司CEO,妥妥的C位出道有没有,真是让人刮目相看。


那么,数据分析到底该怎么学呢?


其实真的没那么复杂,你只需要做好这三件事


1.找到一个实力与经验俱佳的“教练”,从思维、工具、实战带你“即学即用”
2.制定一份正确的学习计划与路径,你真正需要的是好方法而不是蛮力
3.有效工具的运用会让你事半功倍


在这里,不得不给大家介绍下蛮不多的数据分析学习资料 —— 极客时间的《数据分析实战45讲》。作者是清华大学计算机系博士陈旸,最近刚刚更新完毕,好评度也超高。


在这个专栏中,陈旸清晰地把数据分析拆解成下面三个组成部分:数据采集、数据可视化和数据挖掘。在后面文章里,我会给大家分享这三部分所需要掌握的知识,让你有个更深入了解。



专栏里一直秉承着“MAS学习法“,即 Multi-DImension(多维度认识)、Ask(提问)和Sharing(分享),从“思维”到“工具”再到“实践”,学以致用,更高效上手数据分析。而且老师还会直接提供项目数据,让你上手练习,可以在简历上完善项目经历,顺利找到工作。(给大家特意申请的,极客时间2周年特惠福利,有兴趣往下看)


👆练手的数据项目


好,下面接着给大家分享上图中数据采集、数据可视化和数据挖掘需要掌握的知识。

数据采集


当你入门Python后,接下来就算是正式进入数据处理阶段。「数据分析」涵盖两部分:数据是基础,分析是过程,所以数据的前期准备工作也很重要。第一步,就是采集数据。


你可以用Python自动采集数据,也可以使用第三方平台,比如用八爪鱼来采集数据。《数据分析实战45讲》中,作者陈旸用了两个实战案例来讲解如何用Python和八抓鱼来采集数据,讲的非常细致,看完你可以掌握这两种常用方法。
👆老师制作的「Python爬虫总结图」
详细地,你可以去直接看《数据分析实战45讲》专栏里这两篇文章:
  • 第9讲 | 如何用八爪鱼采集微博上的“D&G”评论?
  • 第10讲 | 如何用Python自动化下载王祖贤海报?


数据可视化

大多数人都很容易被数据可视化吸引。试想一下,用各种酷炫的图片将数据的规律直观地呈现给大家,是一件特别有成就感的事情。应用也很广泛,比如天猫双十一的数据大屏等。我们可以用各种工具、编程语言做数据可视化,比如DataV、Tableau、Python或者R语言。


《数据分析实战45讲》中,主要用Python的 Matplotlib 工具来做数据可视化。Matplotlib 是Python的可视化基础库,非常适合入门学习。学完专栏,下面的这几张图我也可以做出来,非常抢眼。



你可以看看《数据分析实战45讲》专栏里这篇文章:
  • 第15讲 | 如何用Python绘制10种常见的可视化视图?


数据挖掘


当你掌握了数据分析中基础的操作后,接下来就该正式处理数据了。为了进行数据挖掘任务,数据科学家们提出了各种算法,《数据分析实战45讲》中详细讲解了数据挖掘十大经典算法,根据用途,把它们分为四大类:
  • 分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CART
  • 聚类算法:K-Means,EM
  • 关联分析:Apriori
  • 连接分析:PageRank


值得一提的是,专栏里用了大篇幅内容、许多案例来讲解这十大算法,还会提供一些数据库让大家去实操,亲测有效。

没记错的话,这个《数据分析实战45讲》专栏,上线没几个月,已经超过1.52w人加入学习,截了点评价给你们做参考:


很幸运的是,极客时间2周年了,全场课程5折起,这里说下我给大家争取到的专属福利。
福利1:极客时间 2 周年,全场课程 5 折起


《数据分析实战45讲》超值特惠,参团只需 ¥65,原价 ¥99,便宜 ¥34。想扩大自己能力边界,想在职场有更多选择的同学们,请抓紧搭上这个福利车。
👇👇👇


除了以上内容外,每篇文章末尾,老师都会针对这一讲的内容总结「学习笔记」,而且都是以手绘图的方式,可以很方便地保存下来,随时温故而知新。


这可是在任何学习资料里,都没有的福利,可以极大降低你学习的门槛,增加学习欲望。



更甚的是,每篇文章后,作者都会留下一个思考题,帮助大家更好吸收知识。



在留言区,你能看到大家各种各样的解题思路,其中有的你可能会意想不到,可以说,在留言区你也能学到很多。作者也会留言回复, 解答大家提出的问题,或者给予及时反馈。


《数据分析实战45讲》超值特惠,参团只需 ¥65,原价 ¥99,便宜 ¥34数据分析能力必然是每个互联网人必须具备的,无论是运营、产品还是程序员,之后还可以往数据分析师、数据挖掘工程师等方向发展。


👆👆👆
扫码订阅
粉丝专属福利
只需 ¥34,拿下数据分析!


再额外给大家推荐几个我感觉很不错的课程,都在做 2 周年活动,口碑都不错!


《Python核心技术与实战》


5 大模块,45 讲,Facebook 资深工程师景霄带你从工程角度,系统掌握 Python,进阶 Python 高手。已经有近 1.1W 人加入学习,评价都挺不错的。而且景霄还会直接带你手把手完成一个用 Python 搭建的交易系统,让你上手练习,即学即用。



除此之外,每篇文章后,作者都会留下一个思考题,帮助大家更好吸收知识。
 
举个例子,在「第 4 篇 | 字典、集合,你真的了解吗?」中,作者讲解了 Python 最常见的 2 种数据结构,留下了这道思考题:



优惠价 ¥65,原价 ¥99👇


《AI技术内参》


“AI技术内参”的干货密集度相当高。作者洪亮劼是现美国电商公司 Esty(国内可能很多人不知道,但在国外非常有名)的数据科学主管,前雅虎研究学科学家。在专栏里,他会带你分析 AI 核心技术和国际顶级论文,让你对人工智能的了解不再浮于表面。


优惠价 ¥79,原价 ¥199,立省 ¥120👇


福利 2:抽奖送价值 612 元实物奖品

留言区说说“你最喜欢极客时间哪个课程,为什么?”
留言点赞1-6名依次得
(截止时间:10月17日12点)

价值¥129 Linux操作系统知识地图2.0 *2份  
价值¥98 每日一课季卡 * 2份  
 价值¥79 原创命令鼠标垫 *2份 
 
实物展示👇
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/46958
 
672 次点击