我是个只会用 Excel 的数据分析工作者。有一天,我和同事大鹏约好晚上一起喝酒,离下班还有 5 分钟,老板突然 Q 我:
912个CSV表格,每个表格共370列,约360行不等这么多!我试了一下 Power Query, 电脑不客气地歇菜了,这要是纯手动复制非得睡公司不可。我瘫在工位上:“鹏哥,我今天怕是得和 912 张表共度良宵,你自个儿去喝酒吧。”
大鹏听完来龙去脉却哈哈一笑:“小事一桩,今晚这酒还真得喝定了,看我的!”
我半信半疑看着大鹏打开一个黑色的窗口,刷刷刷敲了几行代码,一份合并好的表格就很快完成了!
顺利下班!之前我总觉得 Excel 能做好多事情,自己学习动力也不是特别强,很多时候都得过且过,并且看到代码有点望而生畏,看起来好像很难的样子,但没想到这么方便。我坐不住了:鹏哥,你会的这个代码,怎么这么厉害,比 Excel 还好用啊?
大鹏神秘一笑:Python 可强大了,远不止你看到的这些。
刚才处理表格的效率你看到了,更厉害的是如果有类似的工作任务,我们只需要更改一下工作路径,这份代码便可以直接使用,可谓一劳永逸。
除了合并表格这类需求,批量出图是不是也曾经困扰你?想想你用 Excel 怎么做数据分析的:
从数据的清洗整理到出图的每一步都要鼠标点击,非常繁琐且容易出错,而使用 Python 只需几行代码即可轻松出图:
当你面对高重复性的工作时,也只需要略微改动,或者引入循环,再也不用点鼠标点到手抽筋了。我有点心动:好像是比 Excel 方便多了,会用 Python 肯定能大大提高工作效率。
就在我在心里为大鹏的表演喊“666”的同时,大鹏又滔滔不绝地讲了起来:小刘,你别看我前面只提到了使用 Python 整整表格出出图,人家可是著名的“胶水语言”。
大鹏解释道:Python 可以利用 MySQLdb 库连接数据库,可以利用 pandas 和 matplotlib 进行清洗和分析,可以利用 pyecharts 进行交互可视化,可以利用numpy 和 sklearn 进行建模,甚至可以利用 pyinstaller 打包工作流交给同事,共同提效……而且这些库的丰富程度,可以说是超出你的想象,以 Python 可视化必知基本库 matplotlib 为例,光是他的官方 gallery 就有 26 个大类 527 个样式,数量上就碾压了市面上大部分同功能软件。matplotlib官网:https://matplotlib.org/tutorials/index.html
Python 可视化类工具会有针对图表样式进行调整的代码,也可以交互,几行代码,省时省力,分分钟关机下班。
比较一下 Seaborn 的图表库和 Excel 的图表库,感受差距:
这就有点惊讶到我了:这效率和酷炫程度和 Excel 根本不是一个层级的。这么游刃有余的本事,不可谓不吸引人啊!会用 Python 肯定能做更多的事情,让老板刮目相看。
我随手找了一点资料:Python 官方在今年2月做了一份报告,从官方的角度说明了 Python 的使用状况和受欢迎程度。该调查由 Python 软件基金会与 JetBrains 一起发起,有来自 150 多个国家的超过两万名开发人员参与。
从官方喜出望外的报告中,我发现 Python 受到大部分人的欢迎,是用户手中的香饽饽:
在 Python 的用途上,大家使用 Python 最常用的场景是数据分析,并且相比 2017 年,2018 年的涨幅也是相比最高的,相关的机器学习场景涨幅也有 7%。
再结合大鹏哥的介绍,Python 语言的这种火热程度也是不难理解了。看来,使用 Python 进行数据分析是时代的趋势。
我有点坐不住了:鹏哥,我从来没写过代码,但我真想学会你这一手 Python 数据分析本事啊!
“没问题,”大鹏自信地说,“小刘你这么勤学好问,又对数据有兴趣,只要找对了正确的方法,肯定学得快。正好最近我有一个直播,你要不要来听听?”这个直播课程是由网易云课堂和专业数据机构城市数据团联合打造,每周一至周四固定开课,现在限时 0 元领取。不仅如此,还有 Python 入门资料包免费送哦~扫码领取
限时 0 元 Python 数据分析课程

课程详情
1. Python 基础语法学习路径
2. 十大易错点分别是哪些?
3. 用 Python 实现第一个数据爬虫
1. 如何用 Python 快速处理数据?
2. 初学者使用 Pandas 最容易犯的错误
3. Pandas 套路总结
1.前置知识:工具库及数据指标计算
2.Python 筛选,整合,清洗股票数据
3.Python 优化选定股票持仓比例
8.19-8.22限时0元课程8.19-8.22限时0元
扫码领取
限时 0 元 Python 数据分析课程

咨询人数较多,请耐心等待~