社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python2 已终结,入手Python 3,你需要这30个技巧

中国人工智能学会 • 5 年前 • 445 次点击  

转自 机器之心

选自medium

作者:Erik-Jan van Baaren

机器之心编译

参与:王子嘉、一鸣


Python2 在今年和我们说拜拜了,Python3 有哪些有趣而又实用的技巧呢?这篇教程有 30 个你会喜欢的方法。


勤劳的程序员们,这里有 30 条使用 Python 时实用的建议和小技巧。你可以把读这篇文章当做工作间隙的小憩,而且我保证你学到的东西会跟工作时一样多。

1. 使用 Python3

如果你关注 Python 的话,应该会知道 Python 2 已经于今年(2020 年)1 月 1 日正式弃用了。这份教程的很多例子都是只支持 Python 3 的,如果你还在用 Python 2.1,那也是时候与时俱进了。

2. 检查所需的最低 Python 版本

你可以在代码中先检查一下你的 Python 版本,以免当前用户的 Python 版本与你的脚本不适配。实现的代码很简单:


3. 使用 IPython


IPython 其实就是升级版的 shell,单单是自带的自动补全功能就值得你使用它了。不过它的优势不止这些,它那些如魔法般的内置命令行也让是我爱使用它的原因。这些命令有:


  • %cd—修改当前工作路径

  • %edit—打开编辑器,并在关闭时执行你刚刚输入的代码

  • %env—显示当前环境变量

  • %pip install [pkgs]—在不离开 Shell 的情况下安装包

  • %time and %timeit—为 Python 代码计时


如果你想了解更多的命令,可以参考这个网站:
https://ipython.readthedocs.io/en/stable/interactive/magics.html。

还有一个有用的功能就是调取之前的命令输出,这里的输入和输出其实都是对象。例如,你可以用 Out[3] 来调取第三条命令的输出。

你可以用下面这条命令安装 IPython:


pip3 install ipython

4. 列表表达式

有了列表表达式,你就不再需要用 for loop 来生成一个 list 了。其基本语法是这样的:


[ expression for item in list if conditional ]


这就是一个生成包含一串数字的 list 的简单例子。


在这条命令里还可以使用表达式(expression),所以也可以做一些数学运算:



你甚至可以调用一个外部函数:


最后,你也可以在生成 list 时用 if 语句进行筛选。下面这个例子中,我们只保留了能被 2 整除的值:


5. 检查你的对象占用了多少内存

你可以使用 sys.getsizeof() 来查看你创建的对象占用的内存大小:



哇,等一下,为什么这么大的 list 只有 48 字节?
这是因为 range 函数只返回了一个类似 list 的类。由此可见,相较于直接使用 list,使用 range 能节省很多空间:


6. 返回多个值

Python 的函数可以同时返回多个值,也并不需要使用 dictionary,list 或是类这样的数据结构。它的工作机制是这样的



这种方式在返回值的数量很少时是可以的,但是如果返回值超过 3 个,那它们就该被放到一个(数据)类中了。

7. 使用数据类

Python 从 3.7 开始提供数据类功能。这种功能与常规的类以及其他类似的功能(返回多个值的函数以及 dictionary)相比较,有以下优势:

  • 数据类型有最低代码量要求

  • 因为数据类已经自带了__eq__功能,故而你可以直接进行数据类的对比

  • 数据类自带__repr__,你也可以直接在 debug 时打印出一个数据类

  • 数据类型需要你输入提示,这样 bug 量会大大减少


下面展示了一个实用的数据类例子:



想更深入的了解数据类,可以参考:https://realpython.com/python-data-classes/

8. 在位置不变的情况下交换变量

一个小技巧就可以减少很多行代码:


9. 合并 dictionary(Python 3.5+)

从 Python 3.5 开始,dictionary 的合并变得更容易了:



如果有重复的 key,那么第一个词典的这个 key 对应的值会被覆盖掉。

10. 把字符串变成标题形式

这只是 Python 中的宝藏之一:



11. 把字符串分割成 list

你可以把一个字符串分割成一个 list 的字符串。下面的例子中,我们是按照空格分割字符串的:



12. 将一个字符串列表变成一个字符串

把上一个小技巧反过来,我们也可以把一个 list 变成一个字符串,并在每个词中间插入空格:


你可能在想为什么不用

mylist.join(" ")

好问题!

这是因为 String.join() 可以连接任何可迭代对象,不只是列表。在 String 中用这个函数可以防止这些操作发生在我们不想他发生的地方。

13. Emoji




这个功能有些人喜欢,有些人则很抗拒,因人而异。严格来说,这个功能主要好处就是在分析社交数据时可以更加方便。

首先,你要安装 emoji 模块:


pip3 install emoji


安装完后,你可以像下面这样使用这个模块:


想要更深入的了解 emoji 模块,可以参考:https://pypi.org/project/emoji/。

14. list 切片

list 切片的基本使用形式如下:


a[start:stop:step]

Start, Stop 和 Step 都是可选参数。如果你没有定义,它们就会按照如下规则分配默认值:
  • start = 0

  • end = 方括号里面字符串的最后一个字符

  • step = 1



15. 翻转字符串和 list

你可以用刚刚提到的切片操作来翻转字符串和 list。把 step 设置成-1,就成完成翻转操作:



16. 展示小猫的图片

我终于还是发现了一个可以在我文章中提到小猫的机会!当然,你也可能是用这个功能来展示其他的图。首先,你要安装 Pillow,这是 Python Image 库的一个分支:


pip3 install Pillow


现在把这个图像下载下来并命名为 kittens.jpg:



图源:Pixabay 的 TheDigitalArtist

你可用下面这段 python 代码来显示图像。


或者你可以直接在 IPython 上做这件事。



Pillow 能做的可不止这些。它可以对图片进行分析、裁剪、过滤、增强、变形等等。如果想要更深入的了解,可以去看一下它的文档:
https://pillow.readthedocs.io/en/stable/

17. 使用 map()

Python 的内置函数之一就是 map()。map() 的语法如下:

所以你可以给它一个函数让其执行,然后还要传给它对应的参数。这个参数可以使任何可迭代对象。下面的例子里我用了 list:




快去看看你的代码,是不是有的地方可以用 map() 而不是 loop!

18. 从 list 或是 string 中获取 unique 元素

你可以用 set() 来获取 list 或是类似于 list 的对象的 unique 元素,结果返回为一个 set。




19. 找到高频值

在 list 或字符创中获取高频值:


  • max() 会返回 list 中的最高值。而 key 可以利用一个输入(如本例中的 test.count)来确定你要排序的方式。这个函数会应用于前面可迭代对象的每一项。

  • test.count 是 list 的内置函数。我们给它一个输入,它会统计那个输入的出现次数。test.count(1) 就会返回 2,test.count(4) 就会返回 4。

  • set(test) 会返回 unique 值,也就是 {1, 2, 3, 4}



所以这一行代码所做的事就是先找到所有的 unique 值({1, 2, 3, 4}),然后 max 就会对这四个值分别进行 list.count 操作,并返回最大值。

20. 创建进度条

你可以创建你自己的进度条,也是很有意思的。但是直接使用 progress 包会快很多:


pip3 install progress



现在你可以毫不费力的创建一个进度条了:




下面这个动画展示了所有可能的进度条类型:




图源:Giotgos Verigakis, https://pypi.org/project/progress/

21. 在交互 shell 中使用「_」

你可以用下划线来获得上一条命令的输入,在 IPython 中是这样的:


In [1]: 3 * 3
Out[1]: 9In [2]: _ + 3
Out[2]: 12



Python shell 中这条命令也可以用。IPython shell 中你也可以用 Out[n] 来获得 In[n] 的输出。比如说,在上面的例子中,Out[1] 就会返回 9。

22. 快速创建一个网页服务器

你可以快速创建一个网页服务器,并将当前的路径作为内容:


python3 -m http.server



如果你想跟你的同事分享一些东西,或者测试一些简单的 HTML 网站,那这条命令就很有用了。

23. 多行字符串

尽管你可以在代码中用三重引号(“ “ “ ” ” ”)来存储多行字符串,但这并不是理想的方法。你在三重引号间的所有内容都变成了字符串,如下图所示,连格式符都变成了字符串。
我比较倾向于使用第二种方式。这种方式可以把很多行合并到一起,同时你的代码格式也会很好。这个方法唯一的缺点就是你要明确定义换行的位置。




24. 条件赋值的三元运算符

这是那些让你代码在保证可读性的情况下更简洁的方法之一:


[on_trueif [expression] else [on_false]

实例如下:

x = "Success!" if (y == 2) else "Failed!"



25. 统计出现数

你可以使用 collection 库来获得 list 中各个 unique 值的计数,并返回成一个 dictionary:




26. 比较符链(chaining of comparison operators)

Python 里,你可以把比较符连接成一条链,这样代码会更有可读性,而且更简洁。



27. 加一些色彩



Colorama 中 Jonathan Hartley 的截屏

使用 Colorama,你可以在你的终端上添加点颜色。




28. 日期计算

python-dateutil 模块对标准的 datatime 模块做了很大的扩充。先下载一下这个模块:


pip3 install python-dateutil



你可以用这个库做很多很酷的事情。我只会给你们介绍我发现的很有用的一个例子:日志文件中日期的模糊解析等。




记住一点:基本的 Python 日期函数对一些问题束手无策的时候,这时 python-deteutil 就能发挥作用。

29. 整除



图源:公共源 - Torindkflt

Python 2 中,除号(/)默认为整除,除非其中一个被操作数是浮点数。所以你会得到这样的结果:


# Python 2
5 / 2 = 2
5 / 2.0 = 2.5

在 Python 3 中,除号的结果默认为浮点数,而//则成为了整除的符号,所以这个时候结果变成了:

Python 3
5  / 2 = 2.5
5 // 2 = 2

如果想要深入了解这一改变,请参考:https://www.python.org/dev/peps/pep-0238/。


30. 使用 chardet 检测 Charset

你可以使用 chardet 模块来检测一个文件的 charset。当你在分析大量的文本时,这个模块就会变得很有用。你可以用下面这条命令下载它:


pip install chardet



你现在会有一个命令行工具——chardetect,这个工具的使用方式是:


chardetect somefile.txt
somefile.txtascii with confidence 1.0



你可以以在程序中使用这个库,详见:
https://chardet.readthedocs.io/en/latest/usage.html

这就是所有的教程啦!希望大家喜欢这些技巧!

参考链接:
https://towardsdatascience.com/30-python-best-practices-tips-and-tricks-caefb9f8c5f5


文为机器之心编译,转载请联系本公众号获得授权
✄------------------------------------------------
加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com
投稿或寻求报道:content@jiqizhixin.com
广告 & 商务合作:bd@jiqizhixin.com
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/53214
 
445 次点击