流畅的Python的学习记录
1.0 特殊方法
- 如何理解 :Python 解释器碰到特殊的句法时,会使用特殊方法去激活一些基本的对象操作,这些特殊方法的名字以两个下划线开头,以两个下划线结尾(例如 getitem)。比如 obj[key]的背后就是
__getitem__
方法,为了能求得 my_collection[key] 的值,解释器实际上会调用 my_collection.__getitem__
(key)。
1.1 特殊方法的案例 1
接下来我会用一个非常简单的例子来展示如何实现 __getitme__
和 __len__
这两个特殊方法,通过这个例子我们也能见识到特殊方法的强大。
示例 1-1 里的代码建立了一个纸牌类
1
2
3
4
5
6
7
8
9
10
11
12
import collections
Card = collections.namedtuple('Card', ['rank', 'suit'])
class FrenchDeck:
ranks = [str(n) for n in range(2, 11)] + list('JQKA')
suits = 'spades diamonds clubs hearts'.split()
def __init__(self):
self._cards = [Card(rank, suit) for suit in self.suits
for rank in self.ranks]
def __len__(self):
return len(self._cards)
def __getitem__(self, position):
return self._cards[position]
-
我们用 collections.namedtuple 构建了一个简单的类来表示一张纸牌。自 Python 2.6 开始,namedtuple 就加入到 Python 里,用以构建只有少数属性但是没有方法的对象,比如数据库条目。如下面这个控制台会话所示,利用 namedtuple,我们可以很轻松地得到一个纸牌对象:
>>> beer_card = Card(‘7’, ‘diamonds’)
>>> beer_card
Card(rank=’7’, suit=’diamonds’)
-
可以用 len() 函数来查看一叠牌有多少张, 其实就是调用
__len__
函数:>>> deck = FrenchDeck()
>>> len(deck)
52
-
比如说第一张或最后一张,是很容易的:deck[0] 或 deck[-1]。这都是由
__getitem__
方法提供的:>>> deck[0]
Card(rank=’2’, suit=’spades’)
>>> deck[-1]
Card(rank=’A’, suit=’hearts’)
-
Python 已经内置了从一个序列中随机选出一个元素的函数 random.choice,我们直接把它用在这一摞纸牌实例上就好:(调用
__getitem__
)>>> from random import choice
>>> choice(deck)
Card(rank=’3’, suit=’hearts’)
>>> choice(deck)
Card(rank=’K’, suit=’spades’)
>>> choice(deck)
Card(rank=’2’, suit=’clubs’)
-
列出了查看一摞牌最上面 3 张和只看牌面是 A 的牌的操作。其中第二种操作的具体方法是,先抽出索引是 12 的那张牌,然后每隔 13 张牌拿 1 张:(start : end : step)
>>> deck[:3] (取 [0,1,2])
[Card(rank=’2’, suit=’spades’), Card(rank=’3’, suit=’spades’),
Card(rank=’4’, suit=’spades’)]
>>> deck[12::13] (从12开始取到最后,但是要隔13张取一次)
[Card(rank=’A’, suit=’spades’), Card(rank=’A’, suit=’diamonds’),
Card(rank=’A’, suit=’clubs’), Card(rank=’A’, suit=’hearts’)]
-
仅仅实现了
__getitem__
方法,这一摞牌就变成可迭代的了>>> for card in deck:
print(card)
Card(rank=’2’, suit=’spades’)
Card(rank=’3’, suit=’spades’)
Card(rank=’4’, suit=’spades’)
…
-
反向迭代也没关系:
>>> for card in reversed(deck):
print(card)
Card(rank=’A’, suit=’hearts’)
Card(rank=’K’, suit=’hearts’)
Card(rank=’Q’, suit=’hearts’)
…
-
迭代通常是隐式的,譬如说一个集合类型没有实现
__contains__
方法,那么 in 运算符就会按顺序做一次迭代搜索。于是,in 运算符可以用在我们的 FrenchDeck 类上,因为它是可迭代的:(也就是说,如果没有实现__contains__
方法,那么 in 运算符 就迭代判断,会迭代调用__getitem__
来取数值 )>>> Card(‘Q’, ‘hearts’) in deck
True
>>> Card(‘7’, ‘beasts’) in deck
False
-
排序,我们按照常规,用点数来判定扑克牌的大小,2 最小、A最大;同时还要加上对花色的判定,黑桃最大、红桃次之、方块再次、梅花最小。下面就是按照这个规则来给扑克牌排序的函数,梅花 2 的大小是 0,黑桃 A 是 51: (每一张牌可以代表一个数字,梅花 2的数值是0, 黑桃 A 的数值是 51)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
suit_values = dict(spades=3, hearts=2, diamonds=1, clubs=0) def spades_high(card): rank_value = FrenchDeck.ranks.index(card.rank) return rank_value * len(suit_values) + suit_values[card.suit] for card in sorted(deck, key=spades_high): # doctest: +ELLIPSIS print(card) 输出 : Card(rank='2', suit='clubs') Card(rank='2', suit='diamonds') Card(rank='2', suit='hearts') ... (46 cards ommitted) Card(rank='A', suit='diamonds') Card(rank='A', suit='hearts') Card(rank='A', suit='spades')
1.2 如何使用特殊方法
首先明确一点,特殊方法的存在是为了被 Python 解释器调用的,你自己并不需要调用它们。也就是说没有 my_object.__len__
() 这种写法,而应该使用 len(my_object)。在执行 len(my_object) 的时候,如果my_object 是一个自定义类的对象,那么 Python 会自己去调用其中由你实现的 __len__
方法。
通常你的代码无需直接使用特殊方法。除非有大量的元编程存在,直接调用特殊方法的频率应该远远低于你去实现它们的次数。唯一的例外可能是 __init__
方法,你的代码里可能经常会用到它,目的是在你自己的子类的 __init__
方法中调用超类的构造器。
1.3 特殊方法的案例 2
示例 1-2 一个简单的二维向量类
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
from math import hypot
class Vector:
def __init__(self, x=0, y=0):
self.x = x
self.y = y
def __repr__(self):
return 'Vector(%r, %r)' % (self.x, self.y)
def __abs__(self):
return hypot(self.x, self.y)
def __bool__(self):
return bool(abs(self))
def __add__(self, other):
x = self.x + other.x
y = self.y + other.y
return Vector(x, y)
def __mul__(self, scalar):
return Vector(self.x * scalar, self.y * scalar)
-
Python 有一个内置的函数叫 repr,它能把一个对象用字符串的形式表达出来以便辨认,这就是“字符串表示形式”。repr 就是通过
__repr__
这个特殊方法来得到一个对象的字符串表示形式的。如果没有实现__repr__
,当我们在控制台里打印一个向量的实例时,得到的字符串可能会是 <Vector object at 0x10e100070>。 例如:(控制台里打印一个向量的实例的时候,会调用 repr函数,repr函数会调用__repr__
)v1 = Vector(2, 4)
v2 = Vector(2, 1)
print(v1 + v2)
输出:Vector(4, 5)
-
同样,str.format 函数所用到的新式字符串格式化语法也用到了 repr 函数
-
__repr__
和__str__
的区别在于,后者是在 str() 函数被使用,或是在用 print 函数打印一个对象的时候才被调用的,并且它返回的字符串对终端用户更友好。如果一个对象没有__str__
函数,而 Python 又需要调用它的时候,解释器会用__repr__
作为替代 -
通过
__add__
和__mul__
,示例 1-2 为向量类带来了 + 和 * 这两个算术运算符。 -
bool(x) 的背后是调用x.
__bool__
() 的结果;如果不存在__bool__
方法,那么 bool(x) 会尝试调用 x.
__len__
()。若返回 0,则 bool 会返回 False;否则返回True。 -
Python 语言参考手册中的“DataModel”(https://docs.python.org/3/reference/datamodel.html)一章列出了83 个特殊方法的名字,其中 47 个用于实现算术运算、位运算和比较操作。
调用CMD窗口
- 命令窗口(Windows 使用 win+R 调出 cmd 运行框)
查看 Python 版本
- python –version
Python 运行文件
-
hello.py
-
1 2
#!/usr/bin/python3
print(“Hello, World!”)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
- python hello.py
### 集成开发环境 IDE
- PyCharm [下载地址](https://www.jetbrains.com/pycharm/download/)
### *#!/usr/bin/python3*
- 脚本语言的第一行,目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它,就这么简单。
**#!/usr/bin/python3** 是告诉操作系统执行这个脚本的时候,调用 /usr/bin 下的 python3 解释器;
**#!/usr/bin/env python3** 这种用法是为了防止操作系统用户没有将 python3 装在默认的 /usr/bin 路径里。当系统看到这一行的时候,首先会到 env 设置里查找 python3 的安装路径,再调用对应路径下的解释器程序完成操作。
**#!/usr/bin/python3** 相当于写死了 **python3** 路径;
**#!/usr/bin/env python3** 会去环境设置寻找 python3 目录,**推荐这种写法**。
### 注释
```python
#!/usr/bin/python3
# 第一个注释
# 第二个注释
'''
第三注释
第四注释
'''
"""
第五注释
第六注释
"""
print ("Hello, Python!")
行与缩进
- python最具特色的就是使用缩进来表示代码块,不需要使用大括号 {},缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数
1
2
3
4
5
6
if True:
print ("Answer")
print ("True")
else:
print ("Answer")
print ("False") # 缩进不一致,会导致运行错误
import 与 from…import
-
在 python 用 import 或者 from…import 来导入相应的模块。
将整个模块(somemodule)导入,格式为: import somemodule
从某个模块中导入某个函数,格式为: from somemodule import somefunction
从某个模块中导入多个函数,格式为: from somemodule import firstfunc, secondfunc, thirdfunc
将某个模块中的全部函数导入,格式为: from somemodule import *
-
1 2 3 4 5 6 7 8 9 10 11 12 13
import sys print('================Python import mode==========================') print ('命令行参数为:') for i in sys.argv: print (i) print ('\n python 路径为',sys.path) from sys import argv,path # 导入特定的成员 print('================python from import===================================') print('path:',path) # 因为已经导入path成员,所以此处引用时不需要加sys.path
赋值
-
Python 中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。
在 Python 中,变量就是变量,它没有类型,我们所说的”类型”是变量所指的内存中对象的类型。
等号(=)用来给变量赋值。
等号(=)运算符左边是一个变量名,等号(=)运算符右边是存储在变量中的值
-
1 2 3 4 5 6 7 8 9
#!/usr/bin/python3 counter = 100 # 整型变量 miles = 1000.0 # 浮点型变量 name = "runoob" # 字符串 print (counter) print (miles) print (name)
标准数据类型
-
Python3 中有六个标准的数据类型:
-
Number(数字)
-
String(字符串)
-
List(列表)
-
Tuple(元组)
-
Set(集合)
-
Dictionary(字典)
-
-
Python3 的六个标准数据类型中:
-
不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);
-
可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。
-
Number(数字)
-
Python3 支持 int、float、bool、complex(复数)。
在Python 3里,只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。
-
数值运算
- 1、Python可以同时为多个变量赋值,如a, b = 1, 2。
- 2、一个变量可以通过赋值指向不同类型的对象。
- 3、数值的除法包含两个运算符:/ 返回一个浮点数,// 返回一个整数。
- 4、在混合计算时,Python会把整型转换成为浮点数。
- 2 ** 5 # 乘方
- 2 / 4 # 除法,得到一个浮点数
- 2 // 4 # 除法,得到一个整数
String(字符串)
- Python中的字符串用单引号 ‘ 或双引号 “ 括起来,同时使用反斜杠 \ 转义特殊字符。
- 如果你不想让反斜杠发生转义,可以在字符串前面添加一个 r,表示原始字符串
- 字符串的截取的语法格式如下:变量[头下标:尾下标]
-
索引值以 0 为开始值,-1 为从末尾的开始位置
-
加号 + 是字符串的连接符, 星号 ***** 表示复制当前字符串,与之结合的数字为复制的次数
-
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
#!/usr/bin/python3 str = 'Runoob' print (str) # 输出字符串 print (str[0:-1]) # 输出第一个到倒数第二个的所有字符 print (str[0]) # 输出字符串第一个字符 print (str[2:5]) # 输出从第三个开始到第五个的字符 print (str[2:]) # 输出从第三个开始的后的所有字符 print (str * 2) # 输出字符串两次,也可以写成 print (2 * str) print (str + "TEST") # 连接字符串 输出: Runoob Runoo R noo noob RunoobRunoob RunoobTEST
List(列表)
-
List(列表) 是 Python 中使用最频繁的数据类型。
列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表(所谓嵌套)。
列表是写在方括号 [] 之间、用逗号分隔开的元素列表。
和字符串一样,列表同样可以被索引和截取,列表被截取后返回一个包含所需元素的新列表。
-
列表截取的语法格式如下:索引值以 0 为开始值,-1 为从末尾的开始位置
1
变量[头下标:尾下标]
-
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
#!/usr/bin/python3 list = [ 'abcd', 786 , 2.23, 'runoob', 70.2 ] tinylist = [123, 'runoob'] print (list) # 输出完整列表 print (list[0]) # 输出列表第一个元素 print (list[1:3]) # 从第二个开始输出到第三个元素 print (list[2:]) # 输出从第三个元素开始的所有元素 print (tinylist * 2) # 输出两次列表 print (list + tinylist) # 连接列表 ['abcd', 786, 2.23, 'runoob', 70.2] abcd [786, 2.23] [2.23, 'runoob', 70.2] [123, 'runoob', 123, 'runoob'] ['abcd', 786, 2.23, 'runoob', 70.2, 123, 'runoob']
- 与Python字符串不一样的是,列表中的元素是可以改变的:
- 1、List写在方括号之间,元素用逗号隔开。
- 2、和字符串一样,list可以被索引和切片。
- 3、List可以使用+操作符进行拼接。
-
4、List中的元素是可以改变的。
-
Python 列表截取可以接收第三个参数,参数作用是截取的步长,以下实例在索引 1 到索引 4 的位置并设置为步长为 2(间隔一个位置)来截取字符串
-
1 2 3
letters = ['r', 'u', 'n', 'o', 'o', 'b'] letters[1:4:2] ['u','o']
Tuple(元组)
-
元组(tuple)与列表类似,不同之处在于元组的元素不能修改。元组写在小括号 () 里,元素之间用逗号隔开,元组中的元素类型也可以不相同:
-
元组与字符串类似,可以被索引且下标索引从0开始,-1 为从末尾开始的位置。
-
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
#!/usr/bin/python3 tuple = ( 'abcd', 786 , 2.23, 'runoob', 70.2 ) tinytuple = (123, 'runoob') print (tuple) # 输出完整元组 print (tuple[0]) # 输出元组的第一个元素 print (tuple[1:3]) # 输出从第二个元素开始到第三个元素 print (tuple[2:]) # 输出从第三个元素开始的所有元素 print (tinytuple * 2) # 输出两次元组 print (tuple + tinytuple) # 连接元组 输出: ('abcd', 786, 2.23, 'runoob', 70.2) abcd (786, 2.23) (2.23, 'runoob', 70.2) (123, 'runoob', 123, 'runoob') ('abcd', 786, 2.23, 'runoob', 70.2, 123, 'runoob')
-
1 2 3 4 5 6 7 8 9 10
>>> tup = (1, 2, 3, 4, 5, 6) >>> print(tup[0]) 1 >>> print(tup[1:5]) (2, 3, 4, 5) >>> tup[0] = 11 # 修改元组元素的操作是非法的 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'tuple' object does not support item assignment >>>
-
虽然tuple的元素 不可改变,但它可以包含可变的对象,比如list列表。
-
构造包含 0 个或 1 个元素的元组比较特殊,所以有一些额外的语法规则:
-
1 2
tup1 = () # 空元组 tup2 = (20,) # 一个元素,需要在元素后添加逗号
Set(集合)
-
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
-
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
#!/usr/bin/python3 sites = {1, 'Taobao', 'Runoob', 'Facebook', 'Zhihu', 'Baidu'} print(sites) # 输出集合,重复的元素被自动去掉 # 成员测试 if 1 in sites : print('1 在集合中') else : print('1 不在集合中') # set可以进行集合运算 a = set('abracadabra') b = set('alacazam') print(a) print(a - b) # a 和 b 的差集 print(a | b) # a 和 b 的并集 print(a & b) # a 和 b 的交集 print(a ^ b) # a 和 b 中不同时存在的元素
Dictionary(字典)
-
字典(dictionary)是Python中另一个非常有用的内置数据类型。
列表是有序的对象集合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
字典是一种映射类型,字典用 { } 标识,它是一个无序的 键(key) : 值(value) 的集合。
键(key)必须使用不可变类型。
在同一个字典中,键(key)必须是唯一的。
-
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
#!/usr/bin/python3 dict = {} dict['one'] = "1 - aaaa" dict[2] = "2 - bbbb" tinydict = {'name': 'runoob','code':1, 'site': 'www.runoob.com'} print (dict['one']) # 输出键为 'one' 的值 print (dict[2]) # 输出键为 2 的值 print (tinydict) # 输出完整的字典 print (tinydict.keys()) # 输出所有键 print (tinydict.values()) # 输出所有值 输出 1 - aaaa 2 - bbbb {'name': 'runoob', 'code': 1, 'site': 'www.runoob.com'} dict_keys(['name', 'code', 'site']) dict_values(['runoob', 1, 'www.runoob.com'])
-
构造函数 dict() 可以直接从键值对序列中构建字典如下:
-
1 2 3 4 5 6 7 8
dict([('Runoob', 1), ('Google', 2), ('Taobao', 3)]) {'Runoob': 1, 'Google': 2, 'Taobao': 3} {x: x**2 for x in (2, 4, 6)} {2: 4, 4: 16, 6: 36} dict(Runoob=1, Google=2, Taobao=3) {'Runoob': 1, 'Google': 2, 'Taobao': 3}
-
1、字典是一种映射类型,它的元素是键值对。
-
2、字典的关键字必须为不可变类型,且不能重复。
- 3、创建空字典使用 { }。
数据类型转换
函数 | 描述 |
---|---|
[int(x ,base]) | 将x转换为一个整数 |
float(x) | 将x转换到一个浮点数 |
[complex(real ,imag]) | 创建一个复数 |
str(x) | 将对象 x 转换为字符串 |
repr(x) | 将对象 x 转换为表达式字符串 |
eval(str) | 用来计算在字符串中的有效Python表达式,并返回一个对象 |
tuple(s) | 将序列 s 转换为一个元组 |
list(s) | 将序列 s 转换为一个列表 |
set(s) | 转换为可变集合 |
dict(d) | 创建一个字典。d 必须是一个 (key, value)元组序列。 |
frozenset(s) | 转换为不可变集合 |
chr(x) | 将一个整数转换为一个字符 |
ord(x) | 将一个字符转换为它的整数值 |
hex(x) | 将一个整数转换为一个十六进制字符串 |
oct(x) | 将一个整数转换为一个八进制字符串 |