当前位置:首页 >> 脚本专栏

Python基本数据结构与用法详解【列表、元组、集合、字典】

本文实例讲述了Python基本数据结构与用法。分享给大家供大家参考,具体如下:

列表

Python中列表是可变的,这是它区别于字符串和元组的最重要的特点,一句话概括即:列表可以修改,而字符串和元组不能。以下是 Python 中列表的方法:

Python基本数据结构与用法详解【列表、元组、集合、字典】

下面示例演示了列表的大部分方法:

> a = [66.25, 333, 333, 1, 1234.5]
> print(a.count(333), a.count(66.25), a.count('x'))
2 1 0
> a.insert(2, -1)
> a.append(333)
> a
[66.25, 333, -1, 333, 1, 1234.5, 333]
> a.index(333)
1
> a.remove(333)
> a
[66.25, -1, 333, 1, 1234.5, 333]
> a.reverse()
> a
[333, 1234.5, 1, 333, -1, 66.25]
> a.sort()
> a
[-1, 1, 66.25, 333, 333, 1234.5]

注意:类似 insert, remove 或 sort 等修改列表的方法没有返回值。

将列表当做堆栈使用

列表方法使得列表可以很方便的作为一个堆栈来使用,堆栈作为特定的数据结构,最先进入的元素最后一个被释放(后进先出)。用 append() 方法可以把一个元素添加到堆栈顶。用不指定索引的 pop() 方法可以把一个元素从堆栈顶释放出来。例如:

> stack = [3, 4, 5]
> stack.append(6)
> stack.append(7)
> stack
[3, 4, 5, 6, 7]
> stack.pop()
7
> stack [3, 4, 5, 6]
> stack.pop()
6
> stack.pop()
5
> stack
[3, 4]

将列表当作队列使用

也可以把列表当做队列用,只是在队列里第一加入的元素,第一个取出来;但是拿列表用作这样的目的效率不高。在列表的最后添加或者弹出元素速度快,然而在列表里插入或者从头部弹出速度却不快(因为所有其他的元素都得一个一个地移动)。

> from collections import deque
> queue = deque(["Eric", "John", "Michael"])
> queue.append("Terry")                       # Terry arrives
> queue.append("Graham")                    # Graham arrives
> queue.popleft()                            # The first to arrive now leaves
'Eric'
> queue.popleft()                            # The second to arrive now leaves
'John'
> queue                               # Remaining queue in order of arrival
deque(['Michael', 'Terry', 'Graham'])

列表推导式

列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。

每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。返回结果是一个根据表达从其后的 for 和 if 上下文环境中生成出来的列表。如果希望表达式推导出一个元组,就必须使用括号。

这里我们将列表中每个数值乘三,获得一个新的列表:

> vec = [2, 4, 6]
> [3*x for x in vec]
[6, 12, 18]

现在我们玩一点小花样:

> [[x, x**2] for x in vec]
[[2, 4], [4, 16], [6, 36]]

这里我们对序列里每一个元素逐个调用某方法:

> freshfruit = [' banana', ' loganberry ', 'passion fruit ']
> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']

我们可以用 if 子句作为过滤器:

> [3*x for x in vec if x > 3]
[12, 18]
> [3*x for x in vec if x < 2]
[]

以下是一些关于循环和其它技巧的演示:

> vec1 = [2, 4, 6]
> vec2 = [4, 3, -9]
> [x*y for x in vec1 for y in vec2]
[8, 6, -18, 16, 12, -36, 24, 18, -54]
> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
> [vec1[i]*vec2[i] for i in range(len(vec1))]
[8, 12, -54]

列表推导式可以使用复杂表达式或嵌套函数:

> [str(round(355/113, i)) for i in range(1, 6)]
['3.1', '3.14', '3.142', '3.1416', '3.14159']

嵌套列表解析

Python的列表还可以嵌套。以下实例展示了3X4的矩阵列表:

> matrix = [
... [1, 2, 3, 4],
... [5, 6, 7, 8],
... [9, 10, 11, 12],
... ]

以下实例将3X4的矩阵列表转换为4X3列表:

> [[row[i] for row in matrix] for i in range(4)]
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

以下实例也可以使用以下方法来实现:

> transposed = []
> for i in range(4):
...   transposed.append([row[i] for row in matrix])
...
> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

另外一种实现方法:

> transposed = []
> for i in range(4):
 ...   # the following 3 lines implement the nested listcomp
...   transposed_row = []
...   for row in matrix: ... transposed_row.append(row[i])
...     transposed.append(transposed_row)
...
> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

del 语句

使用 del 语句可以从一个列表中依索引而不是值来删除一个元素。这与使用 pop() 返回一个值不同。可以用 del 语句从列表中删除一个切割,或清空整个列表(我们以前介绍的方法是给该切割赋一个空列表)。例如:

> a = [-1, 1, 66.25, 333, 333, 1234.5]
> del a[0]
> a
[1, 66.25, 333, 333, 1234.5]
> del a[2:4]
> a
[1, 66.25, 1234.5]
> del a[:]
> a
[]

也可以用 del 删除实体变量:

> del a

元组和序列

元组由若干逗号分隔的值组成,例如:

> t = 12345, 54321, 'hello!'
> t[0]
12345
> t
(12345, 54321, 'hello!')
> # Tuples may be nested:
... u = t, (1, 2, 3, 4, 5)
> u
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

如你所见,元组在输出时总是有括号的,以便于正确表达嵌套结构。在输入时可能有或没有括号, 不过括号通常是必须的(如果元组是更大的表达式的一部分)。

集合

集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。

可以用大括号({})创建集合。注意:如果要创建一个空集合,你必须用 set() 而不是 {} ;后者创建一个空的字典。

以下是一个简单的演示:

> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
> print(basket) # show that duplicates have been removed
{'orange', 'banana', 'pear', 'apple'}
> 'orange' in basket # fast membership testing
True
> 'crabgrass' in basket
False
> # Demonstrate set operations on unique letters from two words
...
> a = set('abracadabra')
> b = set('alacazam')
> a            # unique letters in a
{'a', 'r', 'b', 'c', 'd'}
> a - b          # letters in a but not in b
{'r', 'd', 'b'}
> a | b          # letters in either a or b
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
> a & b             # letters in both a and b
{'a', 'c'}
> a ^ b             # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}
> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
> print(basket)             # show that duplicates have been removed
{'orange', 'banana', 'pear', 'apple'}
> 'orange' in basket # fast membership testing
True
> 'crabgrass' in basket
False
> # Demonstrate set operations on unique letters from two words
...
> a = set('abracadabra')
> b = set('alacazam')
> a               # unique letters in a
 {'a', 'r', 'b', 'c', 'd'}
> a - b                 # letters in a but not in b
{'r', 'd', 'b'}
> a | b               # letters in either a or b
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
> a & b             # letters in both a and b
{'a', 'c'}
> a ^ b              # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}

字典

另一个非常有用的 Python 内建数据类型是字典。

序列是以连续的整数为索引,与此不同的是,字典以关键字为索引,关键字可以是任意不可变类型,通常用字符串或数值。

理解字典的最佳方式是把它看做无序的键=>值对集合。在同一个字典之内,关键字必须是互不相同。

一对大括号创建一个空的字典:{}

这是一个字典运用的简单例子:

> tel = {'jack': 4098, 'sape': 4139}
> tel['guido'] = 4127
> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
> tel['jack']
4098
> del tel['sape']
> tel['irv'] = 4127
> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
> list(tel.keys())
['irv', 'guido', 'jack']
> sorted(tel.keys())
 ['guido', 'irv', 'jack']
> 'guido' in tel
True
> 'jack' not in tel
False

构造函数 dict() 直接从键值对元组列表中构建字典。如果有固定的模式,列表推导式指定特定的键值对:

> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'jack': 4098, 'guido': 4127}

此外,字典推导可以用来创建任意键和值的表达式词典:

> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}

如果关键字只是简单的字符串,使用关键字参数指定键值对有时候更方便:

> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}

遍历技巧

在字典中遍历时,关键字和对应的值可以使用 items() 方法同时解读出来:

> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
> for k, v in knights.items():
...   print(k, v)
...
gallahad the pure
robin the brave

在序列中遍历时,索引位置和对应值可以使用 enumerate() 函数同时得到:

> for i, v in enumerate(['tic', 'tac', 'toe']):
...   print(i, v)
...
0 tic
1 tac
2 toe

同时遍历两个或更多的序列,可以使用 zip() 组合:

> questions = ['name', 'quest', 'favorite color']
> answers = ['lancelot', 'the holy grail', 'blue']
> for q, a in zip(questions, answers):
...   print('What is your {0}"htmlcode">
> for i in reversed(range(1, 10, 2)):
... print(i)
...
9
7
5
3
1

要按顺序遍历一个序列,使用 sorted() 函数返回一个已排序的序列,并不修改原值:

> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
> for f in sorted(set(basket)):
...   print(f)
...
apple
banana
orange
pear

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python函数使用技巧总结》、《Python列表(list)操作技巧总结》、《Python字典操作技巧汇总》、《Python数据结构与算法教程》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。