【编程语法-python】collection包

Python中的基本数据结构有list，dict，tuple，set。Python还有一个功能比较强大的包collections，可以处理并维护一个有序的dict，可以提高程序的运行效率。

collections中defaultdict的使用

defaultdict在字典dict的基础之上添加一个参数default_factory（default_factory可以指定为list，set，int）
例子1：将下面的list转换成一个dict，其中key对应的value是一个list

>>from collections import defaultdict
>>l=[('a',2),('b',3),('a',1),('b',4),('a',3),('a',1),('b',3)]
>>d=defaultdict(list)
>>for key,value in l:
      d[key].append(value)
>>d
defaultdict(<class 'list'>,{'a':[2,1,3,1],'b':[3,4,3]}

例子2：例1中value中包含重复元素，如果我们不想要value中的元素重复，可以用defaultdict(set)来解决这个问题，set与list不同之处就是set中不允许存在相同的元素。

>>d = defaultdict(set)
>>for key,value in s:
      d[key].add(value)
>>d
defaultdict(<class 'set'>, {'a': {2,1,3}, 'b': {3,4}})

例子3：如果要统计一个字符串中每个字符出现的次数，可以使用defaultdict(int)

>sen='hello world'
>d=defaultdict(int)
>for key in sen:
     d[key]+=1
>d
defaultdict(<class 'int'>, {'o': 2, 'h': 1, 'w': 1, 'l': 3, ' ': 1, 'd': 1, 'e': 1, 'r': 1})

collections中OrdereDict的使用

字典dict是无序的，如果我们想要有序的dict，可以使用OrdereDict 。

例子1：在讲例1之前先讲一下sorted函数的概念。
sorted(iterable,key,reverse)，sorted一共有iterable,key,reverse这三个参数。其中iterable表示可以迭代的对象，例如可以是dict.items()、dict.keys()等，key是一个函数，用来选取参与比较的元素，reverse则是用来指定排序是倒序还是顺序，reverse=true则是倒序，reverse=false时则是顺序，默认时reverse=false。
下面我们利用sorted函数按key，value值对字典排序

>from collections import OrderedDic
>d={'b':3,'a':4,'c':2,'d':1}
# 将d按照key来排序
>OrderedDic(sorted(d.items(),key=lambda t:t[0]))
OrderedDic([('a',4),('b',3),('c',2),('d',1)])
# 按照value来排序
>OrderedDict(sorted(d.items(),key=lambda t:t[1]))
OrderedDic([('d',1),('c',2),('b',3),('a',4)])
# 按照key的长度来排序
>OrderedDic(sorted(d.items(),key=lambda t:len(t[0])))

例子2：例1中已经按照key排序的dict，使用使用popitem()方法来移除最后一个key-value对.如果我们要删除dict中的key-value,popitem(last=True)按照先进后出的顺序删除dict中的key-value，popitem(last=False)按照先进先出的规则删除dict中的key-value.

>d.popitem()
('d',1)
# 使用popitem(last=False)
>d.popitem(last=False)
('a',4)

例子3：如果我们想要改变有序的OrderedDict对象的key-value顺序，可以使用move_to_end(key,last=True)

>d = OrderedDict.fromkeys('abcde')
OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)])
# 将key为c的key-value移动到最后
>d.move_to_end('c')
# 将key为c的key-value移动到最前面
>d.move_to_end('c',last=False)
>''.join(d.keys())
cabde

collections中deque的使用

deque是为了向list中删除和插入的效率更高，用法与list相似，而list自带的append和pop方法（尾部插入和删除）速度慢

d = collections.deque()
d.append(‘a’) # 在最右边添加一个元素，此时 d=deque(‘a’)
d.appendleft(‘b’) # 在最左边添加一个元素，此时 d=deque([‘b’, ‘a’])
d.extend([‘c’,‘d’]) # 在最右边添加所有元素，此时 d=deque([‘b’, ‘a’, ‘c’, ‘d’])
d.extendleft([‘e’,‘f’]) # 在最左边添加所有元素，此时 d=deque([‘f’, ‘e’, ‘b’, ‘a’, ‘c’, ‘d’])
d.pop() # 将最右边的元素取出，返回 ‘d’，此时 d=deque([‘f’, ‘e’, ‘b’, ‘a’, ‘c’])
d.popleft() # 将最左边的元素取出，返回 ‘f’，此时 d=deque([‘e’, ‘b’, ‘a’, ‘c’])
d.rotate(-2) # 向左旋转两个位置（正数则向右旋转），此时 d=deque([‘a’, ‘c’, ‘e’, ‘b’])
d.count(‘a’) # 队列中’a’的个数，返回 1
d.remove(‘c’) # 从队列中将’c’删除，此时 d=deque([‘a’, ‘e’, ‘b’])
d.reverse() # 将队列倒序，此时 d=deque([‘b’, ‘e’, ‘a’])

collections中ChainMap的使用

ChainMap可以合并多个dict，而且效率很高

a = {'x': 1, 'z': 3 }
b = {'y': 2, 'z': 4 }
from collections import ChainMap
c = ChainMap(a,b)
print(c['x']) # Outputs 1 (from a)
print(c['y']) # Outputs 2 (from b)
print(c['z']) # Outputs 3 (from a)

collections中Counter的使用

例子1：若想统计相关元素出现的次数，可以使用Counter

>from collections import Counter
>cnt=Counter()
>for w in ['a','b','a','a','a','r','b']:
    cnt[w]+=1
Counter({'a': 4, 'b': 2, 'r': 1})

例子2：elements()方法按照元素的出现次数返回一个iterator(迭代器)，元素以任意的顺序返回，如果元素的计数小于1，将忽略它。

>c = Counter(a=4, b=3, c=1, d=-4,e=0)
Counter({'a': 4, 'b': 3, 'c': 1, 'd': -4, 'e':0})
>sorted(c.elements())
['a', 'a', 'a', 'a', 'b', 'b','b','c']
# most_common(n)返回一个list, list中包含Counter对象中出现最多前n个元素。
>c = Counter('abracadabra')
Counter({'a': 5, 'b': 2, 'r': 2, 'd': 1, 'c': 1})
>c.most_common(3)
[('a', 5), ('b', 2), ('r', 2)]