數(shù)學(xué)中對(duì)集合的嚴(yán)格定義可能是抽象的且難以掌握。但實(shí)際上可以將集合簡(jiǎn)單地認(rèn)為是定義明確的不同對(duì)象的集合,通常稱為元素或成員。
Python 提供了一個(gè)內(nèi)置的集合類型來(lái)將對(duì)象分組到一個(gè)集合中。集合類型(set type)是處理集合的數(shù)據(jù)類型。
集合類型的特點(diǎn)是它是一種與列表類型非常相似的數(shù)據(jù)類型,但它不能存儲(chǔ)重復(fù)值,它沒(méi)有下標(biāo)和鍵等概念,并且是唯一元素,并且元素是可維護(hù)的。
利用這個(gè)特性,集合類型可以進(jìn)行集合、交集、差等集合操作,適合管理類型。
整套學(xué)習(xí)自學(xué)教程中應(yīng)用的數(shù)據(jù)都是《三國(guó)志》、《真·三國(guó)無(wú)雙》系列游戲中的內(nèi)容。
定義一個(gè)集合
集合是無(wú)序的,并且元素是唯一的,集合本身可以修改,但集合中包含的元素必須是不可變類型。
構(gòu)建集合的方式
# 構(gòu)建的set數(shù)據(jù)會(huì)自動(dòng)進(jìn)行去重x = set()
list方式
x = set([‘曹操’, ‘孫権’, ‘劉備’, ‘曹操’, ‘司馬懿’])x{‘司馬懿’, ‘曹操’, ‘孫権’, ‘劉備’}
tuple方式
x = set((‘曹操’, ‘孫権’, ‘劉備’, ‘曹操’, ‘司馬懿’))x{‘司馬懿’, ‘曹操’, ‘孫権’, ‘劉備’}
字符串方式
s = ‘董卓’list(s)[‘董’, ‘卓’]set(s){‘董’, ‘卓’}
集合set自動(dòng)排序且元素不可變
x = {42, ‘曹操’, (1, 2, 3), 3.14159}x{42, ‘曹操’, 3.14159, (1, 2, 3)}
list和dict不能被set
a = [1, 2, 3]{a}Traceback (most recent call last): File “F:/PythonWorkProject/test.py”, line 197, in {a}TypeError: unhashable type: ‘list’d = {‘a’: 1, ‘b’: 2}c51aqfyTraceback (most recent call last): File “F:/PythonWorkProject/test.py”, line 197, in x0ub65vTypeError: unhashable type: ‘dict’
集合的大小和成員資格
方法 len() 、in 、 not in 的應(yīng)用。
x = {‘曹操’, ‘孫権’, ‘劉備’}len(x)3’孫権’ in xTrue’司馬懿’ in xFalse
集合的9種操作
計(jì)算集合并集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.union(x2[, x3 …])
x1.union(x2){‘劉備’, ‘董卓’, ‘司馬懿’, ‘孫権’, ‘曹操’}
x1 | x2 [| x3 …]
x1 | x2{‘劉備’, ‘董卓’, ‘司馬懿’, ‘孫権’, ‘曹操’}
多種合并操作
a = {1, 2, 3, 4}b = {2, 3, 4, 5}c = {3, 4, 5, 6}d = {4, 5, 6, 7}a.union(b, c, d){1, 2, 3, 4, 5, 6, 7}a | b | c | d{1, 2, 3, 4, 5, 6, 7}
計(jì)算集合交集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.intersection(x2[, x3 …])
x1.intersection(x2){‘劉備’}
x1 & x2 [& x3 …]
x1 & x2{‘劉備’}
多種交集操作
a = {1, 2, 3, 4}b = {2, 3, 4, 5}c = {3, 4, 5, 6}d = {4, 5, 6, 7}a.intersection(b, c, d){4}a & b & c & d{4}
計(jì)算集合之間差異
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.difference(x2[, x3 …])
x1.difference(x2){‘曹操’, ‘孫権’}x2.difference(x1){‘董卓’, ‘司馬懿’}
x1 – x2 [- x3 …]
x1 – x2{‘曹操’, ‘孫権’}x2 – x1{‘董卓’, ‘司馬懿’}
更多的是集合差異操作
a = {1, 2, 3, 30, 300}b = {10, 20, 30, 40}c = {100, 200, 300, 400}a.difference(b, c){1, 2, 3}a – b – c{1, 2, 3}
計(jì)算集合間對(duì)稱差
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.symmetric_difference(x2)
x1.symmetric_difference(x2){‘曹操’, ‘司馬懿’, ‘董卓’, ‘孫権’}
x1 ^ x2 [^ x3 …]
x1 ^ x2{‘曹操’, ‘司馬懿’, ‘董卓’, ‘孫権’}
更多的集合對(duì)稱差操作
a = {1, 2, 3, 4, 5}b = {10, 2, 3, 4, 50}c = {1, 50, 100}a ^ b ^ c{100, 5, 10}
判斷兩個(gè)集合是否包含相同的元素
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘劉備’, ‘司馬懿’, ‘董卓’}
x1.isdisjoint(x2),包含返回 False,不包含返回 True(x1 & x2是空集)。
x1.isdisjoint(x2)Falsex2 – {‘劉備’}{‘董卓’, ‘司馬懿’}x1.isdisjoint(x2 – {‘劉備’})Truex1 = {1, 3, 5}x2 = {2, 4, 6}x1.isdisjoint(x2)Truex1 & x2set()
判斷一個(gè)集合是否是另一個(gè)集合的子集
x1.issubset(x2),是則返回 True,否則返回 False,即x1 <= x2。一個(gè)集合被認(rèn)為是它自身的一個(gè)子集。
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x1.issubset({‘曹操’, ‘孫権’, ‘劉備’, ‘司馬懿’, ‘董卓’})Truex2 = {‘劉備’, ‘司馬懿’, ‘董卓’}x1 <= x2Falsex = {1, 2, 3, 4, 5}x.issubset(x)Truex <= xTrue
判斷一個(gè)集合是否是另一個(gè)集合的真子集
# x1 < x2x1 = {'曹操', '孫権'}x2 = {'曹操', '孫権', '劉備'}x1 < x2Truex1 = {'曹操', '孫権', '劉備'}x2 = {'曹操', '孫権', '劉備'}x1 < x2False# 子集與真子集的判斷x = {1, 2, 3, 4, 5}x <= xTruex < xFalse
判斷一個(gè)集合是否是另一個(gè)集合的超集
x1.issuperset(x2),是返回 True,否則返回 False。集合被認(rèn)為是本身的一個(gè)子集,默認(rèn)為自身超集。
# x1 >= x2x1 = {‘曹操’, ‘孫権’, ‘劉備’}x1.issuperset({‘曹操’, ‘孫権’})Truex2 = {‘劉備’, ‘司馬懿’, ‘董卓’}x1 >= x2Falsex = {1, 2, 3, 4, 5}x.issuperset(x)Truex >= xTrue
判斷一個(gè)集合是否是另一個(gè)集合的正確超集
# x1 > x2x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘孫権’}x1 > x2Truex1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘孫権’, ‘劉備’}x1 > x2False# 集合不是其自身的正確超集x = {1, 2, 3, 4, 5}x > xFalse
集合的9種修改
集合本身可以修改,不會(huì)收到集合中包含元素的限制。
update計(jì)算并集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}
x1.update(x2[, x3 …])
x1.update([‘司馬懿’, ‘董卓’])x1{‘劉備’, ‘孫権’, ‘司馬懿’, ‘曹操’, ‘董卓’}
x1 |= x2 [| x3 …]
x1 |= x2x1{‘孫権’, ‘曹操’, ‘司馬懿’, ‘劉備’}
intersection_update 計(jì)算交集
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}
x1.intersection_update(x2[, x3 …])
x1.intersection_update([‘劉備’, ‘司馬懿’])x1{‘劉備’}
x1 &= x2 [& x3 …]
x1 &= x2x1{‘曹操’, ‘劉備’}
difference_update 按差異修改集合
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}x1 -= x2x1{‘孫権’}x1.difference_update([‘曹操’, ‘孫権’, ‘司馬懿’])x1set()
symmetric_difference_update 按對(duì)稱差修改集合
x1 = {‘曹操’, ‘孫権’, ‘劉備’}x2 = {‘曹操’, ‘劉備’, ‘司馬懿’}
x1.symmetric_difference_update(x2)
x1.symmetric_difference_update([‘司馬懿’, ‘董卓’])x1{‘孫権’, ‘董卓’}
x1 ^= x2
x1 ^= x2x1{‘孫権’, ‘司馬懿’}
add 元素添加到集合
x = {‘曹操’, ‘孫権’, ‘劉備’}x.add(‘司馬懿’)x{‘孫権’, ‘劉備’, ‘曹操’, ‘司馬懿’}
remove 集合中移除一個(gè)元素
x = {‘曹操’, ‘孫権’, ‘劉備’}x.remove(‘劉備’)x{‘孫権’, ‘曹操’}# 如果元素步存在則引發(fā)異常x.remove(‘司馬懿’)Traceback (most recent call last): File “”, line 1, in KeyError: ‘司馬懿’
discard 集合中移除一個(gè)元素
x = {‘曹操’, ‘孫権’, ‘劉備’}x.discard(‘劉備’)x{‘孫権’, ‘曹操’}x.discard(‘司馬懿’)x{‘孫権’, ‘曹操’}
pop 集合中隨機(jī)移除一個(gè)元素
x = {‘曹操’, ‘孫権’, ‘劉備’}x.pop()’孫権’x{‘劉備’, ‘曹操’}x.pop()’劉備’x{‘曹操’}x.pop()’曹操’xset()x.pop()Traceback (most recent call last): File “”, line 1, in KeyError: ‘pop from an empty set’
clear 清空集合
x = {‘曹操’, ‘孫権’, ‘劉備’}x{‘曹操’, ‘孫権’, ‘劉備’}x.clear()xset()
被凍結(jié)集合
freezeset 為 Python的內(nèi)置類型,不可變、不可操作。
x = frozenset([‘曹操’, ‘孫権’, ‘劉備’])xfrozenset({‘曹操’, ‘劉備’, ‘孫権’})len(x)3x & {‘劉備’, ‘司馬懿’, ‘董卓’}frozenset({‘劉備’})
嘗試修改 freezeset 的方法會(huì)失敗
x = frozenset([‘曹操’, ‘孫権’, ‘劉備’])x.add(‘司馬懿’)Traceback (most recent call last): File “”, line 1, in AttributeError: ‘frozenset’ object has no attribute ‘add’x.pop()Traceback (most recent call last): File “”, line 1, in AttributeError: ‘frozenset’ object has no attribute ‘pop’x.clear()Traceback (most recent call last): File “”, line 1, in AttributeError: ‘frozenset’ object has no attribute ‘clear’