set(集合)是一個(gè)非常有用的數(shù)據(jù)結(jié)構(gòu)。它與列表(list)的行為類(lèi)似,區(qū)別在于set不能包含重復(fù)的值。
這在很多情況下非常有用。例如你可能想檢查列表中是否包含重復(fù)的元素,你有兩個(gè)選擇,第一個(gè)需要使用for循環(huán),就像這樣:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = []
for value in some_list:
if some_list.count(value) > 1:
if value not in duplicates:
duplicates.append(value)
print(duplicates)
### 輸出: ['b', 'n']
但還有一種更簡(jiǎn)單更優(yōu)雅的解決方案,那就是使用集合(sets),你直接這樣做:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
### 輸出: set(['b', 'n'])
集合還有一些其它方法,下面我們介紹其中一部分。
你可以對(duì)比兩個(gè)集合的交集(兩個(gè)集合中都有的數(shù)據(jù)),如下:
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
### 輸出: set(['red'])
你可以用差集(difference)找出無(wú)效的數(shù)據(jù),相當(dāng)于用一個(gè)集合減去另一個(gè)集合的數(shù)據(jù),例如:
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
### 輸出: set(['brown'])
你也可以用{}符號(hào)來(lái)創(chuàng)建集合,如:
a_set = {'red', 'blue', 'green'}
print(type(a_set))
### 輸出: <type 'set'>
集合還有一些其它方法,我會(huì)建議訪(fǎng)問(wèn)官方文檔并做個(gè)快速閱讀。