• en
  • Language: ru
  • Documentation version: latest

5. set Структура данных

set - это действительно полезная структура данных. sets ведут себя в основном как списки с тем отличием, что они не могут содержать дублирующихся значений. Это действительно полезно во многих случаях. Например, вы можете захотеть проверить, есть ли в списке дубликаты или нет. У вас есть два варианта. Первый предполагает использование цикла for. Что-то вроде этого:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']

duplicates = []
for value in some_list:
    if some_list.count(value) > 1:
        if value not in duplicates:
            duplicates.append(value)

print(duplicates)
# Output: ['b', 'n']

Но есть более простое и элегантное решение с использованием sets. Вы можете просто сделать что-то вроде этого:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
# Output: set(['b', 'n'])

У наборов также есть несколько других методов. Ниже приведены некоторые из них.

Пересечение

Вы можете пересечь два множества. Например:

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
# Output: set(['red'])

Разница

Вы можете найти недопустимые значения в приведенном выше примере, используя метод разности. Например:

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
# Output: set(['brown'])

Вы также можете создавать наборы, используя новую нотацию:

a_set = {'red', 'blue', 'green'}
print(type(a_set))
# Output: <type 'set'>

Существует также несколько других методов. Я бы рекомендовал посетить официальную документацию и прочитать ее вкратце.