Как разделить строку на слова в Python

«Как разделить строку на слова в Python» — вопрос из категории Python, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

В Python можно разделить строку на слова с помощью метода split(). По умолчанию он разделяет строку по пробелам, но можно указать другой разделитель.

Пример:

text = "Hello, world! How are you?"
words = text.split()  # Разделение по пробелам
print(words)
# ['Hello,', 'world!', 'How', 'are', 'you?']

# С указанием разделителя
csv_data = "apple,banana,orange"
fruits = csv_data.split(',')
print(fruits)  # ['apple', 'banana', 'orange']

Если нужно удалить знаки пунктуации, можно использовать re.split():

import re
text = "Hello, world! How are you?"
words = re.split(r'W+', text)
print(words)  # ['Hello', 'world', 'How', 'are', 'you', '']

Для более сложных случаев обработки естественного языка лучше использовать специализированные библиотеки типа NLTK или spaCy.