Доработать для своих данных код на ЯП Python, с помощью которого провести Токенизацию (с удалением пунктуации), удаление стоп-слов, приведение к нижнему регистру (код представлен). Провести тестирование на предложениях из своих текстов (в формате ТХТ). Представить ссылку на папку с доработанным кодом, ячейки которого выполнены. (DH_Preprocessing_data_Lemma.ipynb)
Из zip. файла взять тексты.