Доработать для своих данных код на ЯП Python (код представлен).
Провести обработку корпуса собранных текстов по теме выбранного проекта (формат файлов - ТХТ, не менее 10 текстов).
Предоставить ссылку на папку с кодом и с данными (с доступом), которая содержит:
- папку с исходными текстами
- папку с обработанными текстами (без тегов).
- папку с обработанными текстами с тегами
- код на ЯП Python для своих данных (с выходными данными выполнения)
DH_ Preprocessing_for_Russian - для обработки текстов на русском языке (mystem, pymorphy)
DH_Preprocessing_with_Spacy - для обработки текстов на разных языках (spacy)
DH_Preprocessing_with_Spacy_chinese - для обработки текстов на китайском языке