Создать парсер для сайта Sportmaster.ru, который:
Извлекает данные товаров (название, цена, ссылка) из указанной категории.
Обрабатывает все страницы категории (пагинация).
Загружает данные в Google Таблицу при каждом запуске.
Технические требования
Извлекаемые данные:
Название товара
Цена
Ссылка на товар
Пагинация:
Автоматический переход на все страницы категории (например: 55 товаров → 2 страницы).
Динамический контент:
Использовать Selenium для рендеринга JavaScript (AJAX-подгрузка товаров).
Фильтры и сортировка:
Учитывать параметры в URL (например: sortType=BY_PRICE_DESC, фильтры по бренду).
Обновление данных:
Полная перезапись Google Таблицы при каждом запуске.
Обработка ошибок:
При недоступности сайта: вывод сообщения "Сайт временно недоступен. Попробуйте позже".
Повтор запроса 2-3 раза с интервалом 10 секунд.
Google Таблица:
Столбцы: Название | Цена | Ссылка
Доступ по ссылке для авторизованных пользователей.
Инструменты:
Язык: Python
Библиотеки:
Selenium (рендеринг JS)
BeautifulSoup (парсинг)
gspread (Google Sheets API)
Облачный запуск: Heroku/Google Cloud с веб-интерфейсом.
Скорость и задержки:
Случайные задержки 3-7 сек между запросами.
___
Полное тз могу выслать при запросе (здесь символы ограничены)
___
Если работа будет завершена успешно и быстро - предложу переход к следующему заданию (будет динамический парсинг, то есть если товар на сайте Спортмастер поменял цену - цена в таблице меняется сама и приходит какое-либо уведомление об этом, например в телеграм)