Парсинг данных с двух сайтов:
Необходимо разработать скрипт для парсинга каталогов двух указанных сайтов.
Для каждого товара из каталога нужно извлечь следующие данные:
URL товара
Заголовок (H1)
Цену
Формирование таблиц:
Создать отдельные таблицы для каждого сайта, содержащие следующие столбцы:
URL
Название (H1)
Цена
Сохранить таблицы в удобном формате (например, CSV или Excel).
Объединение данных:
Сформировать общую таблицу, объединив данные из двух сайтов.
Исключить все дубликаты товаров на основе уникальных признаков (например, URL или названия).
Результат:
Предоставить три таблицы:
Таблица с данными по первому сайту.
Таблица с данными по второму сайту.
Общая таблица с объединенным каталогом без дубликатов.
Дополнительные требования:
Обеспечить корректность данных (проверка на отсутствие пустых значений или некорректных форматов).
Учесть возможные различия в структуре сайтов при парсинге.