Пользователей онлайн: 2336
Последний заказ: 31 сек. назад
К сожалению, проект уже закрыт. Смотрите похожие проекты на Бирже

Парсинг битых исходящих ссылок и сбор их параметров

Привет!
Для выполнения задачи чточно потребуется screaming frog или иная программа для парсинга сайтов, в том числе и очень больших сайтов на сотни тысяч страниц. Также либо вручную, либо автоматизированно собирать данные, описанные в шаге 7 ниже.
Вот пошагово задача:
Шаг 1. Нужно вбивать в поиск Google на английском языке из региона США, потом из региона Германия и собирать сатый находящиеся в топ-30 по конкретным запросам (я буду предоставлять список запросов.)
Шаг 2. Получившийся список из 60 сайтов очищаем от слишком общих и слишком больших сайтов (например reddit, wikipedia итд)
Шаг 3. Парсим каждый оставшийся сайт на исходящие битые ссылки.
Шаг 4. Каждую битую ссылку фильтруем по коду ответа (нам нужны именно непроплаченные домены)
Шаг 5. Массово проверяем домены на доступность к покупке.
Шаг 6. Создаем таблицу с каждым доступным к покупке доменом.
Шаг 7. Каждый домен нужно проверить на количество входящих ссылок, наличие спама в вэбархиве, наличие спама во входящих ссылках, а также собрать данные по DR и DA. Все это делать бесплатными доступными инструментами.
Шаг 8. Вносить все данные в таблицу по каждому домену.
Задачу я делал ранее самостоятельно частично автоматизированно, частично вручную, но знаю людей кто полностью автоматизировал процесс и это работает.
Повторять все шаги пока работаем вместе 🙂
Желаемый бюджет: до
5 000
Допустимый: до
15 000
r
Покупатель: rotgar 
Сделано более 50 покупок
Размещено проектов на бирже: 20
Нанято: 42%
Предложений: 3