Главное - чтобы урлы сохранились, все страницы сайта были скопированы и визуальное совпадение.
Если урл заканчивается на /, то не должно быть в конце /index.html в браузере.
Если урлы типа /test, то не должно быть /test.html в браузере.
То есть урлы должны быть как на исходнике, без прописаний редиректов.
Если какие-то урлы доступны, но ВАШ парсер (программа) не видит, надо будет докачать. Например, я могу проверить число скопированных страниц по сайтмапу, нет ли битых ссылок или нескачанных картинок, которые присутствуют в оригинале.
В конце при наличии метрик яндекс, гугл, живосайта - их убираем. Меняем в копии телефон и мейл.
На выходе присылаете zip-архив на проверку. По договоренности можем внедрить или нет форму (или формы) php.
Данная копия сразу будет от 2000 стр