Нужно на сервере с ubuntu 24.04 развернуть ffmpeg (думаю через докер композ)
Который будет ловить задачи через ssh соединение по приватной сети от других машин, выполнять задачу и загружать результат обратно в S3 + оповещение вебхуком по готовому адресу (туда вписать айди задачи (будет передаваться в самом начале))
На вход данные могу отправлять в формате json, там будут следующие ссылки на S3
1. Картинки
2. Текст для субтитров (srt)
3. Аудио TTS
На выходе чтобы получалось видео, где картинки будут сменяться раз в Х секунд с субтитрами и озвучкой