1. Разделить видео на аудио и видео (сделать demux)
- Тематика видео - трейдинг (примеры видео - ниже)
- Все видео хранятся в медиаконтейнере (.mp4)
2. Для работы нужно понимать что такое японские свечи и как они выглядят, они легко гуглятся, информации очень много (никаких комплексных знаний о трейдинге не требуется)
3. Обработать каждый кадр видео, обнаружить на нем японские свечи (они определенной формы и идут подряд одна за другой), как правило они всегда зеленого цвета или красного. Бывают разные графики, они могут быть белые/черные
4. Посчитать:
- Количество кадров в видео
- Количество кадров с обнаруженными свечами
Скажем, видео длится 15 секунд, 25 фпс = 375 кадров. С кадра 50 по 120 показывается график японских свеч. После обработки мы должны понять что isCandles[49] = True, и так для всего массива bool'ов
5. На каждом кадре распознать текст (все слова) и добавить его в общий словарь. Могут быть названия телеграм каналов, мы их тоже кладем в словарь, может быть они пишутся через собачку, может быть просто - забираем в словарь
6. Все аудио дорожки распознать англо-русской моделью и все слова также добавить в общий словарь слов
Примеры видео:
https://www.instagram.com/reel/DEwRI1zCNrB
https://www.instagram.com/reel/DCeEhc6M1qB
https://www.instagram.com/reel/C_TEJKyRnX_
https://www.instagram.com/reel/DDjMg8CodYL
https://www.instagram.com/reel/DEzrN7FyumY
https://www.instagram.com/reel/DE-CWSbArD_
https://www.instagram.com/reel/DA8fWFuMjHa