Одно фото даёт плавное кинематографичное видео. Другое — дёрганый ролик с поплывшим лицом. Разница почти всегда не в настройках, а в исходнике и в том, что именно вы просите сделать.
Три вещи которые ломают анимацию сразу
Маленькое лицо в кадре. Если лицо занимает меньше трети высоты фото — черты начинают плыть между кадрами. Чем крупнее лицо, тем стабильнее результат.
Сложный фон. Когда человек сливается с фоном по цвету или текстуре — движение размазывается. Хорошо работают мягкий размытый фон, однотонная стена, открытое небо. Пёстрый интерьер или толпа за спиной — риск.
Жёсткие тени на лице. Резкий студийный свет или вспышка в упор мерцают в движении. Рассеянный дневной свет или свет из окна сбоку — анимируются плавно и предсказуемо.
Какое фото брать
Лучший старт — портрет, снятый на телефон при дневном свете. Лицо крупно, фон простой, свет мягкий. Вероятность хорошего результата с первой попытки максимальная.
Взгляд в камеру или чуть в сторону анимируется лучше, чем профиль или взгляд строго вниз. Конечности лучше либо целиком в кадре, либо обрезаны по естественной линии — талия, плечи, локоть. Рука, обрезанная посередине ладони, иногда достраивается неожиданно.
И главное: смазанный исходник даёт смазанное видео. Здесь ничего не исправляется в процессе.
Главное правило промта — одно действие
Самая частая ошибка: «она поворачивается, улыбается, волосы развеваются на ветру, камера отъезжает, она снимает с себя одежду и кидает ее назад, остается полностью голой». Это четыре задачи сразу. Нейросеть выберет одну, остальное интерпретирует случайно.
Работает так: одно движение тела или одно движение камеры — не оба одновременно.
Конкретное всегда лучше абстрактного. «Медленно поворачивает голову вправо» даёт предсказуемый результат. «Естественное движение» — лотерея. «Легко улыбается» работает стабильно. «Живая эмоциональная реакция» — нет.
Слова «медленно» и «плавно» в промте работают на результат. «Резко» и «быстро» увеличивают риск артефактов.
Движения камеры — что выбрать
Статичная камера — всё движение только в теле персонажа. Самый надёжный вариант для портретов, работает на любом нормальном исходнике.
Приближение — камера медленно движется к лицу. Один из самых стабильных вариантов, создаёт напряжение и близость. Хороший выбор если не знаете с чего начать.
Панорама — камера поворачивается горизонтально. Хорошо работает когда фон простой или размытый.
Орбита — камера движется вокруг объекта. Эффектно, но требует качественного исходника. На слабом фото даёт артефакты по краям.
Если результат не устраивает
Перегенерировать с теми же настройками смысла мало — результат будет похожим. Нужно изменить одну переменную.
Поменяйте фото. Другой ракурс того же человека часто даёт принципиально другой результат — особенно если первое фото было со сложным фоном или мелким лицом.
Уберите из промта всё кроме одного действия. Не упрощайте — именно уберите. Одна фраза показывает что модель делает в чистом виде.
Попробуйте статичную камеру. Если орбита или панорама дают артефакты — уберите движение камеры совсем. Часто это исправляет картинку сразу.
Перекадрируйте исходник крупнее на лицо и загрузите снова. Это меняет результат сильнее, чем любые правки в промте.
