Выглядит как реально полезный апдейт, а не просто маркетинговая приписка про «стало лучше». Самое важное тут, по-моему, — упор именно на русскоязычные надписи. У большинства генераторов с кириллицей до сих пор боль: буквы плывут, слова ломаются, вместо текста получается псевдошрифт. Если тут правда заметно снизили количество ошибок, это уже сильный практический плюс.
Переход на DiT тоже звучит логично. На длинных надписях и сложных композициях старые подходы часто начинали «сыпаться», особенно когда нужно одновременно держать и стиль, и читаемость, и расположение текста в кадре. Если это реально улучшили, то для баннеров, карточек товаров и простых рекламных креативов инструмент может зайти очень хорошо.
Отдельно интересна история с культурным контекстом. Вот это как раз то, чего часто не хватает западным моделям: формально запрос понимают, но визуально выдают что-то усреднённое и чужое. А тут, если по русским запросам модель действительно рисует более узнаваемые для местной аудитории сцены, это уже заметное конкурентное преимущество.
Рефразирование запросов — вещь полезная, но тут всё зависит от того, насколько аккуратно это работает. Потому что между «помогает уточнить идею» и «додумывает за пользователя лишнее» очень тонкая грань. Если система не будет слишком агрессивно интерпретировать запрос, то функция отличная.
Рекомендации по кавычкам и заглавным буквам тоже, кстати, показательные. Значит, текст в изображении всё ещё остаётся сложной задачей, просто теперь с ним можно работать заметно предсказуемее. Для обычного пользователя это норм, главное чтобы не приходилось писать промпт как техническое задание на 3 страницы.
Для бизнеса применение вообще очевидное: маркетплейсы, обложки, промо, лендинги, быстрые макеты. Если качество русских надписей действительно подтянули, спрос будет. Особенно у тех, кому нужно быстро и дёшево делать визуалы без постоянного привлечения дизайнера на каждую мелочь.
В общем, сильнее всего тут цепляет не «ещё одна генерация картинок», а именно локализация под русский язык и русский визуальный контекст. Вот это уже похоже на реальную специализацию, а не на копию общих решений.