Сбербанк выпустил открытые токенизаторы KVAE‑2.0 для генеративных ИИ‑моделей, прорыв, который позволит российским разработчикам обучать модели изображений и видео в четыре раза быстрее без потери качества.
Новые токенизаторы сжимают видеопотоки в четыре раза эффективнее предыдущих версий, радикально снижая вычислительные затраты. Разработчики смогут обучать диффузионные модели на обычных серверах, а не на дорогостоящих кластерах. В условиях, когда доступ к западным облачным сервисам ограничен, такие решения становятся критически важными для отечественной индустрии.
По его словам, качество генерации русскоязычных надписей в кадре превзошло аналоги от Tencent и Alibaba. Это редкий случай, когда отечественная технология опережает решения азиатских технологических лидеров.
Решение распространяется под лицензией MIT, что позволяет использовать его в исследовательских и коммерческих проектах без ограничений. Открытый доступ к токенизаторам, это не просто жест доброй воли, а стратегия стимулирования отечественной экосистемы ИИ и уменьшения зависимости от зарубежных компонентов, которые могут стать недоступны в любой момент.
Новые инструменты должны ускорить создание рекламных роликов, учебных материалов и визуального контента от стартапов и университетов до крупных корпораций. Возможность обучать модели генерации видео в разы быстрее и дешевле открывает новые сценарии применения: от генерации рекламных материалов с точными логотипами и текстом до образовательного контента с чёткими визуальными деталями.



















