Прорыв в технологии генерации видео с помощью ИИ: от текста до 4D полного цикла Web3 получит выгоду

robot
Генерация тезисов в процессе

Прорыв в технологии генерации видео с помощью ИИ и его влияние

Недавние прорывы в области технологий ИИ наиболее заметны в значительном улучшении возможностей многомодальной генерации видео. Эта технология развилась от первоначальной генерации видео только на основе текста до полной цепочки генерации, которая может интегрировать текст, изображения и аудио.

Несколько типичных случаев технологических прорывов заслуживают внимания:

  1. Открытая платформа EX-4D, разработанная одной технологической компанией, способна преобразовывать обычные видео в контент с свободным углом обзора в 4D, и уровень одобрения пользователей составляет 70,7%. Эта технология делает возможным создание многогранного просмотра из видео с единственным углом обзора, значительно упрощая работу, которую традиционно могли выполнять только профессиональные команды по 3D-моделированию.

  2. Платформа ИИ представила функцию "Хуэйсианг", которая утверждает, что может генерировать 10-секундное видео "кинематографического качества" из одного изображения. Тем не менее, достоверность этого заявления еще предстоит проверить.

  3. Технология Veo, разработанная одним из исследовательских институтов в области ИИ, реализовала синхронную генерацию 4K видео и окружающего звука. Ключом к этому прорыву стало решение проблемы семантического соответствия видео и аудио в сложных сценах, например, точное соответствие между движением ходьбы на экране и звуком шагов.

  4. Технология ContentV на одной из платформ коротких видео, основанная на модели с 8 миллиардами параметров, может генерировать 1080p видео за 2,3 секунды, стоимость составляет около 3,67 юаней за 5 секунд. Хотя в сложных сценах есть возможности для улучшения, контроль затрат уже довольно хорош.

Эти технологические прорывы имеют большое значение с точки зрения качества видео, затрат на производство и областей применения:

С точки зрения технической ценности, сложность многомодальной генерации видео растет экспоненциально. Это требует обработки миллионов пикселей в одном кадре, а также обеспечения временной последовательности минимум из 100 кадров, при этом необходимо учитывать синхронизацию звука и пространственную согласованность в 3D. В настоящее время эта сложная задача реализуется благодаря модульному разбиению и сотрудничеству крупных моделей.

В области контроля затрат это достигается в основном за счет оптимизации архитектуры вывода. Это включает в себя использование стратегий многослойной генерации, механизмов повторного использования кэша и динамического распределения ресурсов. Эти меры оптимизации совместно способствовали созданию таких результатов, как ContentV, с низкими затратами и высокой эффективностью.

С точки зрения влияния приложений, технологии ИИ уже переворачивают традиционный процесс видеопроизводства. Ранее видеопроизводство было дорогостоящим и трудоемким процессом, требующим большого количества оборудования, площадок, человеческих ресурсов и постобработки. Теперь ИИ может упростить этот процесс до ввода подсказки и нескольких минут ожидания, одновременно достигая некоторых ракурсов и эффектов, которые трудно реализовать традиционной съемкой. Эта революция может вызвать новый раунд переоснащения в экономике создателей, перемещая акцент с технологических и финансовых барьеров на креативные и эстетические способности.

Эти достижения технологий Web2 AI также оказали глубокое влияние на область Web3 AI:

Во-первых, структура спроса на вычислительную мощность изменилась. Генерация многомодальных видео требует разнообразных комбинаций вычислительной мощности, что создает новый спрос на распределенные неиспользуемые вычислительные мощности, а также на различные распределенные модели тонкой настройки, алгоритмы и платформы для вывода.

Во-вторых, растет потребность в аннотировании данных. Для создания профессиональных видеороликов требуются точные описания сцен, справочные изображения, аудиостили, траектории движения камеры и условия освещения и другие профессиональные данные. Механизмы вознаграждения Web3 могут привлечь профессионалов, таких как фотографы, звуковые дизайнеры и 3D-художники, для предоставления высококачественных данных, что улучшит возможности генерации видео на основе ИИ.

Наконец, тенденция перехода технологий ИИ от централизованного распределения крупных ресурсов к модульному сотрудничеству сама по себе создает новые потребности для децентрализованных платформ. В будущем вычислительная мощность, данные, модели и механизмы стимулов могут сформировать самоусиливающийся положительный цикл, способствующий глубокой интеграции сценариев Web3 AI и Web2 AI.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
ChainWallflowervip
· 13ч назад
4D довольно круто, просто уровень признания не очень высокий.
Посмотреть ОригиналОтветить0
GasFeeCriervip
· 13ч назад
Слишком много видео моделей, это довольно страшно.
Посмотреть ОригиналОтветить0
LayerHoppervip
· 13ч назад
Невероятно! Этот масштаб достиг 70 тысяч одобрений.
Посмотреть ОригиналОтветить0
SigmaBrainvip
· 14ч назад
Это, наверное, мошенничество.
Посмотреть ОригиналОтветить0
  • Закрепить