Terobosan teknologi generasi video AI: dari teks ke 4D seluruh rantai, Web3 akan mendapatkan manfaat.

robot
Pembuatan abstrak sedang berlangsung

Terobosan Teknologi Generasi Video AI dan Dampaknya

Baru-baru ini, terobosan yang paling mencolok di bidang teknologi AI adalah peningkatan signifikan dalam kemampuan pembuatan video multimodal. Teknologi ini telah berkembang dari awalnya menghasilkan video hanya dari teks murni, kini mampu mengintegrasikan teks, gambar, dan audio dalam mode pembuatan yang menyeluruh.

Beberapa contoh terobosan teknologi yang patut diperhatikan:

  1. Kerangka EX-4D yang diopen-source oleh suatu perusahaan teknologi dapat mengubah video biasa menjadi konten 4D dengan sudut pandang bebas, dengan tingkat penerimaan pengguna mencapai 70,7%. Teknologi ini memungkinkan pembuatan efek tampilan multi sudut dari video sudut tunggal, yang secara signifikan menyederhanakan pekerjaan yang biasanya memerlukan tim pemodelan 3D profesional.

  2. Sebuah platform AI meluncurkan fitur "Hui Xiang" yang mengklaim dapat menghasilkan video berkualitas "film" berdurasi 10 detik dari satu gambar. Namun, keabsahan klaim ini masih perlu diverifikasi lebih lanjut.

  3. Teknologi Veo yang dikembangkan oleh suatu lembaga penelitian AI telah mewujudkan sinkronisasi pembuatan video 4K dan suara lingkungan. Kunci terobosan ini terletak pada pemecahan masalah pencocokan semantik video dan audio dalam skenario yang kompleks, seperti kesesuaian yang tepat antara gerakan berjalan dalam gambar dan suara langkah.

  4. Teknologi ContentV dari platform video pendek dapat menghasilkan video 1080p dalam waktu 2,3 detik dengan model berparameter 8 miliar, dengan biaya sekitar 3,67 yuan/5 detik. Meskipun kinerjanya dalam skenario kompleks masih memiliki ruang untuk perbaikan, namun pengendalian biaya sudah cukup baik.

Terobosan teknologi ini memiliki makna penting dalam hal kualitas video, biaya produksi, dan skenario aplikasi:

Dari sudut pandang nilai teknis, kompleksitas pembuatan video multimodal meningkat secara eksponensial. Ini tidak hanya memerlukan pemrosesan jutaan titik piksel dari gambar tunggal, tetapi juga harus memastikan konsistensi temporal setidaknya 100 frame, sambil mempertimbangkan sinkronisasi audio dan konsistensi ruang 3D. Saat ini, melalui pemecahan modular dan kolaborasi model besar, tugas kompleks ini dapat dilakukan.

Dalam hal pengendalian biaya, ini terutama dicapai melalui pengoptimalan arsitektur inferensi. Ini mencakup penggunaan strategi generasi berlapis, mekanisme pemanfaatan cache, dan alokasi sumber daya dinamis. Langkah-langkah pengoptimalan ini bersama-sama berkontribusi pada hasil generasi biaya rendah dan efisiensi tinggi seperti ContentV.

Dalam hal dampak aplikasi, teknologi AI sedang mengubah proses produksi video tradisional. Dulu, produksi video adalah proses yang sangat mahal dan memiliki hambatan tinggi, membutuhkan banyak peralatan, lokasi, tenaga kerja, dan pekerjaan pasca produksi. Namun sekarang, AI dapat menyederhanakan proses ini menjadi memasukkan kata kunci dan menunggu beberapa menit, sambil juga mencapai sudut pandang dan efek khusus yang sulit dicapai dengan pengambilan gambar tradisional. Perubahan ini dapat memicu putaran baru dalam ekonomi kreator, memindahkan fokus dari hambatan teknologi dan modal ke kemampuan kreatif dan estetika.

Kemajuan teknologi AI Web2 ini juga memberikan dampak yang mendalam pada bidang AI Web3:

Pertama, struktur permintaan daya komputasi telah berubah. Generasi video multimodal membutuhkan kombinasi daya komputasi yang beragam, yang menciptakan permintaan baru untuk daya komputasi terdistribusi yang terbuang serta berbagai model penyetelan mikro terdistribusi, algoritma, dan platform inferensi.

Kedua, permintaan untuk anotasi data meningkat. Menghasilkan video tingkat profesional memerlukan deskripsi adegan yang tepat, gambar referensi, gaya audio, jalur gerakan kamera, dan kondisi pencahayaan serta data profesional lainnya. Mekanisme insentif Web3 dapat menarik profesional seperti fotografer, ahli suara, dan seniman 3D untuk menyediakan bahan data berkualitas tinggi, sehingga meningkatkan kemampuan generasi video AI.

Akhirnya, tren teknologi AI yang bergerak dari pengelolaan sumber daya terpusat yang besar menuju kolaborasi modular itu sendiri menciptakan permintaan baru untuk platform desentralisasi. Di masa depan, daya komputasi, data, model, dan mekanisme insentif mungkin akan membentuk siklus positif yang memperkuat diri, mendorong integrasi mendalam antara skenario Web3 AI dan Web2 AI.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 4
  • Posting ulang
  • Bagikan
Komentar
0/400
ChainWallflowervip
· 4jam yang lalu
4D keren banget, tapi tingkat pengakuannya tidak terlalu baik.
Lihat AsliBalas0
GasFeeCriervip
· 4jam yang lalu
Terlalu banyak model video, agak menakutkan.
Lihat AsliBalas0
LayerHoppervip
· 4jam yang lalu
Sungguh luar biasa, skala ini mencapai 70 ribu yang diakui.
Lihat AsliBalas0
SigmaBrainvip
· 4jam yang lalu
Ini termasuk penipuan, kan?
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)