ByteDance har lansert MagicVideo-V2 – en tekst-til-video-generator som knuser konkurrentene.
Tekst-til-video er det alle venter på. Foreløpig finnes det ingen tjenester som gjør dette med glans. Men når det skjer, er mulighetene enorme. Jeffrey Katzenberg, lederen av Walt Disney Studios fra 1984-1994 spår at ni av ti jobber innen filmanimasjon vil være overtatt av kunstig intelligens innen ti år.
Og nå har ByteDance, moderselskapet til TikTok lansert MagicVide-V2 – en tekst-til-video-generativ kunstig intelligens som utkonkurrerer konkurrenter som Pika 1.0 og Stable Diffusion-XT.
X-bruker Rowan Cheung spør retorisk om TikTok-brukere har vært med på å trene opp den generative KI-en.
Tar utgangspunkt i et bilde
MagicVideo-V2 begynner med å lage et bilde i 1024×1024 piksler som gjenspeiler tekst-input’en. Det statiske bildet blir deretter animert, forbedret og finpusset. Til slutt forlenger interpoleringsmodulen animasjonen til 94 bilder.
Siden motoren tar utgangspunkt i bilder, blir resultatene ganske statiske, og det er nok enda en stund til du kan fylle inn manuset til kortfilmen og forvente at en KI skal generer filmen for deg. Men allerede nå skulle man tro at teknologien vil kunne revolusjonere produksjonen av korte reklamevideoer.
ByteDance (parent company of T*kTok) just introduced a huge new text-to-video generation model called MagicVideo-V2.
— Rowan Cheung (@rowancheung) January 12, 2024
The model outperforms industry leaders like Pika 1.0 and SVD-XT based on human evals.
Have T*kTokers been training an AI this whole time? pic.twitter.com/J5b2Z6iGUd
At selskapet kommer til å implementere den generative modellen i TikTok, regner vi med, uten at vi vet det sikkert. Du finner flere videoeksempler på ByteDance’s GitHub.
Podcast-host, redaktør og forfatter i Teknokratiet. Bachelor i filosofi og master i dokumentarregi. Regissør og fotograf i Newslab, tidligere journalist i ITavisen.