Konec Hollywoodu? Nová AI začala oficiálně vytvářet realistická videa jen z textu, výsledky jsou fascinující
Kompilace videí vytvořených pomocí nástroje OpenAI Sora
Čerstvě představený nástroj předvádí skutečně impozantní výsledky. Živé filmaře však nenahradí... zatím.
Společnost OpenAI, stojící za nejznámějším chatbotem ChatGPT, představila nejnovější nástroj Sora, který umí jen na základě textového zadání generovat velmi přesvědčivá videa všemožných stylů o maximální délce jedné minuty. Prozatím ho může testovat jen omezený okruh uživatelů, ale k dispozici je už spousta klipů ukazujících impozantní schopnosti i zjevné limity nového modelu.
Při srovnání s rok starým virálním bizarem Willa Smithe ládujícím se špagetami nebo strašidelnou předělávkou znělky seriálu Přátelé jde o ohromný posun. OpenAI tvrdí, že Sora „umí vytvářet složité scény s více postavami, specifickými typy pohybu i množstvím detailů a navíc chápe, jak objekty existují ve fyzickém světě i jak tvorové vyjadřují živé emoce.“
Zvládne vytvořit video také ze statického obrázku nebo navázat na reálně natočené záběry a rozšířit je, když kameraman třeba zjistí, že nenatočil dost materiálu na prostřihy.
Rozplyne se poctivá filmařina jako postavy s Avengers? Zdroj: Marvel Studios
Sora, nový nástroj na generování videí společnosti OpenAI Zdroj: OpenAI
Sora, nový nástroj na generování videí společnosti OpenAI Zdroj: OpenAI
Sora, nový nástroj na generování videí společnosti OpenAI Zdroj: OpenAI
Sora, nový nástroj na generování videí společnosti OpenAI Zdroj: OpenAI
Sora, nový nástroj na generování videí společnosti OpenAI Zdroj: OpenAI
Mnohé zveřejněné ukázky vypadají na první pohled takřka bezchybně a podivnosti vyplouvají až při bližším zkoumání detailů. Sam Altman, šéf OpenAI, přidává na svůj X profil stále nové klipy vygenerované podle promptů, které mu lidé posílají.
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
Společnost dokonce zveřejnila příklady klipů se situacemi, které model nezvládnul. Často jde o anatomické detaily nebo fyzikálně komplexní scény, kdy se objekty chovají nelogicky, prolínají se nebo náhle vznikají či mizí. Stejně jako v případě obrázků jsou problémem třeba lidské končetiny.
Čtěte také: Umělá inteligence vytvořila americkou verzi české klasiky Pelíšky. V hlavní roli Bill Murray!
Přesto jde o nástroj natolik silný, že před jeho zpřístupněním bude třeba vyřešit, aby nemohl sloužit k šíření deepfake videí a dalších dezinformací. Prozatím zveřejněná videa mají pouze vodoznak, ale dá se předpokládat, že scénu s Willem Smithem neurvale hltajícím špagety Sora vygenerovat odmítne.