Google prezentuje Lumiere. Ten model SI wykona dla Ciebie klip wideo

ittechblog.pl 3 miesięcy temu

Pojawienie się Midjourney i podobnych generatorów grafik spowodowało wysyp milionów obrazów – lepszej lub gorszej jakości. Naturalnym krokiem jest udostępnienie podobnego narzędzia, ale do tworzenia animacji i wideo. Teraz każdy będzie mógł stworzyć dowolny klip. Poznaj Lumiere.

Nazwa tego modelu SI to oczywiście nawiązanie do braci Lumiere, którym zawdzięczamy rozwój kinematografii. I muszę przyznać, iż została dobrana bardzo adekwatnie, ponieważ dzięki tej SI każdy będzie mógł być reżyserem, a co więcej – również twórcą postaci występujących w danym nagraniu.

Lumiere czyli wideo z tekstu lub grafiki

Technologia generowania obrazów rozwinęła się błyskawicznie, dając podstawę do tworzenia bardziej zaawansowanych modeli SI. Było tylko kwestią czasu, kiedy pojawią się wyspecjalizowane w tworzeniu ruchomych obrazków, czyli filmów i nagrań wideo. Mieliśmy już kilka prób, jednak Lumiere wyznacza nowe standardy. Model stworzony przez Google’a potrafi stworzyć realistyczne, różnorodne i działające płynnie animacje zarówno z promptów tekstowych, jak i grafik. Co więcej – w przypadku statycznych grafik może dodać animację tylko do wybranego obszaru, tworząc bardzo interesujące efekty.

Jak to działa? W prosty sposób – piszesz, co chcesz zobaczyć lub w jaki sposób ma zostać przerobiona podsunięta przez Ciebie grafika i gotowe. Lumiere wykorzystuje architekturę nazwaną mało chwytliwie “Space-Time U-Net”, która syntetyzuje poszczególne ramki obrazu i łączy je w płynną całość. Umożliwia również stylizacje i tworzenie wideo w rozmaitych stylach. A jako iż obraz wart więcej niż tysiąc słów, obejrzyj poniższą demonstrację możliwości Lumiere.

Czytaj też: Apple nie chce być gorsze i pracuje nad swoim SI. Idzie jednak inną drogą niż konkurencja

Jak podaje Google, póki co możliwe jest tworzenie materiałów wideo w niskich rozdzielczościach, maksymalnie 1024×1024 px i nie dłuższych niż 5 sekund. Oczywiście możemy spodziewać się zmian na lepsze w bliżej nieokreślonej przyszłości. Lumiere szkolony na potężnym zbiorze 30 milionów klipów wideo, z których wszystkie zostały opisane tekstowo. Aczkolwiek ich pochodzenie jest nieznane, a więc można podejrzewać, iż nie do końca były przestrzegane prawa autorskie.

Google przewiduje, iż udostępnienie SI generujących materiały wideo będzie miało wpływ na społeczeństwo. Z pewnością, aczkolwiek czy zły, czy dobry – tego nie podano. Udostępnienie takiego narzędzie otwiera bardzo liczne możliwości, a jak skorzystają z niego ludzie, to już temat na obszerny esej.

Idź do oryginalnego materiału