ТЕХНОЛОГИИ

Google Flow и идва ли краят на истината

Когато става дума за генеративен изкуствен интелект (AI) първата ни асоциация е с OpenAI и техния ChatGPT. Google обикновено е втори или трети по важност при изброяването на подобни услуги. Въпреки това, технологичният гигант е рамо до рамо с популярната AI компания. Демонстрацията на последната версия за услугата за генериране на видео на Google, по време на тяхната конференция за разработчици I/O, може би дори го поставя и на лидерската позиция.

Възможностите на новите AI инструменти Veo 3 и Flow създават максимално реалистични видеа, включително на хора, различна заобикаляща среда и формати – фотореалистични или анимационни. Това обаче е първата услуга, която също така пресъздава и звук към видеото, който не трябва да се генерира с друга AI програма. По този начин можете само с едно текстово задание да генерирате видео, с хора, които говорят помежду си или просто изнасят монолог или реч.

Новите Veo 3 и Flow повдигат не само въпроса дали Google не е новият крал на AI, но и дали изкуствения интелект не достига до нива в които да може да създава съдържания, които да не могат да се различат от реалните такива. Така, да се постигне ситуация, в която правителства, престъпници и дори обикновени потребители да могат да засипят онлайн пространството с фалшиви видеа. Което да доведе до невъзможността ни да определим кое е истина и кое не.

Veo 3 + Flow = AI Холивуд

Google Flow 2

Google всъщност демонстрира две технологии. Първата е Veo 3 – новият модел за генериране на видео. Втората е Flow – софтуерна програма, която предлага различни контролери базирани на AI за обработка и редактиране на видеа. Двете вървят ръка за ръка, като програмата за обработка е специално разработено да работи с Veo 3, като двете са взаимно интегрирани и допълващи се. Освен това Flow може да си взаимодейства с Gemini и Imagen – двата модела на Google за генеративен AI, като първият е за диалог и влиза в ролята на асистент, докато вторият е за създаване на изображения.

Flow позволява да се генерират изображения, видеа, диалог само от текстови описания. След което, програмата дава възможност за тяхната последваща обработка или редакция. Тя може да стане както с допълнителни текстови описания и уточнения, така и с вградени котролери. Някои от инструментите за управление включват използването на различни ъгли на „камерата“, изрязване или удължаване на дадена сцена, подреждане на наличното съдържание и др.

Интеграцията на няколко, прецизни и специализирани AI модела в една услуга се оказва доста мощен инструмент. Това е силата на Flow, която позволява на създателите на съдържание само чрез текст да направят кратки видеа, реклами или друго визуално съдържание. При това максимално пълноценно и бързо, защото някои елементи, като например звук и диалог може да се генерират и вградят директно, без да се използват други инструменти.

Невиждан до момента резултат

За всеки един генеративен AI има няколко критични момента – крайният резултат, ползваната информация и системите за контрол на генерираното съдържание. Първото е повече от впечатляващо, като видеата на Google са доста реалистични. Както тези създадени като демонстрационни версии от компанията, така и няколко след това – публикувани от ентусиасти, които са тествали вече системата.

Примерите на Google са по-семпли и кратки. Те включват моряк, който говори за океана, анимирани сова и язовец как си говорят и др. Интересното при тях е, че освен, че изглеждат доста реалистично и добре направени, те са създадени само с няколко реда текстово задание.

По-впечатляващите резултати идват, когато описанието на идеята е по-дълго, подробно и с повече детайли. Вече някои създатели дори вкарват частични филмови сценарии в промпта с цел да тестват лимитите на системата. Резултатите при по-кратките и статични видеа са наистина спиращи дъха. Можете да правите фиктивни новинарски емисии и предавания „на живо“ от например, горяща сграда. Както и да пресъздавате или направо да създавате нови откъси от популярни филми и сериали.

Flow има някои ограничения, като те са най-видни при по-комплексни сцени, в които има повече динамика, движение и прекалено много за детайлизирани обекти и елементи. Тогава може да забележите замъгляване, спадане на броя кадри или просто трансформация на някои обекти, поради скоростта на движение на камерата или самите тях. Други проблеми са свързани с интеграцията на субтитри, които все още се визуализират в типичния за начален стадий AI начин с много грешки и измислени думи.

Не трябва да забравяме, че едно от най-големите предимства на генеративния изкуствен интелект е неговата способност да учи с времето и да поправя грешките. Много от споменатите проблеми ще бъдат изгладени, когато бъдат направени сто, хиляда или дори милиони проекти. Било то кратки или по-дълги.

Плашещи приложения

Възможностите на Flow до голяма степен създават средно до дългосрочна заплаха за филмовата индустрия, телевизията и всякакво генериране на видео съдържание по традиционния до момента начин. Чрез него можете със снимка или няколко да изградите цялостна сцена с диалог. Да създадете пълноценна реклама с множество AI „актьори“ в различни среди. Да правите изцяло генерирани в дигитална среда новинарски емисии.

Филмите също може да бъдат ако не напълно, то значително изградени чрез AI. При различни тестове, с вкарването на задачи написани като за сценарий, се получават задоволителни резултати. Някои специални ефекти са на нивото на филмите по комиксите на Марвел (последните не са висока летва), което означава, че по-нискобюджетните продукции ще могат да разчитат на сравнително мощен инструмент за реализация.

Засега, силата на подобни AI програми се оценява най-вече от рекламната индустрия. Тя вижда възможност за създаване на кратки рекламни спотове за ТВ, социални мрежи в рамките на няколко часа или дори минути. При това на цена в пъти по-ниска спрямо традиционните продукции.

Подобно на всяка една технология, нейните приложения зависят от това кой и как я използва. Предвид високото качество на видеопродукциите и нивата на имитация на истински аудио и визуални обекти и моменти, подобни AI програми може да влязат в употреба за доста злонамерени цели. Представете си например, че виждате уж излъчване на живо, в което руския президент Владимир Путин обявява страната за колония на Украйна и подава оставка или обратното, но с украинския президент Володомир Зеленски.

Чрез Google Flow може да се пресъздадат доста реалистично подобни прости изказвания и ситуации. Каквато например беше срещата в Овалния кабинет между американския президент Доналд Тръмп, неговия заместник Джей Ди Ванс и украинския президент Зеленски, но със съвсем различен развой. Фалшивото съдържание може да залее онлайн пространството и вече да е много трудно да се определи кое е истина и кое – не.

Може да отидем и в още по-антиутопична равнина, в която ви арестуват и и пускат като доказателство видео с извършено от вас престъпление. Проблемът е, че нито сте били на показаното място, нито сте правили нещо незаконно, а самият материал е изцяло генериран от AI.

Механизми за контрол под въпрос

google-cracked

IT гигантите се опитват да предотвратят подобни злоупотреби с AI технологиите, като гарантират определени параметри по които те ще могат да работят. Точните рамки се променят в зависимост от реакцията на потребителите, регулаторите и самите самообучаващи се алгоритми.

Практиката до момента показва, че в известна степен, компаниите успяват да опазят от най-тежките потенциални злоупотреби. Методи, като водни знаци за маркиране на AI съдържание, платформи за засичане на подобни продукции и др. могат да дадат частично решение на проблема.

От друга страна, не напълно, защото например телефонните измами с генериран AI глас на познат вече се развиват в чужбина. От трета страна, нищо не пречи на по-големите държави да натиснат Google и останалите технологични гиганти да им предоставят инструменти за пропаганда и дезинформация. Заподозрените няма да опрат само до Русия и Китай, но и от западните държави. Технологията се превръща във все по-апетитна за употреба с цел манипулация на обществото.

Ако, тази кутия на Пандора бъде отворена, тогава наистина може да навлезем в сценарий, в който трудно ще може да опознаем истината от AI фалшификацията. Особено, ако възможностите за противодействие и засичане на подобно съдържание не са достатъчно развити, като тези за генерирането му.

Свързани статии

Back to top button