Как да различаваме изкуствено генерираните кадри?
С повече от 4000 споделяния, 20 000 коментара и 100 000 реакции във Фейсбук фотографията на старата жена, седнала зад домашно приготвената торта за 122-ия си рожден ден, несъмнено стана вайръл. " Започнах да декорирам торти от петгодишна ", гласи надписът, " и нямам самообладание да се разрасне моето пекарско странствуване ".
Снимката несъмнено е и подправена. Ако любопитните свещи - една от тях като че ли се носи във въздуха, прикрепена към нищо - или странните аморфни петна върху тортата на напред във времето не издават това, то фактът, че празнуващият ще бъде най-възрастният човек в света с съвсем пет години, би трябвало да го издаде.
За благополучие, залогът за декораторите на вирусни торти за свръхстари хора е невисок. Което е добре, защото с усъвършенстването на генеративния изкуствен интелект дните, в които трябваше да се търсят предупредителни знаци, с цел да се разпознае фалшификатът, съвсем отминаха. И това основава конкуренция с времето: можем ли да разработим други способи за разкриване на имитации, преди те да станат неразличими от действителността?
" Времето, в което към момента можем да откриваме имитации ръчно, изтича ", споделя Майк Спиърс от консултантската компания за изкуствен интелект Faculty, където управлява работата на компанията по противопоставяне на дезинформацията. " Моделите се развиват със скорост и темпове, които са, ами, невероятни от техническа позиция и много тревожни.
" Съществуват всевъзможни ръчни техники за разкриване на подправени изображения - от неверно изписани думи до неуместно гладка или набръчкана кожа. Ръцете са класическа такава, а по-късно очите също са много добър индикатор. Но даже и през днешния ден това лишава доста време: Не е нещо, което може да се усили. А времето изтича - моделите стават все по-добри и по-добри ".
От 2021 година насам генераторът на изображения на OpenAI, Dall-E, е пуснал три версии, всяка от които е коренно по-способна от предходната. Независимият съперник Midjourney е пуснал шест за същия интервал, до момента в който безплатният модел с отворен код Stable Diffusion е достигнал третата си версия, а Gemini на Гугъл се причисли към фразата. Тъй като технологията става все по-мощна, тя става и по-лесна за потребление. Последната версия на Dall-E е вградена в ChatGPT и Bing, а Гугъл предлага на потребителите свои лични принадлежности гратис.
Технологичните компании започнаха да реагират на настъпващия поток от генерирано наличие. Коалицията за доказване и достоверност на наличието, в която членуват BBC, Гугъл, Microsoft и Sony, създаде стандарти за водни знаци и етикетиране, а през февруари OpenAI разгласи, че ще ги одобри за Dall-E 3. Сега изображенията, генерирани от инструмента, имат забележим етикет и воден знак, който може да се чете от машината. В края на дистрибуцията Meta стартира да прибавя свои лични етикети към наличието, генерирано от AI, и декларира, че ще отстранява изявления, които не са етикетирани.
Тези политики биха могли да оказват помощ за справяне с някои от най-вирусните форми на дезинформация, като смешки или ирония, които се популяризират отвън първичния си подтекст. Но те могат да основат и подправено възприятие за сигурност, споделя Спиърс. " Ако обществеността свикне да вижда изображения, генерирани от изкуствен интелект, с воден знак, значи ли това, че тя се доверява безусловно на такива без воден знак? ".
Това е проблем, защото маркировката никога не е универсална - нито пък има възможност да стане. Големи компании като OpenAI могат да се съгласят да слагат етикети на своите творения, само че стартъпи като Midjourney нямат потенциала да отделят в допълнение инженерно време за този проблем. А за плановете с " отворен код ", като Stable Diffusion, е невероятно да се наложи използването на воден знак, защото постоянно има опция просто да " разклоните " технологията и да създадете своя лична.
И не е наложително да забележим воден знак, с цел да реализираме стремежи резултат, споделя Хенри Паркър, началник на отдела за държавни въпроси в групата за инспекция на обстоятелства Logically. Компанията употребява както ръчни, по този начин и автоматизирани способи за инспекция на наличието, споделя Паркър, само че маркировката може да стигне единствено до такава степен. " Ако кажете на някого, че гледа подправено видео, преди още да го е гледал, обществената логика на психиката на гледането на това видео е толкоз мощна, че той към момента ще се базира на него, като че ли е реалност. Така че единственото, което можете да извършите, е да се запитате по какъв начин можем да понижим времето, през което това наличие е в обращение ".
В последна сметка това ще изисква автоматизирано разкриване и унищожаване на наличие, генерирано от изкуствен интелект. Но това е мъчно, споделя Паркър. " Опитваме се от пет години в тази тенденция и напълно почтено споделяме, че сме стигнали до към 70% във връзка с точността, която можем да реализираме ". В кратковременен проект въпросът е конкуренция във въоръжаването сред откриването и основаването: даже генераторите на изображения, които нямат злонамерени планове, ще желаят да се опитат да победят детекторите, защото крайната цел е да се сътвори нещо толкоз правилно на действителността, колкото е фотографията.
Логически отговорът е да се огледаме в облика, споделя Паркър: " Как в действителност се пробвате да разгледате метода, по който се държат участниците в дезинформацията? ". Това значи да се следят диалозите в мрежата, с цел да се уловят злонамерените лица в стадия на обмисляне в уеб сайтове като 4chan и Reddit, и да се следи роевото държание на подозрителни сметки, които са били кооптирани от държавен артист. Дори тогава казусът с подправените позитивни резултати е сложен. " Гледам ли акция, която Русия организира? Или виждам група почитатели на Тейлър Суифт, които споделят информация за билети за концерти? ".
Други са по-оптимистично настроени. Бен Колман, основен изпълнителен шеф на стартъпа за разкриване на изображения Reality Defender, счита, че постоянно ще има опция за разкриване, даже в случай че заключението е просто маркиране на нещо като допустимо подправено, а не постигане до дефинитивно умозаключение. Тези признаци могат да бъдат всевъзможни - от " филтър при по-високи честоти, показващ прекомерно огромна гладкост ", до - за видеосъдържание - неспособност да се съобщи невидимото, само че откриваемо зачервяване, което всеки демонстрира всякога, когато сърцето му бие свежа кръв към лицето.
" Нещата ще продължат да се развиват от страна на подправените, само че действителните не се трансформират ", заключава Колман. " Вярваме, че ще се доближим до един модел, който е по-вечен ".
Разбира се, техниката е единствено част от решението. Ако хората в действителност имат вяра, че фотография на 122-годишна жена с торта, която сама е изпекла, е същинска, тогава няма да са нужни най-съвременни генератори на изображения, с цел да ги накарат да повярват в други, по-вредни неща. Но това е начало.
Алекс Хърн, софтуерен публицист,. Преводът и заглавието са на редакцията на ФрогНюз.
Снимката несъмнено е и подправена. Ако любопитните свещи - една от тях като че ли се носи във въздуха, прикрепена към нищо - или странните аморфни петна върху тортата на напред във времето не издават това, то фактът, че празнуващият ще бъде най-възрастният човек в света с съвсем пет години, би трябвало да го издаде.
За благополучие, залогът за декораторите на вирусни торти за свръхстари хора е невисок. Което е добре, защото с усъвършенстването на генеративния изкуствен интелект дните, в които трябваше да се търсят предупредителни знаци, с цел да се разпознае фалшификатът, съвсем отминаха. И това основава конкуренция с времето: можем ли да разработим други способи за разкриване на имитации, преди те да станат неразличими от действителността?
" Времето, в което към момента можем да откриваме имитации ръчно, изтича ", споделя Майк Спиърс от консултантската компания за изкуствен интелект Faculty, където управлява работата на компанията по противопоставяне на дезинформацията. " Моделите се развиват със скорост и темпове, които са, ами, невероятни от техническа позиция и много тревожни.
" Съществуват всевъзможни ръчни техники за разкриване на подправени изображения - от неверно изписани думи до неуместно гладка или набръчкана кожа. Ръцете са класическа такава, а по-късно очите също са много добър индикатор. Но даже и през днешния ден това лишава доста време: Не е нещо, което може да се усили. А времето изтича - моделите стават все по-добри и по-добри ".
От 2021 година насам генераторът на изображения на OpenAI, Dall-E, е пуснал три версии, всяка от които е коренно по-способна от предходната. Независимият съперник Midjourney е пуснал шест за същия интервал, до момента в който безплатният модел с отворен код Stable Diffusion е достигнал третата си версия, а Gemini на Гугъл се причисли към фразата. Тъй като технологията става все по-мощна, тя става и по-лесна за потребление. Последната версия на Dall-E е вградена в ChatGPT и Bing, а Гугъл предлага на потребителите свои лични принадлежности гратис.
Технологичните компании започнаха да реагират на настъпващия поток от генерирано наличие. Коалицията за доказване и достоверност на наличието, в която членуват BBC, Гугъл, Microsoft и Sony, създаде стандарти за водни знаци и етикетиране, а през февруари OpenAI разгласи, че ще ги одобри за Dall-E 3. Сега изображенията, генерирани от инструмента, имат забележим етикет и воден знак, който може да се чете от машината. В края на дистрибуцията Meta стартира да прибавя свои лични етикети към наличието, генерирано от AI, и декларира, че ще отстранява изявления, които не са етикетирани.
Тези политики биха могли да оказват помощ за справяне с някои от най-вирусните форми на дезинформация, като смешки или ирония, които се популяризират отвън първичния си подтекст. Но те могат да основат и подправено възприятие за сигурност, споделя Спиърс. " Ако обществеността свикне да вижда изображения, генерирани от изкуствен интелект, с воден знак, значи ли това, че тя се доверява безусловно на такива без воден знак? ".
Това е проблем, защото маркировката никога не е универсална - нито пък има възможност да стане. Големи компании като OpenAI могат да се съгласят да слагат етикети на своите творения, само че стартъпи като Midjourney нямат потенциала да отделят в допълнение инженерно време за този проблем. А за плановете с " отворен код ", като Stable Diffusion, е невероятно да се наложи използването на воден знак, защото постоянно има опция просто да " разклоните " технологията и да създадете своя лична.
И не е наложително да забележим воден знак, с цел да реализираме стремежи резултат, споделя Хенри Паркър, началник на отдела за държавни въпроси в групата за инспекция на обстоятелства Logically. Компанията употребява както ръчни, по този начин и автоматизирани способи за инспекция на наличието, споделя Паркър, само че маркировката може да стигне единствено до такава степен. " Ако кажете на някого, че гледа подправено видео, преди още да го е гледал, обществената логика на психиката на гледането на това видео е толкоз мощна, че той към момента ще се базира на него, като че ли е реалност. Така че единственото, което можете да извършите, е да се запитате по какъв начин можем да понижим времето, през което това наличие е в обращение ".
В последна сметка това ще изисква автоматизирано разкриване и унищожаване на наличие, генерирано от изкуствен интелект. Но това е мъчно, споделя Паркър. " Опитваме се от пет години в тази тенденция и напълно почтено споделяме, че сме стигнали до към 70% във връзка с точността, която можем да реализираме ". В кратковременен проект въпросът е конкуренция във въоръжаването сред откриването и основаването: даже генераторите на изображения, които нямат злонамерени планове, ще желаят да се опитат да победят детекторите, защото крайната цел е да се сътвори нещо толкоз правилно на действителността, колкото е фотографията.
Логически отговорът е да се огледаме в облика, споделя Паркър: " Как в действителност се пробвате да разгледате метода, по който се държат участниците в дезинформацията? ". Това значи да се следят диалозите в мрежата, с цел да се уловят злонамерените лица в стадия на обмисляне в уеб сайтове като 4chan и Reddit, и да се следи роевото държание на подозрителни сметки, които са били кооптирани от държавен артист. Дори тогава казусът с подправените позитивни резултати е сложен. " Гледам ли акция, която Русия организира? Или виждам група почитатели на Тейлър Суифт, които споделят информация за билети за концерти? ".
Други са по-оптимистично настроени. Бен Колман, основен изпълнителен шеф на стартъпа за разкриване на изображения Reality Defender, счита, че постоянно ще има опция за разкриване, даже в случай че заключението е просто маркиране на нещо като допустимо подправено, а не постигане до дефинитивно умозаключение. Тези признаци могат да бъдат всевъзможни - от " филтър при по-високи честоти, показващ прекомерно огромна гладкост ", до - за видеосъдържание - неспособност да се съобщи невидимото, само че откриваемо зачервяване, което всеки демонстрира всякога, когато сърцето му бие свежа кръв към лицето.
" Нещата ще продължат да се развиват от страна на подправените, само че действителните не се трансформират ", заключава Колман. " Вярваме, че ще се доближим до един модел, който е по-вечен ".
Разбира се, техниката е единствено част от решението. Ако хората в действителност имат вяра, че фотография на 122-годишна жена с торта, която сама е изпекла, е същинска, тогава няма да са нужни най-съвременни генератори на изображения, с цел да ги накарат да повярват в други, по-вредни неща. Но това е начало.
Алекс Хърн, софтуерен публицист,. Преводът и заглавието са на редакцията на ФрогНюз.
Източник: frognews.bg
КОМЕНТАРИ




