Учени създадоха първата машина за четене на мисли
Университетът в Осака е създал невронна мрежа, способна да реконструира облика, който човек гледа сега. Анализирайки данни от функционален ядрено-магнитен резонанс, системата точно възпроизвежда освен формата, само че и цветовете на обектите. Учените приказват за първата в света машина за четене на мисли.
Not sure why this article isn't shared more
— Targeting Must End (@JusticeforTIs)
Обхватът на приложенията на обещаващата технология на компютърното зрение е доста необятен: от другарство с парализирани хора до записване на сънища и проучване на метода, по който другите животни възприемат света към себе си.
Японски откриватели са се възползвали от преимуществата на Stable Diffusion - известна стратегия за превръщане на текст в тирада. Тази невронна мрежа с отворен код е сходна по конструкция на други генеративни LLM (Large language models), като DALL-E2 на OpenAI (създател на ChatGPT) или Midjourney.
Тя се основава на дифузия - способ за машинно образование, при който образният облик се генерира посредством поредни доближения. Всяка нова итерация се базира на друга текстова имитация.
Японците са добавили спомагателна стъпка на образование към общоприетата скица за Stable Diffusion. Така невронната мрежа съпоставя данните за мозъчната интензивност на четирима участници в опита, на които са показани разнообразни фотоси с текстови описания на изображенията.
За начални сигнали били взети данни от функционален магнитен резонанс (fMRI), получени на мощни машини с индукция на магнитното поле 7 Тесла. Като записват потока от кислородни молекули, нужни за работата на невроните, тези устройства са в положение да следят кои области на мозъка, виновни за избрани усеща или страсти, са най-активни.
Във етапа на машинното образование на участниците бяха показани 10 хиляди изображения и системата събра генерираните в процеса на проучване модели на fMRI, които по-късно бяха декодирани от изкуствен интелект.
Анализирайки пиковете, регистрирани посредством fMRI в разнообразни области на мозъка, учените откриват, че темпоралните лобове са виновни за наличието на облиците. Това е по този начин наречената семантична зона. А тилната, където се намира зрителната кора, пресъздава размера и общото разположение на обектите.
Резултатите значително подхождат на хипотезата за два потока образна информация, дефинирана през 1983 година от американския невропсихолог Мортимър Мишкин. Той предложи, че в мозъчната кора да има два анатомично и функционално разнообразни канала за обработка на пространствена и предметна информация: " Къде? " и " Какво? ".
При макаци резус Мишкин сподели, че тилният (дорзален) канал " Къде? " е виновен за възприемането на пространството, а темпоралният (вентрален) канал " Какво? ", тясно обвързван с паметта, е виновен за разпознаването.
Японците са комбинирали образна и семантична информация. Дифузионният логаритъм е сравнявал следените модели на невронна интензивност, образувани при разглеждане на фотоси, с моделите в набора от данни за образование. Сигналите от " образната " кортикална област са били употребявани за създаване на общ размер и вероятност. След това били свързани сигналите от семантичния декодер на сигнали и първичната картина, наподобяваща повече на разстройване на телевизионния екран, последователно придобила очертанията на разпознаваеми обекти.
Учените получиха към хиляда изображения, които съответстваха със смисъла и наличието на оригинала с акуратност до 80%. В множеството случаи изкуственият разсъдък даже пресъздава цветовата скица на истинското изображение.
" Представеният документ сподели, че невронната мрежа Stable Diffusion може тъкмо да реконструира изображения от сканирания с fMRI, а това ни разрешава дейно да четем мислите на хората ", се отбелязва в резюмето.
" Показваме, че нашият способ, основан на човешката мозъчна интензивност, може да реконструира изображения с задоволителна резолюция и висока семантична акуратност ", прецизират японските откриватели.
Not sure why this article isn't shared more
— Targeting Must End (@JusticeforTIs)
Обхватът на приложенията на обещаващата технология на компютърното зрение е доста необятен: от другарство с парализирани хора до записване на сънища и проучване на метода, по който другите животни възприемат света към себе си.
Японски откриватели са се възползвали от преимуществата на Stable Diffusion - известна стратегия за превръщане на текст в тирада. Тази невронна мрежа с отворен код е сходна по конструкция на други генеративни LLM (Large language models), като DALL-E2 на OpenAI (създател на ChatGPT) или Midjourney.
Тя се основава на дифузия - способ за машинно образование, при който образният облик се генерира посредством поредни доближения. Всяка нова итерация се базира на друга текстова имитация.
Японците са добавили спомагателна стъпка на образование към общоприетата скица за Stable Diffusion. Така невронната мрежа съпоставя данните за мозъчната интензивност на четирима участници в опита, на които са показани разнообразни фотоси с текстови описания на изображенията.
За начални сигнали били взети данни от функционален магнитен резонанс (fMRI), получени на мощни машини с индукция на магнитното поле 7 Тесла. Като записват потока от кислородни молекули, нужни за работата на невроните, тези устройства са в положение да следят кои области на мозъка, виновни за избрани усеща или страсти, са най-активни.
Във етапа на машинното образование на участниците бяха показани 10 хиляди изображения и системата събра генерираните в процеса на проучване модели на fMRI, които по-късно бяха декодирани от изкуствен интелект.
Анализирайки пиковете, регистрирани посредством fMRI в разнообразни области на мозъка, учените откриват, че темпоралните лобове са виновни за наличието на облиците. Това е по този начин наречената семантична зона. А тилната, където се намира зрителната кора, пресъздава размера и общото разположение на обектите.
Резултатите значително подхождат на хипотезата за два потока образна информация, дефинирана през 1983 година от американския невропсихолог Мортимър Мишкин. Той предложи, че в мозъчната кора да има два анатомично и функционално разнообразни канала за обработка на пространствена и предметна информация: " Къде? " и " Какво? ".
При макаци резус Мишкин сподели, че тилният (дорзален) канал " Къде? " е виновен за възприемането на пространството, а темпоралният (вентрален) канал " Какво? ", тясно обвързван с паметта, е виновен за разпознаването.
Японците са комбинирали образна и семантична информация. Дифузионният логаритъм е сравнявал следените модели на невронна интензивност, образувани при разглеждане на фотоси, с моделите в набора от данни за образование. Сигналите от " образната " кортикална област са били употребявани за създаване на общ размер и вероятност. След това били свързани сигналите от семантичния декодер на сигнали и първичната картина, наподобяваща повече на разстройване на телевизионния екран, последователно придобила очертанията на разпознаваеми обекти.
Учените получиха към хиляда изображения, които съответстваха със смисъла и наличието на оригинала с акуратност до 80%. В множеството случаи изкуственият разсъдък даже пресъздава цветовата скица на истинското изображение.
" Представеният документ сподели, че невронната мрежа Stable Diffusion може тъкмо да реконструира изображения от сканирания с fMRI, а това ни разрешава дейно да четем мислите на хората ", се отбелязва в резюмето.
" Показваме, че нашият способ, основан на човешката мозъчна интензивност, може да реконструира изображения с задоволителна резолюция и висока семантична акуратност ", прецизират японските откриватели.
Източник: vesti.bg
КОМЕНТАРИ