Илон Мъск се съгласява с други експерти в областта на

...
Илон Мъск се съгласява с други експерти в областта на
Коментари Харесай

Илон Мъск е съгласен, че сме изчерпали данните за обучение на изкуствен интелект

Илон Мъск се съгласява с други специалисти в региона на изкуствения разсъдък, че има малко действителни данни, останали за образование на модели за изкуствен интелект.

" Вече изчерпахме всъщност кумулативната сума на човешките познания... в образованието на AI, " сподели Мъск по време на диалог онлайн с ръководителя на Stagwell, Марк Пен, излъчен в X късно в сряда. " Това се случи главно предходната година. "

Мъск, който е притежател на компанията за изкуствен интелект xAI, се съгласи и с някогашния основен академик на OpenAI, Иля Суцкевер.

В края на предходната година Суцкевер съобщи, че промишлеността на изкуствения разсъдък е достигнала това, което назовава " връх в данните ". Според него неналичието на данни за образование ще наложи смяна в метода, по който през днешния ден се създават моделите.

Всъщност, Мъск предложи, че синтетичните данни — данни, генерирани от самите модели за изкуствен интелект — са пътят напред. " Единственият метод да се добавят действителните данни е със синтетични данни, където AI основава обучителни данни, " сподели той. " Със синтетични данни AI ще се самооценява и ще минава през този развой на самообразование. "

Други компании, в това число софтуерни колоси като Microsoft, Meta, OpenAI и Anthropic, към този момент употребяват синтетични данни за образование на главните си модели за изкуствен интелект.

Gartner предвижда, че 60% от данните, употребявани за планове за изкуствен интелект и разбори през 2024 година, ще бъдат синтетично генерирани.

Phi-4 на Microsoft, който беше оповестен като отворен код в сряда, е обучаван със синтетични данни дружно с действителни данни. Същото важи и за моделите Gemma на Гугъл.

Anthropic употребява отчасти синтетични данни, с цел да създаде една от най-успешните си системи, Claude 3.5 Sonnet. Meta също тънко настройва най-новата серия модели Llama, употребявайки данни, генерирани от изкуствен интелект.

Обучението със синтетични данни има и други преимущества, като икономисване на разноски.

Стартиращата компания за изкуствен интелект Writer твърди, че моделът ѝ Palmyra X 004, създаден съвсем напълно със синтетични източници, е коствал единствено $700,000 — спрямо приблизителните $4.6 милиона за модел на OpenAI със съпоставим размер.

Но има и дефекти. Някои проучвания допускат, че синтетичните данни могат да доведат до " колапс на модела, " при който моделът става по-малко " изобретателен " и по-склонен към пристрастия в изхода си, което в последна сметка съществено компрометира функционалността му.

Тъй като моделите основават синтетични данни, в случай че данните, употребявани за образованието им, имат пристрастия и ограничавания, техните изходи също ще бъдат наранени.
Източник: dnesplus.bg

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР