Използването на компютърно генерирани данни за обучение на модели с

Проблемът с „колапса на модела“: как липсата на човешки данни ограничава напредъка на AI

Използването на компютърно генерирани данни за образование на модели с изкуствен интелект рискува да ги накара да създават безсмислени резултати, съгласно ново проучване, което акцентира задаващите се провокации пред нововъзникващите технологии.

Водещи компании за изкуствен интелект, в това число OpenAI и Microsoft, тестваха потреблението на „ синтетични “ данни – информация, основана от системи за изкуствен интелект, с цел да образоват по-късно и огромни езикови модели (LLM) – защото те доближават границите на човешкия основан материал, който може да усъвършенства авангардната технология.

Изследване, оповестено в Nature в сряда, допуска, че потреблението на такива данни може да докара до бързо утежняване на моделите на AI. Един опит, употребяващ синтетичен входен текст за средновековната архитектура, се трансформира в полемика за зайци след по-малко от 10 генерации резултат.

Работата акцентира за какво разработчиците на изкуствен интелект са побързали да закупят обилие от...

Прочетете целия текст »