Изследователи от Microsoft Research Asia, Пекинския университет и Университета Сиан

Новият метод на Microsoft позволява на моделите с изкуствен интелект да се учат от грешките си, точно както правят хората

Изследователи от Microsoft Research Asia, Пекинския университет и Университета Сиан Дзяотун са създали нова методология, която кара огромните езикови модели да се учат от грешките си, сходно на метода, по който се учат хората. Стратегията включва основаване на неверни пътища за решение на проблеми, коригирането им благодарение на GPT-4 и по-късно образование на истинските модели върху поправените данни. Този метод доста усъвършенства способността на моделите на ИИ да вземат решение математически задания. Ученето от грешките е значим фактор за създаването на по-ефективни системи с изкуствен интелект.

Изследователите показаха тактиката „ Обучение от грешките “ (Learning from Mistakes – LeMa), която учи изкуствения разсъдък да се преценява и да поправя личните си неточности, което усъвършенства способността му да разсъждава. Изследователите са черпили ентусиазъм от човешките процеси на учене, при които ученикът се учи от грешките си, с цел да усъвършенства бъдещите си резултати. Те приложиха тази идея към огромните езикови модели (LLM), като използваха двойки данни с промяна на грешките, генерирани от GPT-4, с цел да ги уточняват.

В началото откривателите са употребявали модели като LLaMA-2, които генерират неверни пътища за решение на математическите текстови задания. След това GPT-4 разпознава грешките в разсъжденията, изяснява ги и дава поправени разсъждения. Изследователите употребяват поправените данни за по-нататъшно образование на базовите модели.

В опит, употребяващ пет базови модела на LLM и две задания за математическо мислене, те открили, че LeMa поредно усъвършенства резултатите спрямо елементарната фина конфигурация на данните от графиките на концептуалните задания.

Специализираните LLM модели, които са създадени за дилемите за математическо мислене, реализират висока акуратност при решаването на задания. WizardMath и MetaMath демонстрираха акуратност от 85,4% при дилемите GSM8K и 27,1% при дилемите MATH. Тези резултати превъзхождат актуалните най-съвременни модели с отворен код. GSM8K и MATH са профилирани набори от задания, върху които се тестват моделите с изкуствен интелект.

Изследванията на екипа, в това число кодът, данните и моделите, към този момент са обществено налични в GitHub.

Появата на LeMa демонстрира, че процесите на машинно образование могат да бъдат направени по-близки до човешкото образование. Това развиване може да докара до гражданска война в секторите, зависещи от изкуствения разсъдък, където коригирането на грешките и непрекъснатото учене са от решаващо значение. Например в опазването на здравето, финансите и самостоятелните транспортни средства.