Учени от университета Цинхуа и ByteDance представиха нов метод за

...
Учени от университета Цинхуа и ByteDance представиха нов метод за
Коментари Харесай

Нов метод дава възможност на изкуствения интелект да се учи от своя опит и да прехвърля знанията си към други модели

Учени от университета Цинхуа и ByteDance показаха нов способ за образование на изкуствения разсъдък, който разрешава на моделите да се учат от личния си опит, без да губят авансово усвоените познания. Системата FLEX („ Forward Learning with Experience “) основава „ библиотека на опита “, в която изкуственият разсъдък записва дейностите си, като проучва както триумфите, по този начин и грешките. Този метод дава опция на моделите от разнообразни производители да обменят опит и да се учат един от различен.

Големите езикови модели остават статични: те не помнят предходните неточности и не могат да се самоадаптират след обучаването. Методът FLEX трансформира това, като основава динамична „ библиотека на опита “, в която изкуственият разсъдък съхранява стратегическите правила на високо равнище, разсъжденията на приблизително равнище и фактическите познания на ниско равнище. Библиотеката има „ златна зона “ за сполучливите тактики и „ предупредителна зона “ за несполучливите подходи. Преди да реши нов проблем, моделът се обръща към тази библиотека.

Принципът на работа на FLEX се състои от три стадия. Първо, „ артистът “, сътрудникът с изкуствен интелект, се пробва да реши казуса. След това „ критикът “ и „ актуализаторът “ правят оценка опита, като записват сполучливите и несполучливите тактики. Накрая уроците се преобразуват в структурирани записи в библиотека за опит. Основният „ мозък “ на модела остава неизменен – усъвършенства се единствено директорията със познания, което разрешава на ИИ да се развива непрестанно без скъпоструващо преквалифициране.

Изследователите тестваха FLEX при решаването на научни задания. В сложния математически тест AIME25 точността на Claude-Sonnet-4 набъбна от 40% на 63,3%. При дилемите по химия в USPTO50k резултатите на модела се усъвършенстваха от 20 % на 30 %. С други думи, ученето от опита в действителност усъвършенства интелигентността на изкуствения разсъдък.

Едно от основните преимущества на FLEX е „ унаследяването на опита “. Библиотеката се основава настрана от параметрите на модела, тъй че може да се трансферира сред другите сътрудници. В един от опитите библиотеката с опит, основана от мощния модел Claude-Sonnet-4.5, беше трансферирана към модела Gemini-2.5-Pro. В резултат на това представянето на Gemini върху дилемите по химия се усъвършенства с 11 точки. В същото време даже по-слабите модели могат да трансферират знанията си на по-силните. Библиотеката улавя фундаменталните тактики на високо равнище, а не съответни отговори – всъщност тя натрупва „ мъдрост “.

Този метод открива пътя към „ груповата просветеност “ на огромните езикови модели. Изследователите оферират да се сътвори универсална библиотека на опита, която да обобщава знанията на голям брой модели, с цел да се усъвършенства успеваемостта в екосистемата на изкуствения разсъдък.

FLEX също по този начин взема решение казуса със скъпия и опасен способ за противоположното разпространяване на грешките, който постоянно е водил до „ пагубно забравяне “, когато новите познания изместват старите. Неотдавна и Гугъл показа нов метод към машинното образование, който разрешава на моделите да усвояват нови задания, без да губят добитите по-рано умения.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР