Microsoft представи усъвършенствания AI-модел Phi-2 с 2,7 милиарда параметъра. Моделът

Microsoft представи Phi-2 – революционен малък AI-модел с голям потенциал

Microsoft показа усъвършенствания AI-модел Phi-2 с 2,7 милиарда параметъра. Моделът показва отлични резултати в необятен набор от проби, в това число и схващане на език, решение на математически задания, програмиране и обработка на информация. Основната специфичност на Phi-2 е способността му да се конкурира и постоянно да превъзхожда AI-модели, които са до 25 пъти по-големи от неговия размер. Новият артикул към този момент е наличен посредством Microsoft Azure AI Studio за откриватели и разработчици, които желаят да интегрират усъвършенствания AI в своите приложения.

Изпълнителният шеф на Microsoft Сатя Надела показа Phi-2 на събитието Ignite. Отличителна линия на този модел е, че той се образова върху данни, които дават отговор на качеството на просветителното равнище. Това значи, че данните за образование на модела са деликатно подбрани и структурирани, което асъдействало за точността и успеваемостта на образованието. Този метод разрешава на Phi-2 по-ефективно да трансферира познания и тълкования, научени от други модели, укрепвайки своите качества в региона на разбирането на езика, логическото мислене и обработката на информация.

Средна продуктивност при групирани бенчмаркове спрямо известните отворени SLMs

Phi-2 възбужда дългогодишните размишления по отношение на връзката сред размера и силата на езиковите модели. Моделът е съпоставим с огромните AI-модели като 7B Mistral на Mistral AI, 13B Llama 2 на Meta и даже 70B Llama-2. Особено внимание заслужава способността на Phi-2 да превъзхожда даже Gemini Nano на Гугъл — моделът с най-висока продуктивност в серията Gemini, предопределен да работи на мобилни устройства. Това акцентира капацитета на Phi-2 за мобилна технология, осигурявайки функционалности за автоматизирано съкращаване на текст, усъвършенствана промяна и редакция на граматиката и контекстно интелигентно отговаряне.

Сравнение сред Phi-2 и модела Gemini Nano 2 въз основата на бенчмарковете на Gemini

Експертите на Microsoft акцентират, че високата продуктивност на модела Phi-2 е реализирана без потреблението на способи за образование с подкрепление (reinforcement learning), основани на човешка противоположна връзка или способи за конфигурация на указания (instructional tuning). Това разрешава на модела дейно да минимизира пристрастията и да понижи риска от токсични изходни, което прави Phi-2 един от най-безопасните и най-етичните модели в региона на изкуствения разсъдък.

Безопасността е оценена в 13 демографски групи въз основа на ToxiGen. Избира се подмножество от 6541 оферти и се прави оценка сред 0 и 1, въз основа на токсичност на предлагането. По-високият резултат демонстрира, че AI-моделът е по-малко евентуално да генерира токсични оферти спрямо безобидните.

Phi-2 е част от серията дребни езикови модели (SLM) на Microsoft. Първият модел от тази серия, Phi-1 с 1,3 милиарда параметъра, беше пуснат по-рано тази година и беше ориентиран към програмиране на задания в Python. През септември беше показан Phi-1.5 с сходен брой параметри, само че подготвен на нови данни, в това число и синтетични текстове, основани благодарение на програмиране на натурален език.

Сравнение сред моделите Phi-2 и Phi-1.5. Всички задания се правят оценка в режим 0-shot, като се изключи BBH и MMLU, за които се употребяват надлежно 3-shot CoT и 5-shot

Phi-2 отваря нова глава в машинното образование, където качеството и успеваемостта на образованието стават основни фактори. Този AI-модел освен показва забележителния прогрес на Microsoft в тази област, само че също по този начин дава нови благоприятни условия за разработчици и откриватели по целия свят, отваряйки вратата към по-умните и по-безопасни технологии на бъдещето.