IBM представи серия от големи езикови модели (LLM) – Granite

...
IBM представи серия от големи езикови модели (LLM) – Granite
Коментари Харесай

IBM представи серия от езикови модели Granite, за чието изпълнение е необходим само един ИИ ускорител NVIDIA V100

IBM показа серия от огромни езикови модели (LLM) – Granite като част от своята платформа за изкуствен интелект watsonx. Според IBM това не е единственото допълнение към watsonx – компанията ще добави принадлежности, които опростяват основаването на набори от данни за образование на LLM, както и програмен продукт, който улеснява адаптирането на невронните мрежи към нови типове задания.

Представеният през май watsonx е пакет от принадлежности, който оказва помощ на корпоративните клиенти да основават генеративни модели на изкуствен интелект и да извършват свързани задания, като да вземем за пример адаптиране на невронни мрежи към условията за сигурност. Новите модели ще бъдат налични посредством съставния елемент watsonx.ai, който към този момент разполага с подготвени шаблони.

Серията Granite включва LLM Granite.13b.instruct и Granite.13b.chat, основани благодарение на набор от данни с размер 2,4 TB, подбрани от специалистите на компанията. Моделите са способни да вършат резюмета на документи, да извличат информация и да генерират текст. И двата модела имат по 13 милиарда параметри. Поради относителната им гъстота един ИИ ускорител NVIDIA V100, който е доста по-евтин от A100 и H100 е задоволителен за работата на всеки от тях. С други думи, даже доста дребни компании ще могат да се снабдят със лична невронна мрежа.

IBM оповестява, че се приготвят и други модели, а watsonx.ai с изключение на разработките на IBM, ще получи Llama-2 (разработен от Meta) и невронната мрежа StarCoder, предопределена за програмисти – тя беше показана през май от ServiceNow и Hugging Face. Също по този начин watsonx.ai получи механизъм за генериране на синтетични данни, употребявани за образование на персонализирани LLM, и инструмент за адаптиране на параметрите на невронната мрежа за да я научи да извършва нови задания без потребност от преобучение.

Освен това стана известно, че IBM е разширила опциите на съставния елемент watsonx.data за ръководство на набори от данни, предопределени за образование на ИИ. Съобщава се, че инструментът ще се снабди с нови функционалности с помощта на прибавянето на „ всекидневен “ интерфейс. Ще бъдат добавени и други функционалности, да вземем за пример работа с векторни бази данни.

Източник: kaldata.com

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР