Може да се ползва на смартфони, лаптопи и сървъри с

Gemma 3: малкият AI модел на Google работи на обикновени устройства

Може да се употребява на смарт телефони, преносими компютри и сървъри с съществени GPU

Gemma 3 предлага баланс сред продуктивност, цена и сигурност
(снимка: Google)

Въпреки известността на огромните езикови модели, фирмите от ден на ден се обръщат към компактни решения, с цел да понижат енергийните и компютърните разноски. В отговор на тази наклонност Гугъл пусна третата версия на своя дребен езиков модел Gemma 3 .

Новият AI модел резервира продуктивността на „ старшите ” модели Gemini 2.0, само че е усъвършенстван за работа на устройства с лимитирани запаси – смарт телефони, преносими компютри и сървъри с съществени графични процесори.

Gemma 3 се предлага в четири разновидността: с параметри 1B, 4B, 12B и 27B. Основното усъвършенстване е увеличението на контекстния прозорец до 128 хиляди токена против 80 хиляди в Gemma 2. Това разрешава обработка на по-големи поръчки и комплицирани сюжети.

Най-общо, Gemma 3 поддържа мултимодален разбор на текст, изображения и къси видеоклипове, автоматизиране на задания посредством извикване на функционалности и работи със 140 езика.

За в допълнение понижаване на изчислителните разноски Гугъл вкарва квантувани версии на модела. Квантуването или намаляването на прецизността на числовите стойности в теглата на невронната мрежа работи като „ компресия ” без загуба на акуратност. Това разрешава на Gemma 3 да работи даже на един GPU или TPU, което е сериозно за местни приложения.

Според компанията, Gemma 3 обезпечава „ водеща в класа си продуктивност ”, превъзхождайки LLM като Llama-405B, DeepSeek-V3 и o3-mini. В тестванията на Chatbot Arena Elo версията 27B заема второ място след DeepSeek-R1, побеждавайки Mistral Large и Claude 3.7 Sonnet.

Разработчиците могат да интегрират Gemma 3 посредством принадлежности като Hugging Face Transformers, Ollama, PyTorch, JAX и Keras, както и посредством Гугъл AI Studio, Hugging Face или Kaggle. За корпоративни клиенти е налична поръчка към API на модела посредством AI Studio.

Сигурността е главен фокус на актуализацията. Gemma 3 има вграден ShieldGemma 2, филтър за изображения с 4B параметър, който блокира генерирането на наличие, съдържащо принуждение, полови подиуми и други нарушавания. Системата разрешава персонализиране, с цел да отговори на потребностите на потребителите.

Както отбелязва Гугъл, моделът е подготвен благодарение на строги правила за обработка на данни, фина конфигурация в сходство с политиките за сигурност и проби за риск, в това число оценка на евентуална корист при основаване на рискови субстанции.

Интересът към дребните модели набъбна внезапно след дебюта на първия Gemma през февруари 2024 година Решения като Microsoft Phi-4 и Mistral Small 3 показват търсенето на AI, който може да взема решение характерни проблеми без непотребния потенциал на LLM.

Gemma обаче не е дестилирана версия на Gemini – новият модел е подготвен на същия набор от данни и архитектура, само че без непосредствено „ заместничество ” на познания от по-големия модел.

Компаниите от ден на ден избират SLM (малки AI модели) или дестилирани версии на LLM за съответни сюжети. Например, вместо да внедрите мощен модел като Claude 3.7 Sonnet за елементарен редактор на кодове, по-ефективно е да употребявате стилен аналог, който не изисква обилни запаси и понижава риска от претрениране.

С стартирането на Gemma 3, Гугъл укрепва позицията си в този сегмент, предлагайки баланс сред продуктивност, цена и сигурност.

Законотворците в този момент вземат решения без солидна аргументация
предишна обява: следваща обява:
графа:,,, | етикети:,,,,,
Коментар

ИМЕ *