Google представи Gemini 2.5 Flash-Lite: най-бързият и достъпен модел в семейството
Очевидно компанията е наясно, че доста разработчици са подготвени да се откажат от съвършената акуратност на отговорите в интерес на по-ниските разноски за генериране на токените.
На 22-ри юли, Гугъл публично показа стабилната версия на Gemini 2.5 Flash-Lite – най-бързият и финансово най-достъпен модел на изкуствен интелект от семейството Gemini 2.5. Представители на интернет колоса обявиха, че Lite-версията коства единствено 10 цента ($0,10) за 1 милион входни токени, до момента в който главният Flash-модел за същия милион входни токени изисква 30 цента, а Gemini 2,5 Pro коства 1,25 $, т.е. 12,5 пъти по-скъпо от Gemini 2,5 Flash-Lite.
Но по-важното е, че „ изходната “ информация в този случай също коства доста по-малко.
Например, до момента в който цената на един милион токена на Gemini 2.5 Pro (в случай на Output price) е цели 10 $, до момента в който при Gemini 2.5 Flash-Lite цената за генериране е единствено 40 цента. Това дава опция да се обработват огромни размери от разнообразни поръчки на относително налична за потребителите цена (от стартирането на предварителната версия на този модел Гугъл съумя да понижи цената на аудиоизвеждането с 40%). Освен това, което е значимо, новата компактна версия на модела се оправя с поставените задания доста по-бързо, в сравнение с по-старите версии от същата фамилия.
В формалния блог се показва, че 2.5 Flash-Lite има по-ниска инертност от 2.0 Flash-Lite и 2.0 Flash при осъществяването на необятен кръг поръчки. Въпреки че Гугъл назовава 2.5 Flash-Lite „ най-бързият модел “ и показва най-високата скорост в новата таблица на продуктивността (в раздела Speed (Скорост) 2.5 Flash-Lite има три иконки на ракета против една за 2.5 Pro), разработчикът обаче не дава никакви точни данни, които да разрешат свястно съпоставяне на параметъра скорост. И, което е най-интересно, нововъведението с всичките си преимущества има бонус под формата на висококачествени отговори на заложените въпроси.
Компанията твърди, че 2.5 Flash-Lite побеждава 2.0 Flash-Lite в региона на програмирането, математиката, науката, разсъжденията и мултимодалното усещане. И тези преимущества към този момент се употребяват от дребните започващи компании за осъществяване на действителни сюжети – да вземем за пример Satlyt ползва новия модел за обработка и потребление на сателитните данни за бързо обобщаване на телеметрията от орбита, разбор на сателитните връзки и други Компактният модел 2,5 Flash-Lite е разрешил на компанията да понижи потреблението на сила с 30%, намалявайки латентността с 45%.




