Технологичната индустрия налива милиарди в задънена улица за AI изследвания
Запитани дали " мащабирането " на актуалните AI способи може да докара до основаване на неестествен общ разсъдък (AGI) - повсеместен AI, който да съперничи или надмине човешкото знание - цели 76% от интервюираните са декларирали, че това е " малко евентуално " или " доста малко евентуално " да се случи, предава Futurism.
Резултатите от изследването, извършено от учени от Асоциацията за прогрес на изкуствения разсъдък и обхващащо 475 AI откриватели, са оповестени в нов отчет, написа dir.bg.
Те съставляват изрично опровергаване на желания от софтуерната промишленост способ за развиване на AI - обезпечаването на все по-мощен хардуер за генериращи модели и центровете за данни, които ги образоват и поддържат. Като се има поради, че AGI е оповестената последна цел на AI разработчиците, може да се каже, че мащабирането като тактика се възприема като задънена улица.
" Огромните вложения в мащабиране, без съпътстващи старания за схващане на протичащото се, постоянно са ми изглеждали неправилно ориентирани ", споделя Стюарт Ръсел, компютърен академик от UC Berkeley и съавтор на отчета, пред NewScientist. " Мисля, че преди към година стартира да става явно за всички, че изгодите от обичайното мащабиране са достигнали своя предел. "
В AI конкуренцията се хвърлят колосални суми. Само през 2024 година вложенията в генеративен AI са достигнали над 56 милиарда $ рисков капитал, съгласно TechCrunch.
Голяма част от тези средства отиват за създаване и поддържане на солидни центрове за данни, нужни за AI моделите. Например Microsoft е дала обещание да похарчи 80 милиарда $ за AI инфраструктура през 2025 година
Енергийните разноски също са големи. Microsoft подписа контракт за зареждане на своите центрове за данни с цяла нуклеарна електроцентрала, а Гугъл и Amazon също подписаха покупко-продажби за нуклеарна сила.
Винаги е било подозрително дали AI може да се усъвършенства безкрайно единствено посредством мащабиране. Доказателство за това е неотдавнашната рецесия в софтуерния бранш, провокирана от китайския стартъп DeepSeek, чийто AI модел съумява да се конкурира със западните многомилиардни чатботове, само че с доста по-ниски разноски за образование и сила.
Признаците за ограничаването на мащабирането са били налице и по-рано. През ноември 2023 година излезе информация, че откриватели в OpenAI са разкрили, че идната версия на техния модел GPT демонстрира доста по-малко усъвършенствания, а в някои случаи даже никакви, спрямо предходните версии.
През декември изпълнителният шеф на Гугъл, Сундар Пичай, съобщи, че " лесните облаги от AI са завършили ", само че решително добави, че промишлеността няма причина да не " продължи да мащабира ".
Нови способи - само че не и " вълшебни решения "
По-ефективни и евтини подходи се изследват интензивно. OpenAI ползва способ, наименуван test-time compute, при който AI отделя повече време, с цел да " мисли " преди да избере най-хубавото решение. Изследователите настояват, че този способ е довел до усъвършенствания в продуктивността, които другояче биха претендирали доста мащабиране.
Но съгласно Арвинд Нараянан, компютърен академик от Принстънския университет, този способ " надали ще бъде универсално решение ".
DeepSeek от своя страна ползва тактика, наречена mixture of experts ( " примес от специалисти " ), при която се употребяват голям брой невронни мрежи, всяка профилирана в друга област. Вместо да разчитат на един общ модел, тези " специалисти " работят дружно, с цел да намират най-хубавите решения.
Въпреки това, в случай че Microsoft продължава да залага десетки милиарди долари на създаване на нови центрове за данни, наподобява, че обичайният способ на мащабиране ще остане желан от огромните корпорации. А на по-малките, само че новаторски стартъпи ще се наложи да търсят способи да реализират повече с по-малко.

