Meta направи своята технология за изкуствен интелект с отворен код
Технологичният колос Meta - притежател на платформата Фейсбук, разгласява LLaMA (Large Language Model Meta AI) - най-съвременният основополагащ огромен езиков модел, предопределен да помогне на откривателите да напреднат в работата си в тази подобласт на изкуствения разсъдък.
Технологичният колос Meta - притежател на платформата Фейсбук, разгласява LLaMA (Large Language Model Meta AI) - най-съвременният основополагащ огромен езиков модел, предопределен да помогне на откривателите да напреднат в работата си в тази подобласт на изкуствения разсъдък.
По-малките и по-производителни модели като LLaMA дават опция на други членове на изследователската общественост, които нямат достъп до огромни количества инфраструктура, да учат тези модели, като в допълнение демократизират достъпа в тази значима, бързо изменяща се област, афишират от компанията на Марк Зукърбърг.
LLaMa ще е наличен в няколко разнообразни размера - 7 милиарда, 13 милиарда, 33 милиарда и 65 милиарда параметъра (колкото повече параметъра има езиковият модел, толкоз по-сложен е той). За съпоставяне GPT-3.5, езиковият модел, на който е основана първичната версия на известният чатбот ChatGPT, има 175 милиарда параметъра, до момента в който за GPT-4 се твърди, че има 1 трлн.
Реклама
Според Meta по-малките модели, подготвени върху повече лексеми, са по-лесни за наново образование и прецизна конфигурация за съответна приложимост. Компанията твърди, че по-големите ѝ модели LLaMA 65B и 33B са подготвени върху 1.4 трлн. лексеми, а най-малкият - 7B, върху 1 трлн. Според механически обзор на GPT-3, оповестен от Lambdalabs, езиковият модел на OpenAI е подготвен върху 300 милиарда лексеми.
АIс отворен код
Според Ян ЛеКун, основен експерт по AI в Meta, възходящата мистериозност в Гугъл и OpenAI е " голяма неточност " и " доста неприятен метод към това, което се случва ". Той твърди, че потребителите и държавните управления ще откажат да одобряват изкуствения разсъдък, в случай че той не е отвън контрола на компании като Гугъл и Meta. " Искате ли всяка система за изкуствен интелект да бъде под контрола на няколко мощни американски компании, споделя той, представен от The New York Times. Платформата, която ще завоюва, ще бъде отворената. "
LLaMA е оповестен под некомерсиален лиценз, ориентиран към изследователска активност, като Meta дава достъп до него за всеки съответен случай на тествани лица, свързани с организации от държавния бранш, гражданското общество и университетските среди, както и на индустриални проучвателен лаборатории, само че при започване на март моделът изтича в общественото пространство, откакто е оповестен в онлайн форума 4chan.
На 13 март откриватели от Станфордския университет разгласяват демо на своя чатбот Alpaca, основан на LLaMA 7B, като те декларират, че съгласно предварителната им оценка Alpaca се показва сходно на text-davinci-003 (GPT-3.5), " като в същото време е изненадващо дребен и лесен/евтин за възпроизвеждане ( <600$) ". Подобно на други чатботове обаче Alpaca е податлив да " халюцинира " - решително даване на погрешна информация, както и да употребява афектиран език. Демото е отстранено по-малко от седмица откакто е било стартирано заради съображения за сигурност и възходящите разноски.
Реклама
" Първоначалната цел на стартирането на демото беше да разпространим проучванията си по наличен метод. Смятаме, че в по-голямата си част сме постигнали тази цел, и поради разноските за хостинг и неадекватността на нашите филтри за наличие, взехме решение да свалим демото ", споделя в изказване за онлайн изданието The Register представител на Станфордският институт за изкуствен интелект, насочен към индивида.
В края на март LMSYS Org, организация, учредена от студенти и преподаватели от UC Berkeley в съдействие с UCSD и CMU, разгласява чатбота Vicuna, основан на LLaMA 13B. Според предварителна оценка, направена от GPT-4, Vicuna реализира качество, сходно на Bard на Гугъл, и над 90% от качеството на ChatGPT, като в същото време превъзхожда други модели като LLaMA и Alpaca. LMSYS декларира, че цената за тренирането на Vicuna е към 300 $.
В изминал вътрешен документ, оповестен от Semianalysis при започване на месеца, откривател от Гугъл декларира, че " ние не сме в позиция да спечелим тази конкуренция, а също по този начин и OpenAI ". Той прибавя, че макар че моделът на Гугъл към момента има леко преимущество, дистанцията се съкратява бързо, и че " в дълготраен проект най-хубавите модели са тези, които могат да се обновяват бързо ".
Опасения за сигурността
Решението на Meta изненада софтуерния свят. Безплатният достъп до " перлата в короната " на Meta, след публикуването на кода на системата и одобрение поотделно на всеки искащ, дал имейла си на компанията, обаче крие опасности съгласно някои специалисти, а и съперници, оповестява New York Times.
Технологичният колос Meta - притежател на платформата Фейсбук, разгласява LLaMA (Large Language Model Meta AI) - най-съвременният основополагащ огромен езиков модел, предопределен да помогне на откривателите да напреднат в работата си в тази подобласт на изкуствения разсъдък.
По-малките и по-производителни модели като LLaMA дават опция на други членове на изследователската общественост, които нямат достъп до огромни количества инфраструктура, да учат тези модели, като в допълнение демократизират достъпа в тази значима, бързо изменяща се област, афишират от компанията на Марк Зукърбърг.
LLaMa ще е наличен в няколко разнообразни размера - 7 милиарда, 13 милиарда, 33 милиарда и 65 милиарда параметъра (колкото повече параметъра има езиковият модел, толкоз по-сложен е той). За съпоставяне GPT-3.5, езиковият модел, на който е основана първичната версия на известният чатбот ChatGPT, има 175 милиарда параметъра, до момента в който за GPT-4 се твърди, че има 1 трлн.
Реклама
Според Meta по-малките модели, подготвени върху повече лексеми, са по-лесни за наново образование и прецизна конфигурация за съответна приложимост. Компанията твърди, че по-големите ѝ модели LLaMA 65B и 33B са подготвени върху 1.4 трлн. лексеми, а най-малкият - 7B, върху 1 трлн. Според механически обзор на GPT-3, оповестен от Lambdalabs, езиковият модел на OpenAI е подготвен върху 300 милиарда лексеми.
АIс отворен код
Според Ян ЛеКун, основен експерт по AI в Meta, възходящата мистериозност в Гугъл и OpenAI е " голяма неточност " и " доста неприятен метод към това, което се случва ". Той твърди, че потребителите и държавните управления ще откажат да одобряват изкуствения разсъдък, в случай че той не е отвън контрола на компании като Гугъл и Meta. " Искате ли всяка система за изкуствен интелект да бъде под контрола на няколко мощни американски компании, споделя той, представен от The New York Times. Платформата, която ще завоюва, ще бъде отворената. "
LLaMA е оповестен под некомерсиален лиценз, ориентиран към изследователска активност, като Meta дава достъп до него за всеки съответен случай на тествани лица, свързани с организации от държавния бранш, гражданското общество и университетските среди, както и на индустриални проучвателен лаборатории, само че при започване на март моделът изтича в общественото пространство, откакто е оповестен в онлайн форума 4chan.
На 13 март откриватели от Станфордския университет разгласяват демо на своя чатбот Alpaca, основан на LLaMA 7B, като те декларират, че съгласно предварителната им оценка Alpaca се показва сходно на text-davinci-003 (GPT-3.5), " като в същото време е изненадващо дребен и лесен/евтин за възпроизвеждане ( <600$) ". Подобно на други чатботове обаче Alpaca е податлив да " халюцинира " - решително даване на погрешна информация, както и да употребява афектиран език. Демото е отстранено по-малко от седмица откакто е било стартирано заради съображения за сигурност и възходящите разноски.
Реклама
" Първоначалната цел на стартирането на демото беше да разпространим проучванията си по наличен метод. Смятаме, че в по-голямата си част сме постигнали тази цел, и поради разноските за хостинг и неадекватността на нашите филтри за наличие, взехме решение да свалим демото ", споделя в изказване за онлайн изданието The Register представител на Станфордският институт за изкуствен интелект, насочен към индивида.
В края на март LMSYS Org, организация, учредена от студенти и преподаватели от UC Berkeley в съдействие с UCSD и CMU, разгласява чатбота Vicuna, основан на LLaMA 13B. Според предварителна оценка, направена от GPT-4, Vicuna реализира качество, сходно на Bard на Гугъл, и над 90% от качеството на ChatGPT, като в същото време превъзхожда други модели като LLaMA и Alpaca. LMSYS декларира, че цената за тренирането на Vicuna е към 300 $.
В изминал вътрешен документ, оповестен от Semianalysis при започване на месеца, откривател от Гугъл декларира, че " ние не сме в позиция да спечелим тази конкуренция, а също по този начин и OpenAI ". Той прибавя, че макар че моделът на Гугъл към момента има леко преимущество, дистанцията се съкратява бързо, и че " в дълготраен проект най-хубавите модели са тези, които могат да се обновяват бързо ".
Опасения за сигурността
Решението на Meta изненада софтуерния свят. Безплатният достъп до " перлата в короната " на Meta, след публикуването на кода на системата и одобрение поотделно на всеки искащ, дал имейла си на компанията, обаче крие опасности съгласно някои специалисти, а и съперници, оповестява New York Times.
Източник: capital.bg
КОМЕНТАРИ




