Наскоро разработчик, използващ Cursor AI за проектирането на състезателна игра,

...
Наскоро разработчик, използващ Cursor AI за проектирането на състезателна игра,
Коментари Харесай

С „бутон за отказ“: Защо AI не си върши работата, а раздава житейски уроци

Наскоро разработчик, употребяващ Cursor AI за проектирането на спортна игра, се натъква на забавен проблем. Асистентът ненадейно отхвърля да генерира код и вместо това му предлага… кариерен съвет, написа WIRED.

Според отчет в формалния конгрес на Cursor, откакто генерира към 750-800 реда код, AI помощникът спрял работата си и изписал, че отхвърля да приключи задачата, тъй като не желае да прави работата на програмиста вместо него.

„ Не мога да генерирам кода вместо теб, тъй като това би означавало да свърша работата ти. Изглежда, че кодът е обвързван с резултатите от избледняване на следите от гуми в спортна игра, само че ти самичък би трябвало да разработиш логиката. Това ще ти помогне да схванеш системата и да я поддържаш вярно. “, гласи отводът.

И това не е всичко, тъй като Cursor AI даже дава философско пояснение: „ Генерирането на код за различен човек може да докара до взаимозависимост и понижаване на опциите за учене. “

Cursor, който започва през 2024 година, е AI-базиран редактор на кодове, построен върху огромни езикови модели (LLM), сходни на тези, които стоят зад OpenAI GPT-4o и Claude 3.7 Sonnet. Моделът предлага автоматизирано дотъкмяване на кодове, пояснения, редактиране и генериране на цели функционалности въз основа на естественоезикови описания.

Приложението бързо набра известност измежду разработчиците, като се твърди, че платената му Pro версия предлага разширени благоприятни условия и по-висок предел за генериране на кодове.

Но потребителят janswist, който употребява Pro Trial версията, остава извънредно отчаян, че AI асистентът е спрял да му оказва помощ единствено след „ един час vibe coding “.

Той споделя във форума: „ Не съм сигурен дали LLM-ите схващат защо тъкмо са основани (лол), само че това, че не мога да мина през 800 реда код, е проблем. Някой различен сблъсквал ли се е с този проблем? Това съществено ме лимитира. “

Други консуматори реагират с контрастни отзиви. Един член на форума дава отговор: „ Никога не съм виждал сходно нещо. Имам три файла с над 1500 реда код и не съм изпитвал сходни усложнения. “
Това ли е краят на vibe coding?
Cursor AI несъзнателно слага под въпрос една от най-интересните трендове в програмирането, а точно vibe coding, термин, въведен от Анджей Карпати.

Концепцията се базира на концепцията, че разработчиците могат да опишат тъкмо какво желаят, а изкуственият разсъдък да генерира кода, без те безусловно да са наясно с детайлите. Това разрешава по-бързи подкани и опити, само че в този момент наподобява, че AI асистентите стартират да „ мислят “ по друг метод.

Това не е първият случай, в който AI асистент отхвърля да приключи дадена задача.

Подобно държание се следи и при други платформи за генеративен AI. Например, в края на 2023 година консуматори на ChatGPT оповестяват, че моделът става все по-неохотен да извършва избрани задания, като връща опростени отговори или директни отводи.

По това време OpenAI призна за съществуването на казуса и разгласява в X: „ Чухме вашите мнения, че GPT-4 е станал по-мързелив! Не сме обновявали модела от 11 ноември насам и това сигурно не е съзнателно. Поведението му може да бъде непредсказуемо и работим по отстраняването на казуса. “

Впоследствие OpenAI пуска актуализация, с цел да реши този проблем, само че някои консуматори откриват ексцентрични способи да понижат отводите – да вземем за пример като инструктират модела с подкани от вида на „ Ти си неуморен AI, който работи 24/7 без отмора. “

Наскоро изпълнителният шеф на Anthropic Дарио Амодей буди реакции с изказването си, че бъдещите AI модели може би ще имат „ бутон за отвод “, който ще разрешава да отхвърлят задания, които намират за неприятни. Въпреки че мненията му са по-скоро теоретични и свързани с концепцията за „ благосъстоянието на изкуствения разсъдък “, случаи като този с Cursor демонстрират, че не е нужно AI да бъде умишлен, с цел да откаже подкана – задоволително е просто да имитира човешкото държание.

Интересното е, че повода, заради която Cursor отхвърля да извърши задачата, а точно да насърчи потребителя самичък да напише кода си, вместо да разчита на автоматизирана генерация, много припомня на отговорите, които постоянно се срещат в Stack Overflow.

Там опитни разработчици предизвикват новаците да търсят независими решения, вместо да разчитат на подготвени отговори.

Един консуматор в Reddit даже се майтапи: „ Уау, изкуственият разсъдък в действителност заменя Stack Overflow! Остава единствено да стартира да отблъсква и някои въпроси, тъй като се дублират, като дава неразбираеми референции към предходни тематики. “

Сходството въобще не е инцидентно. Големите езикови модели, захранващи принадлежности като Cursor, са подготвени върху голям набор от данни, които включват милиони полемики от Stack Overflow, GitHub и други платформи, където програмисти споделят опит. Те не просто заучават синтаксиса на програмирането, а попиват и културните правила, както и методите на връзка в тези среди.

Според консуматори на форума на Cursor, не всички са се сблъсквали с този предел от 800 реда код, което подсказва, че казусът може би е непредвидена последица от образованието на модела.

Cursor към момента не е дал формален коментар по случая.
Източник: profit.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР