Microsoft разработи AI-системата SpreadsheetLLM за работа с Excel таблиците
Microsoft създаде AI-системата, наречена SpreadsheetLLM, която употребява огромни езикови модели за анализиране и интерпретиране на данните от електронните таблици в Excel. Инструментът обезпечава обработката на обширни двуизмерни мрежи, гъвкави макети и голям брой разновидности за форматиране посредством сериализиране на данните и включване на адреси на кафези, стойности и формати в потока от данни.
Инструментът включва съставен елемент, който компресира електронните таблици. Състои се от три модула: единият проучва структурата на електронната таблица и отхвърля не табличното съдържание; различен превежда данните в по-ефективно представяне; третият агрегира данните.
SpreadsheetLLM в сегашната си форма има някои ограничавания. Например, инструментът пренебрегва фоновите цветове на клетките. Освен това липсва семантичната компресия за клетките, съдържащи натурален език.
Въпреки това, в тестванията той превъзхожда обичайните подходи с 25,6% в условия на контекстно образование на GPT-4. Освен това, SheetCompressor понижава потреблението на токени за шифроване на електронните таблици с 96%, като доста понижава изчислителните разноски. По този метод електронна таблица, съдържаща 576 реда и 23 колони, която другояче би дала 61 240 токена, може да бъде понижена до по-компактното показване от 708 токена.
Този инструмент може да опрости обработката на данни в голям брой промишлености, решавайки проблеми със счетоводството и разбора на данни. SpreadsheetLLM ще разреши на нетехническите консуматори да декларират и манипулират данни от електронните таблици, като употребяват подкани на натурален език.
Инструментът може да добави и работата на експертите в региона на финансите, счетоводството и други, които изискват разбор на огромни размери от данни. Например, в модела е показана структурата “Верига от електронни таблици “ (CoS), която може да раздели разсъжденията по електронни таблици в конвейер за “откриване-съответствие-разсъждение “.
По-интригуваща е способността на модела да работи както със структурирани, по този начин и с неструктурирани данни от електронни таблици. Според откривателите, този аспект може евентуално да понижи халюцинациите в генерираните от AI резултати, а електронната таблица ще служи като „ източник на истина “ за възстановяване на надеждността на разбора.
SpreadsheetLLM към момента е в стадий на проучване.




