Освен да преобразува реч в говор, AI може и да

...
Коментари Харесай

Странен AI прави речта негодна за преобразуване в текст


Освен да преобразува тирада в диалект, AI може и да възпрепятсва транскрипцията
(снимка: CC0 Public Domain)

Нов логаритъм, създаден от група инженери на Колумбийския университет (Ню Йорк, САЩ), прави човешката тирада негодна за автоматизиран превод в текст, до момента в който хората не престават да я схващат.

Технологията „ ” се базира на изкуствен интелект в действително време и трансформира речта по подобен метод, че системите за автоматизирана транскрипция, т.е. за превръщане в текст, не могат да разпознаят речта.

Обикновено изкуственият разсъдък е обучаван да схваща естествената човешка тирада и нейните по-фини нюанси, само че това е нож с две остриета: актуалните джаджи са станали толкоз умни, че сполучливо се оправят с разпознаването на диалект и, съгласно теориите на конспирацията, посредством изпращане на данни до сървърите на софтуерните колоси.

Но ето, че откриватели от Колумбийския университет са решили да основат система, която работи тъкмо назад. Тя прибавя в действително време звук, не по-силен от шепот, към звука от човешката тирада, който предотвратява автоматизираното ѝ превръщане в текст. В същото време човек резервира способността си да схваща такава тирада.
още по темата
Действието на системата в действително време се смята за пробив в тази област, отбелязва The Register. Подобни технологии съществуваха и преди, само че те се основаваха на следваща обработка на съществуващи записи.

Карл Вондрик, доцент по компютърни науки и един от разработчиците на технологията, разяснява, че системата предотвратява транскрибирането на 80% от речта в текст. Нещо повече, технологията не се нуждае от чуване на речта до края и не се интересува какво съоръжение се употребява за прослушване на текста.

Миа Чикиер, студент и началник на екип, разказва логаритъма като „ превантивна атака”: системата проучва предходните две секунди от записа и предсказва какви звуци ще последват, след което генерира тон, който основава звук в плануванаъа тирада или сходни по звучене думи.

Очевидно този чудноват план е ориентиран против в действително време. Учените, тествали системата, настояват, че тя работи дейно в действителни условия, в разнообразни пространства с друга геометрия. В настоящата версия AI моделът работи с британска тирада, само че учените възнамеряват да прибавят поддръжка и на други езици.
Източник: technews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР