Напредък: AI превръща запис от диктофон в професионално аудио
Създаването на аудио с професионално качество от елементарен запис е следващото достижение на изкуствения разсъдък (снимка: CC0 Public Domain)
Изкуственият разсъдък наподобява има необхватен капацитет. Софтуерната компания Adobe пусна нов AI инструмент за работа с аудио. Програмата Enhance Speech почиства от звук записите на тирада и усъвършенства общото им качество до професионално равнище . В резултат на това даже запис, изработен на диктофон със приблизително качество, в последна сметка ще звучи като че ли е изработен в професионално студио.
Нещо повече, новият програмен продукт на Adobe е изцяло безвъзмезден, като единственото условие към потребителите, с цел да могат да употребяват AI инструмента, е да си създадат акаунт на уеб страницата на компанията. се развива като отроче на огромния проучвателен план ProjectShasta, по-късно преименуван на Adobe Podcast, отбелязва Ars Technica.
Ранни мнения
Браузърната версия на Enhance Speech се показва най-добре, съгласно първите мнения от консуматори. Веднъж регистрирани, потребителите могат да качват MP3 или WAV файл с дължина до един час или с размер до 1 гигабайт. Процесът на разчистване и възстановяване лишава единствено няколко минути.
При тестванията от публицисти се оказва, че Enhance Speech работи най-добре със записи, в които се чува единствено един глас и равнището на шума остава умерено. Записът на вградения микрофон на преносим компютър Apple от разстояние към три метра и с гръмък вентилатор наоколо в последна сметка наподобява като изработен на професионален магнетофон в изцяло заглушено студио.
Как работи софтуерът
Adobe не разкрива детайлности за това по какъв начин работи тяхната AI система. Но ArsTechnica допуска, че AI е подготвен с доста часове данни, в това число чисти и шумни записи. Полученият модел разрешава на системата да изолира честотите на човешкия глас и да синтезира тъкмо копие на всичко, което е казано.
Междувременно екипът на Hacker News е тествал Enhance Speech на доста шумни записи, а получените резултати са много странни – да вземем за пример, чуват се външни гласове в запис, изработен покрай водопад. Записи, направени на езици, разнообразни от британски, също създават „ призрачни гласове ”. Това демонстрира, че AI логаритъмът прави някакъв по-сложен развой от математическото изваждане на шума от записа.
Част от по-голяма група AI принадлежности
За Adobe има смисъл да пусне подобен инструмент. От доста години компанията разполага с пакет, наименуван AdobeAudition и закупен от различен разработчик при започване на 2000-те. Едно от най-известните му преимущества е неговият високоефективен модел за изваждане на шума, основан на профил. Но този метод има своите съществени ограничавания. AI, който употребява още един синтез на тирада, ще свърши доста по-добра работа за унищожаване на шума, макар че това евентуално ще породи проблеми, разясняват експерти.
още по темата
Enhance Speech не е първият инструмент, който предлага опция за унищожаване на звук благодарение на AI модели. От известно време са налични пакет с отворен код mayavoz и комерсиална услуга Audo Studio, които могат да дадат сходни резултати.
Enhance Speech е единствено един член от цяла група AI принадлежности на Adobe, ориентирани към подкастери. Тя включва също MicCheck и различен безвъзмезден инструмент за редактиране на аудио, който към момента е в бета проби и е наличен единствено с покана.
Източник: technews.bg
КОМЕНТАРИ




