Създаването на аудио с професионално качество от обикновен запис е

...
Коментари Харесай

Напредък: AI превръща запис от диктофон в професионално аудио


Създаването на аудио с професионално качество от елементарен запис е следващото достижение на изкуствения разсъдък (снимка: CC0 Public Domain)

Изкуственият разсъдък наподобява има необхватен капацитет. Софтуерната компания Adobe пусна нов AI инструмент за работа с аудио. Програмата Enhance Speech почиства от звук записите на тирада и усъвършенства общото им качество до професионално равнище . В резултат на това даже запис, изработен на диктофон със приблизително качество, в последна сметка ще звучи като че ли е изработен в професионално студио.

Нещо повече, новият програмен продукт на Adobe е изцяло безвъзмезден, като единственото условие към потребителите, с цел да могат да употребяват AI инструмента, е  да си създадат акаунт на уеб страницата на компанията. се развива като отроче на огромния проучвателен план ProjectShasta, по-късно преименуван на Adobe Podcast, отбелязва Ars Technica.

Ранни мнения

Браузърната версия на Enhance Speech се показва най-добре, съгласно първите мнения от консуматори. Веднъж регистрирани, потребителите могат да качват MP3 или WAV файл с дължина до един час или с размер до 1 гигабайт. Процесът на разчистване и възстановяване лишава единствено няколко минути.

При тестванията от публицисти се оказва, че Enhance Speech работи най-добре със записи, в които се чува единствено един глас и равнището на шума остава умерено. Записът на вградения микрофон на преносим компютър Apple от разстояние към три метра и с гръмък вентилатор наоколо в последна сметка наподобява като изработен на професионален магнетофон в изцяло заглушено студио.

Как работи софтуерът

Adobe не разкрива детайлности за това по какъв начин работи тяхната AI система. Но ArsTechnica допуска, че AI е подготвен с доста часове данни, в това число чисти и шумни записи. Полученият модел разрешава на системата да изолира честотите на човешкия глас и да синтезира тъкмо копие на всичко, което е казано.

Междувременно екипът на Hacker News е тествал Enhance Speech на доста шумни записи, а получените резултати са много странни – да вземем за пример, чуват се външни гласове в запис, изработен покрай водопад. Записи, направени на езици, разнообразни от британски, също създават „ призрачни гласове ”. Това демонстрира, че AI логаритъмът прави някакъв по-сложен развой от математическото изваждане на шума от записа.

Част от по-голяма група AI принадлежности

За Adobe има смисъл да пусне подобен инструмент. От доста години компанията разполага с пакет, наименуван AdobeAudition и закупен от различен разработчик при започване на 2000-те. Едно от най-известните му преимущества е неговият високоефективен модел за изваждане на шума, основан на профил. Но този метод има своите съществени ограничавания. AI, който употребява още един синтез на тирада, ще свърши доста по-добра работа за унищожаване на шума, макар че това евентуално ще породи проблеми, разясняват експерти.
още по темата
Enhance Speech не е първият инструмент, който предлага опция за унищожаване на звук благодарение на AI модели. От известно време са налични пакет с отворен код mayavoz и комерсиална услуга Audo Studio, които могат да дадат сходни резултати.

Enhance Speech е единствено един член от цяла група AI принадлежности на Adobe, ориентирани към подкастери. Тя включва също MicCheck и различен безвъзмезден инструмент за редактиране на аудио, който към момента е в бета проби и е наличен единствено с покана.
Източник: technews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР