AI клонинги на човешки гласове идват за дял от пазара на аудиокнигите
Аудиокнигите са относително неотдавнашен феномен, само че датират доста по-отдавна от Apple и Amazon. Концепцията за „ говорещи книги “ се появява през 30-те години на предишния век в помощ на хора с повредено зрение. Едва през 70-те години на предишния век аудиокнигите стартират да се употребяват от пътуващите към работа в опит за справяне със напрежението. Но едвам когато влезе в смарт телефоните ни, аудио форматът в действителност излетя, написа CNBC. Според прогноза на Wordsrated, изследователска организация в издателската промишленост, продажбите в бранша на аудиокнигите сега могат да бъдат оценени на над 5 милиарда $, близо 2 милиарда $ от които в Съединени американски щати – най-големият пазар на аудиокниги в света. Очаква се продажбите да нарастват с 26,4% всяка година за интервала 2022 - 2030 година, което ще докара приходите от аудиокниги до 35 милиарда $ през 2030 година Това прави аудиокнигите „ най-бързо развиващият се хартиен формат в света “, съгласно Wordsrated. Аудиокнигите също така са още един пазар, който изкуственият разсъдък може да раздруса, като генерираните от AI гласове са на път да вземат микрофона от актьорите, които четат творбите. Готови ли са потребителите AI да им споделя истории? Истината е, че това към този момент се случва и наклонността евентуално ще се форсира, показва CNBC. „ За доста издатели производството на аудиокниги може да бъде огромна инвестиция “, споделя Джуди Чанг, шеф на продуктовия мениджмънт за Гугъл Play Books, добавяйки, че заплащането за артисти е част от уравнението на разноските. Компанията предлага на издателите опцията да основават книги с автоматизиран повествовател, стига да имат правата върху аудиокнигата.
Как хората чуват книгите
Хората обичат аудиокниги. Те са на второ място след музиката като най-често употребяван аудио артикул. Преживяването с аудиокнига обаче не е като да попитате Alexa за времето или да пуснете ария. И това може да съставлява ограничаване във връзка с замяната на човешките разказвачи с компютърно генерирани гласове.
„ Хората са мощно чувствителни към качеството на описа, а то доста зависи от чувството на слушателя за връзката му с гласа “, споделя Дейвид Чикарели, основен изпълнителен шеф на Voices, най-големият пазар за озвучаване. „ Близо 60% от слушателите се отхвърлят от аудиокнига, тъй като не им харесва разказвачът “, показва Чикарели, представен от CNBS.
Не е толкоз елементарно да накарате AI гласа да звучи освен като човек, само че и да се свързва със слушателите. В последна сметка озвучаването на всяка една книга е самостоятелно актьорско майсторство, което е мъчно да бъде повторено и имитирано.
„ Това, което хората могат да вършат най-добре – и което изкуственият разсъдък не може - е обвързвано с времето “, споделя още Чикарели. „ Независимо дали става дума за значима пауза или точното пресъздаване на комедиен миг, за гласа на изкуствения разсъдък е мъчно да извлече верния темп. ”
Хората четат едни елементи от сюжета с друга скорост от други елементи, тъй като схващат какво четат. AI не го прави. „ Професионалните разказвачи знаят по кое време да го ускорят и по-късно да се върнат към обикновено движение на четене “, споделя Чикарели. Освен това нямат проблем с омографите (т.е. знаят къде да създадат ударение).
AI гласовете, несъмнено, ще стават по-добри и съпротивлението на слушателя към тях надлежно ще понижава, Въпросът с изменящите играта нови технологии не е дали, а по кое време. Чикарели знае това.
„ Индустрията разбра, че смяната е във въздуха и че в този момент, когато към този момент е тук, AI ще става единствено по-добър “, разяснява той. Аудио клонирането на професионални актьорски гласове е предвидимо, което акцентира значимостта на това да се върви по този път етично и да се пазят правата на артистите.
Технологиите към този момент разрешават даже по-емоционално наличие да бъде изразено синтетични гласове, съгласно Брет Кинсела, създател и основен изпълнителен шеф на Voicebot.ai. Все още обаче в целия развой има потребност от гласа на артист, който по-късно се трансформира в различен глас. Какво чакат разказвачите на аудио книги
„ Отказвам работа по озвучаване, обвързвана с това да създадат AI модел по гласа ми “, споделя за CNBC Брад Зифър, гений в озвучаването зад кадър с 14-годишен опит. „ Най-добрият метод да се защитя е просто да заставам настрани от този пазар “, прибавя той.
„ С всеки преход идва боязън и неустановеност, само че при всеки преход ние се учим и израстваме “, счита Мишел Коб, изпълнителен шеф на Асоциацията на аудио издателите в Съединени американски щати.
Коб споделя, че растежът на аудио промишлеността уголемява обсега на опциите си и новите технологии са част от това. С повишаването на слушателите и повишаването на апетита за аудио наличие, AI може да помогне на работните процеси. Това не е нов инструмент за гениите в озвучаването, продуценти и издатели, доста от които го употребяват, с цел да подобрят контрола на качеството в постпродукцията “, прибавя Коб.
От предходната седмица този метод към гласовата продукция към този момент включва The Beatles, напомня CNBC.
Тази еволюция неизбежно ще включва рисковете, подбудени от AI. „ Независимо от специалността, страхът, че нечие прехранване ще бъде изместено от машина, е действителен “, споделя Коб. Той обаче има вяра, че не е самичък в поклонението си към „ дълбокото, богато, прочувствено интелигентно осъществяване “ на същинските разказвачи, владеещи техниката на пленяващото описване на истории.
Форматите, в които ще се намеси изкуственият интелект
Най-голямата смяна, която се случва сега, е фокусирана върху текста и изображенията, а не върху гласа.
Това, несъмнено, ще се промени. Аудиокнигите са възходяща, само че към момента релативно дребна част от общия издателски къс и спомагателните условия за време и разноски ще продължат да въздействат върху вземането на решения доколко AI да нахлуе в производството на аудиокниги.
Актьорът Брад Зифър е угрижен за ролята, която AI ще играе в неговата специалност. „ Много съм внимателен във връзка с света на изкуственият разсъдък.
Вярвам, че има огромен капацитет, само че и че може елементарно да се злоупотребява с него. Към момента към момента имам вяра, че същинското човешко озвучаване няма равно на себе си. Синтезираните гласови логаритми към момента не са на такова равнище, че да могат изцяло да възпроизвеждат всички нюанси на човешкия глас “, споделя той за CNBC.
AI гласът би трябвало да овладее разбирането/тълкуването на материала за четене и способността да носи страст и смяна в страстта, както повелява сюжетът. И защото фирмите стартират да опитват в това отношение, Зифър споделя, че няма да се изненада, в случай че приходите му бъдат наранени по някакъв метод.
Актьорът чака AI да се употребява най-широко от компании с по-малки бюджети или такива, фокусирани върху текстове за електронно образование. „ Тези, които желаят най-хубавото обаче, би трябвало да оставят работата с озвучаването на хората “, споделя той. „ Актьорите, които имат същински страсти и могат да вдъхнат живот на работата си, са най-подходящи за динамично и правдоподобно озвучаване. “
Актрисата Андреа Колинс, работеща в региона на озвучаването от 15 години, също е на мнение, че AI ще обезпечи нужните взаимни отстъпки за някои компании. „ Мисля, че ще се трансформира в превъзходен инструмент за клиенти, които търсят план, който да бъде приключен супер бързо и на рационална цена “, споделя тя.
Скоростта обаче е неминуем фактор и при общото произвеждане на аудиокниги. „ Сигурна съм, че изкуственият разсъдък ще отнеме част от пая, защото AI гласът може да се оправи с 30 000 думи доста по-бързо, в сравнение с човек “, споделя Колинс.
Тя към момента не е усетила, че изкуственият разсъдък има доста въздействие върху приходите ѝ, само че прибавя: „ Предполагам, че този ден ще пристигна. Така че вместо да си заровя главата в пясъка, се пробвам да го изпреваря “.
Наскоро Колинс подхваща стъпки гласът ѝ да бъде клониран. „ Повечето от одобрените актьори, които познавам, вършат същото. Надявам се, че клонираният ми глас ще се трансформира в различен инструмент в бизнеса ми, работейки върху планове, изискващи по-пасивно присъединяване, до момента в който аз мога да работя върху по-високобюджетни продукции, изискващи човешки глас “, споделя тя.
Джон Кубин, деец в озвучаването, споделя, че сътрудниците му в специалността би трябвало да бъдат умни в ръководството на новата AI действителност. „ Още когато технологията се появи, предизвестих, че тя ще убие половината от работата на актьорите озвучители “, разяснява той.
Джон Кубин в този момент е фокусиран върху това, което чака да се трансформира в нов пазарен сегмент за дълготрайни планове – там изкуственият разсъдък и клонираните човешки гласове могат да се срещнат по средата, да вземем за пример при сюжети от над 100 000 думи.
От бизнес позиция ще бъде предизвикателство да се противопоставим на измененията, които носи мащаба на AI, прибавя Кубин. „ Имаше време, в което се майтапих, че би било необикновено, в случай че мога да върша пари, разказвайки зад кадър, без да се постанова да съм глас зад кадър. Е, ето ни тук. “
Как хората чуват книгите
Хората обичат аудиокниги. Те са на второ място след музиката като най-често употребяван аудио артикул. Преживяването с аудиокнига обаче не е като да попитате Alexa за времето или да пуснете ария. И това може да съставлява ограничаване във връзка с замяната на човешките разказвачи с компютърно генерирани гласове.
„ Хората са мощно чувствителни към качеството на описа, а то доста зависи от чувството на слушателя за връзката му с гласа “, споделя Дейвид Чикарели, основен изпълнителен шеф на Voices, най-големият пазар за озвучаване. „ Близо 60% от слушателите се отхвърлят от аудиокнига, тъй като не им харесва разказвачът “, показва Чикарели, представен от CNBS.
Не е толкоз елементарно да накарате AI гласа да звучи освен като човек, само че и да се свързва със слушателите. В последна сметка озвучаването на всяка една книга е самостоятелно актьорско майсторство, което е мъчно да бъде повторено и имитирано.
„ Това, което хората могат да вършат най-добре – и което изкуственият разсъдък не може - е обвързвано с времето “, споделя още Чикарели. „ Независимо дали става дума за значима пауза или точното пресъздаване на комедиен миг, за гласа на изкуствения разсъдък е мъчно да извлече верния темп. ”
Хората четат едни елементи от сюжета с друга скорост от други елементи, тъй като схващат какво четат. AI не го прави. „ Професионалните разказвачи знаят по кое време да го ускорят и по-късно да се върнат към обикновено движение на четене “, споделя Чикарели. Освен това нямат проблем с омографите (т.е. знаят къде да създадат ударение).
AI гласовете, несъмнено, ще стават по-добри и съпротивлението на слушателя към тях надлежно ще понижава, Въпросът с изменящите играта нови технологии не е дали, а по кое време. Чикарели знае това.
„ Индустрията разбра, че смяната е във въздуха и че в този момент, когато към този момент е тук, AI ще става единствено по-добър “, разяснява той. Аудио клонирането на професионални актьорски гласове е предвидимо, което акцентира значимостта на това да се върви по този път етично и да се пазят правата на артистите.
Технологиите към този момент разрешават даже по-емоционално наличие да бъде изразено синтетични гласове, съгласно Брет Кинсела, създател и основен изпълнителен шеф на Voicebot.ai. Все още обаче в целия развой има потребност от гласа на артист, който по-късно се трансформира в различен глас. Какво чакат разказвачите на аудио книги
„ Отказвам работа по озвучаване, обвързвана с това да създадат AI модел по гласа ми “, споделя за CNBC Брад Зифър, гений в озвучаването зад кадър с 14-годишен опит. „ Най-добрият метод да се защитя е просто да заставам настрани от този пазар “, прибавя той.
„ С всеки преход идва боязън и неустановеност, само че при всеки преход ние се учим и израстваме “, счита Мишел Коб, изпълнителен шеф на Асоциацията на аудио издателите в Съединени американски щати.
Коб споделя, че растежът на аудио промишлеността уголемява обсега на опциите си и новите технологии са част от това. С повишаването на слушателите и повишаването на апетита за аудио наличие, AI може да помогне на работните процеси. Това не е нов инструмент за гениите в озвучаването, продуценти и издатели, доста от които го употребяват, с цел да подобрят контрола на качеството в постпродукцията “, прибавя Коб.
От предходната седмица този метод към гласовата продукция към този момент включва The Beatles, напомня CNBC.
Тази еволюция неизбежно ще включва рисковете, подбудени от AI. „ Независимо от специалността, страхът, че нечие прехранване ще бъде изместено от машина, е действителен “, споделя Коб. Той обаче има вяра, че не е самичък в поклонението си към „ дълбокото, богато, прочувствено интелигентно осъществяване “ на същинските разказвачи, владеещи техниката на пленяващото описване на истории.
Форматите, в които ще се намеси изкуственият интелект
Най-голямата смяна, която се случва сега, е фокусирана върху текста и изображенията, а не върху гласа.
Това, несъмнено, ще се промени. Аудиокнигите са възходяща, само че към момента релативно дребна част от общия издателски къс и спомагателните условия за време и разноски ще продължат да въздействат върху вземането на решения доколко AI да нахлуе в производството на аудиокниги.
Актьорът Брад Зифър е угрижен за ролята, която AI ще играе в неговата специалност. „ Много съм внимателен във връзка с света на изкуственият разсъдък.
Вярвам, че има огромен капацитет, само че и че може елементарно да се злоупотребява с него. Към момента към момента имам вяра, че същинското човешко озвучаване няма равно на себе си. Синтезираните гласови логаритми към момента не са на такова равнище, че да могат изцяло да възпроизвеждат всички нюанси на човешкия глас “, споделя той за CNBC.
AI гласът би трябвало да овладее разбирането/тълкуването на материала за четене и способността да носи страст и смяна в страстта, както повелява сюжетът. И защото фирмите стартират да опитват в това отношение, Зифър споделя, че няма да се изненада, в случай че приходите му бъдат наранени по някакъв метод.
Актьорът чака AI да се употребява най-широко от компании с по-малки бюджети или такива, фокусирани върху текстове за електронно образование. „ Тези, които желаят най-хубавото обаче, би трябвало да оставят работата с озвучаването на хората “, споделя той. „ Актьорите, които имат същински страсти и могат да вдъхнат живот на работата си, са най-подходящи за динамично и правдоподобно озвучаване. “
Актрисата Андреа Колинс, работеща в региона на озвучаването от 15 години, също е на мнение, че AI ще обезпечи нужните взаимни отстъпки за някои компании. „ Мисля, че ще се трансформира в превъзходен инструмент за клиенти, които търсят план, който да бъде приключен супер бързо и на рационална цена “, споделя тя.
Скоростта обаче е неминуем фактор и при общото произвеждане на аудиокниги. „ Сигурна съм, че изкуственият разсъдък ще отнеме част от пая, защото AI гласът може да се оправи с 30 000 думи доста по-бързо, в сравнение с човек “, споделя Колинс.
Тя към момента не е усетила, че изкуственият разсъдък има доста въздействие върху приходите ѝ, само че прибавя: „ Предполагам, че този ден ще пристигна. Така че вместо да си заровя главата в пясъка, се пробвам да го изпреваря “.
Наскоро Колинс подхваща стъпки гласът ѝ да бъде клониран. „ Повечето от одобрените актьори, които познавам, вършат същото. Надявам се, че клонираният ми глас ще се трансформира в различен инструмент в бизнеса ми, работейки върху планове, изискващи по-пасивно присъединяване, до момента в който аз мога да работя върху по-високобюджетни продукции, изискващи човешки глас “, споделя тя.
Джон Кубин, деец в озвучаването, споделя, че сътрудниците му в специалността би трябвало да бъдат умни в ръководството на новата AI действителност. „ Още когато технологията се появи, предизвестих, че тя ще убие половината от работата на актьорите озвучители “, разяснява той.
Джон Кубин в този момент е фокусиран върху това, което чака да се трансформира в нов пазарен сегмент за дълготрайни планове – там изкуственият разсъдък и клонираните човешки гласове могат да се срещнат по средата, да вземем за пример при сюжети от над 100 000 думи.
От бизнес позиция ще бъде предизвикателство да се противопоставим на измененията, които носи мащаба на AI, прибавя Кубин. „ Имаше време, в което се майтапих, че би било необикновено, в случай че мога да върша пари, разказвайки зад кадър, без да се постанова да съм глас зад кадър. Е, ето ни тук. “
Източник: profit.bg
КОМЕНТАРИ




