Един от най-добрите математици и програмисти в света представи звуковия кодек от ново поколение TSAC
Френският математик и програмист Фабрис Белард, създател на плановете QEMU, FFmpeg, BPG, QuickJS, TinyGL и TinyCC, разгласява новия формат за шифроване на аудио TSAC. Както и обвързваните с него принадлежности за компресиране и декомпресиране на аудио файлове. Форматът е фокусиран върху предаването на данни с доста невисок битрейт. Например 5,5 kb/s за моно и 7,5 kb/s за стерео, като в същото време поддържа задоволително качество на музиката и речта. Използването на TSAC дава опция за пакетиране на музикална комбинация с дълготрайност 3,5 минути и периодичност на дискретизация 44,1 kHz (стерео) във файл с размер 192 KB. Неговото качество е съвсем неразличимо от оригинала за ухото на неизкушен дилетант. Посочва се, че разработките на плана се популяризират под MIT лиценза. Но към този момент сорс кодът не се предлага за евакуиране.
TSAC се базира на аудио кодека Descript, който е уголемен, с цел да поддържа стерео тон най-важното е, че се употребява различен модел за машинно образование, основан на невронна мрежа с архитектура „ трансформър “. Това е разрешило да се усили степента на компресия, като се реконструират изгубените елементи, отчитайки модела на човешкото слухово усещане. Целият модел заема към 200 MB в компресиран тип и е планиран в детерминирано показване, което подсигурява еднакъв резултат без значение от потребления CPU/GPU и броя на нишките, участващи в изчисленията.
Енкодерът може да работи, като употребява единствено CPU за изчисленията (поддържат се AVX2 указания за ускоряване). Но за постигабнето на висока продуктивност се предлага потреблението на GPU. В настоящия си тип CUDA API може да се употребява за ускорение благодарение на графичните процесори на NVIDIA, основани на микроархитектурите Ampere, ADA и Hopper. Това са RTX 3090, RTX 4090, RTX A6000, A100 и H100 с най-малко 4 GB видеопамет. FFmpeg се употребява за конвертиране на аудио файловете преди кодирането.
Освен това можем да отбележим актуализацията на създадената от Bellar помощна стратегия ts_zip. Тя е предопределена за дейно компресиране на текстовите данни благодарение на механизъм за прогнозиране на знаците. Той се базира на система за машинно образование и огромния езиков модел RWKV 169M v4. При компресиране на списък на Wikipedia тази в действителност потребна стратегия съумя да компресира данните 7,3 пъти, а при компресиране на кода на Linux kernel 1.2 – цели 7,8 пъти. За съпоставяне, равнищата на компресия при потребление на помощната стратегия xz бяха надлежно 4,7 и 5,5 пъти. Цената на високата успеваемост на компресиране е ниската скорост на компресията и високите условия към ресурсите (минимум 4 GB RAM). При система с графичен процесор RTX 4090 успеваемостта на компресиране е почти 1 MB/s.




