3D принтер разпечата лицето и изкуственият интелект му вдъхна живот – инженер аматьор създаде говореща глава, която спори като Аристотел
Включете компютъра си и той ще ви попита за смисъла на живота: домакински мъдрец с Raspberry Pi.
Полският инженер и запалянко Никодем Бартник е сглобил необикновен събеседник – механична глава, която приказва като жив древногръцки мъдрец. Металната маска с движещи се очи и светеща уста крие неестествен мозък, работещ на личен компютър. Гласът, изражението на лицето и интонациите са синхронизирани толкоз тъкмо, че говоренето с устройството е съвсем естествено – като диалог с човек, който може да поддържа разговор в продължение на часове.
Бартник стига до концепцията, откакто си припомнил изявлението на Стив Джобс, че „ можеш да сложиш Аристотел в компютър “. Инженерът взема решение да ревизира дали е допустимо тази концепция да бъде възприета безусловно: да се съчетаят глас, лице и разсъдък в една система, която действа без интернет връзка. Той си слага за цел да сътвори изцяло самостоятелно устройство, което да не зависи от облачни услуги и да може да работи с местен хардуер.
За да накара очите на робота да наподобяват живи, младият мъж е употребявал подготвен дизайн на очи, създаден от инженера Уил Когли, прочут с плановете си за аниматроника. Шест дребни мотора обезпечават естествените придвижвания на зеницата и леки потрепвания, с цел да основат резултата на наблюдаване. Моторите се ръководят от микрокомпютър вид Raspberry Pi: той получава сигнали от софтуера и синхронизира придвижванията на очите, тъй че те да следват индивида, с който говорите. Сглобяването и конфигурирането на този модул е лишило малко повече от час.
За лицето инженерът е принтирал подготвена маска на 3D принтер и леко я е модифицирал за плана. Той усъвършенствал формата на очните ямки, с цел да реализира мечтаното изражение, и направил тялото по-тънко, тъй че електрониката да остане скрита. Зад устата инженерът оставил дребен отвор: през него минава мека светлина от диодите, а когато се приказва, наподобява като че ли устните се движат.
Слуховата система е елементарна, само че ловко проектирана. Микрофон, обвързван към Raspberry Pi, записва гласа на събеседника, след което звуковият поток се преобразува в текст и се изпраща на компютъра посредством Wi-Fi. Там всичко се обработва благодарение на набор от стратегии с отворен код. Текстът се проучва от модела Gemma 3 на Гугъл, който генерира отговор в стила на античната философия. Получената имитация се подава към услугата ElevenLabs, където се синтезира реалистична тирада с естествена интонация.
Първоначално Бартник е желал да добави дребен екран, показващ формата на звуковата вълна по време на диалога, само че екранът е бил неустойчив. В последна сметка той е сменен с пръстен от програмируеми светодиоди, ръководени от микроконтролера Raspberry Pi Pico. По време на речта светлините мигат в ритъма на фразите, засилвайки усещането за живо наличие.
Всички калкулации се правят на персоналния хардуер на изобретателя. Този метод разрешава да не се изпада според от комерсиалните платформи и техните ограничавания и резервира цялостната независимост при изпробване. Роботът може умерено да спори за логиката, а секунда по-късно да споделя вицове за международно владичество. За ръководство на настройките инженерът е основал елементарен уеб панел, където може да се избере стилът на другарство – от разумен мъдрец до навъсен събеседник, без да се пипа хардуера.
Въпреки акуратната сглобка, устройството наподобява домашно. Компонентите са свързани с проводници и платки, някои елементи са закрепени с LEGO, а маската е инсталирана върху дървена основа. Но когато роботът вдигне очи и произнесе първата фраза, чувството за домакински уют изчезва: наподобява по този начин, като че ли съществото пред вас има своя лична персона.
Бартник разгласява всички схеми, указания и програмни файлове в GitHub. Сега всеки, който разполага с 3D принтер и свободен компютър, може да построи собствен личен метафизичен „ събеседник “ и да го персонализира по собствен усет.




