Парадоксът на Нилс Бор за дълбоките истини спасява AI от халюцинациите
Носителят на Нобелова премия по физика Нилс Бор е споделил, че истината е тривиална и дълбока, а противоположността на дълбоката истина е друга дълбока истина. Той декларира: „ Отличителната линия на всяка дълбока истина е, че нейното отричане също е дълбока истина. “ Пример за това е казусът за светлината, която се държи по едно и също време като вълна и парченце. Същото е правилно в доста области на знанието, освен във физиката. Авторите на ново проучване настояват, че това не е просто езиков абсурд, а характерност на структурата на действителността, която може да бъде разширена до моделите на изкуствения разсъдък.
Мирослав Свитек, Олга Кошелева, Владик Крайнович и Нгуен Хоанг Фуонг предложиха математическо пояснение за какво противоположността на една дълбока истина в действителност може да не е неистина, а друга истина. То се основава на концепцията за симетричност и оптимизация.
Във физиката симетричност е всяка промяна, която не визира явлението, което учим. Една съвършена сфера може да бъде завъртяна по какъвто и да е метод и тя постоянно ще наподобява като сфера. Завъртането е симетричност. Можем да използван тази идея и в логиката. Ако имаме „ надълбоко “ метаутвърждение (нека го назовем „ S “), постоянно нямаме априорна причина да избираме „ S “ пред неговата диаметралност, „ Not-S “. Ситуацията е напълно симетрична. Със същата лекост бихме могли да обозначим „ Не-S “ като главно изказване, а „ S “ като негово отричане.
В публикацията се твърди, че в случай че казусът е съразмерен, тогава най-хубавото или „ най-дълбокото “ решение също би трябвало да е симетрично. Точката на симетричност сред „ S “ и „ Not-S “ е точката, в която и двете изказвания са еднообразно продуктивни, където можем да създадем толкоз потребни изводи от „ S “, колкото и от „ Not-S “. Тази „ инвариантна “ точка е p=0,5.
Така стигаме до същината на техния мотив. „ Най-дълбоките “ истини не са тези, които са 100% (например p=1) правилни или 100% погрешни (p=0). А тези, които се намират в напълно равновесие на симетричност – 50/50.
След това създателите минават към казуса за квантовите калкулации, написа Daily Neuron. Квантовите компютри употребяват кубитите, които могат да бъдат в суперпозиция, т.е. да имат смисли 0 и 1 по едно и също време. Съществува естествена симетричност сред 0 и 1, балансираща 0 и 1. Тази „ съвършена композиция “ от двете благоприятни условия в действителност е в основата на доста от най-ефективните квантови логаритми.
Авторите ползват същата логичност към казуса за халюциниращите модели на изкуствения разсъдък, т.е. тези случаи, в които един огромен езиков модел (LLM) дава избран отговор, който в някои случаи е доста друг от истината. В публикацията се твърди, че това се случва, тъй като LLM са научени постоянно да дават отговор с „ да “ или „ не “. Те са принудени да избират сред 1 и 0, даже когато нямат основателна причина за този избор.
Решението може да бъде тризначната логичност: 0 (не), 1 (да) и 0,5 (не знам). Тази стойност 0,5 е „ инвариантна “ и „ най-далеч от 0 и 1 “. Ако изкуственият разсъдък разполага с тази трета, „ дълбока “ алтернатива, към този момент няма да му се постанова да измисля „ да “ или „ не “, когато не е сигурен. Това просто допълнение, въодушевено от 100-годишен физичен абсурд, теоретично би могло да понижи халюцинациите на чатботовете.




