Ян Лекун, създателят на LeNet, формата DjVu и защитникът на отворения код
Ян Лекун, един от кръстниците на актуалния изкуствен интелект, в своя туитър остро подлага на критика корпоративните откриватели на изкуствения разсъдък, които преследват личните си разработки и се занимават с „ всяване на боязън “. Сред упоменатите са Сам Алтман (OpenAI), Демис Хасабис (Google DeepMind) и Дарио Амодей (Anthropic).
Ян Лекун е френски и американски академик в региона на машинното образование и компютърното зрение. Известен е като създател на именитата система LeNet (1989 г.), в която е един от първите, приложили методите на биологичните невронни мрежи към оптичното различаване на знаци (OCR).
Сега е вицепрезидент и водещ откривател в региона на изкуствения разсъдък в Meta Corporation (наред с другото управлява създаването на оптичния езиков модел LLaMA). Същевременно остава ревнив покровител на open source, свободната просвета и научно-техническия напредък на човечеството.
Ян Лекун е роден в предградията на Париж, получава тапия по електротехника и електроника в инженерното учебно заведение ESIEE в Париж (1978-1983 г.), а по-късно пази докторат по компютърни науки в университета „ Пиер и Мария Кюри “, в този момент университет „ Сорбона “ (1983-1987 г.).
През 1987 година, преди да получи докторската си степен, той предлага ранна версия на логаритъма за назад разпространяване ма грешките при невронните мрежи.
След това се занимава с проучвания в региона на машинното образование като постдокторант под управлението на Джефри Хинтън в Университета в Торонто в интервала 1987-1988 година (както и Иля Суцкевер, повече за това по-долу).
След това стартира дълга и сполучлива кариера в американски компании.
Разпознаване на знаци. Първите системи за машинно зрение, основани на невронни мрежи
След като получава докторската си степен през 1988 година, Ян Лекун постъпва на работа в AT&T Bell Laboratories в Холмдел, Ню Джърси, където създава редица способи за машинно образование, в това число конволюционни невронни мрежи.
Групата на Лекун в AT&T Bell Laboratories, 2002 година Първата разработка съставлява архитектура на невронна мрежа, която разпознава ръкописните числа на пощенските кодове с доста невисок % на подправени позитивни резултати. Системата е разказана в научни публикации от 1988 и 1989 година
Ръкописни образци за пощенски кодове и нормализирани числа от тестовия набор от данни. По-късно за образование на невронните мрежи е създаден еталонният набор MNIST Архитектура на невронната мрежа от научната публикация от 1989 година „ Приложение на метода за назад разпространяване на грешките за различаване на ръкописни пощенски кодове “:
Извличане на признаци (характеристики) от цифровизираните ръкописни знаци, както е разказано в изследователския документ от 1988 година „ Система за различаване на ръкописни числа на пощенските кодове “:
LeNet
В допълнение към противоположното разпространяване на грешките за тази и други системи за OCR Ян Лекун е създал и приложил няколко новаторски техники за машинно образование:
конволюционни невронни мрежи, моделирани въз основата на биологичните системи, способи за регуларизация на невронните мрежи, разказани в „ Оптимално увреждане на мозъка “, Graph Transformer Networks (GTN), способ, сходен на Conditional Random Fields (CRFs).Всичко това е употребявано в новаторски системи за оптично различаване на знаци (OCR) на банкови чекове, пощенски писма и други Впоследствие универсалната невронна мрежа на Лекун и сътрудниците му е наречена LeNet и под това име след това се загатва в научната литература. Именно по по този начин тя остава в историята.
Примери за необикновени, изкривени и зашумени знаци, които LeNet-5 разпознава вярно Архитектура на LeNet-5 от публикацията „ Gradient-based learning for document recognition “ от 1998 г:
Процентът на неточност при тестовия набор от данни за другите способи за подредба (максимален % на неточност към 0,1%),
Така, започвайки с LeNet, изкуствените невронни мрежи, моделирани въз основа на биологичните системи, които работят в нервната система на животните на Земята, започнаха да се употребяват за оптично различаване на знаците (тъй като всички живи организми произлизат от един и същи източник, механизмът на деяние на невронните мрежи е на практика идентичен за всички тях).
Така се ражда нов тип машинно зрение.
Това е главният принос на Лекун към актуалната промишленост на изкуствения разсъдък, която към 2025 година раздруса цялото човечество.
Форматът DjVu
През 1996 година Ян Лекун се причислява към AT&T Labs-Research и работи главно върху създаването на технология за компресиране на изображения и формата с отворен код DjVu. Оптичното различаване на знаците и компресирането на изображения е естествено продължение на работата на специалиста по машинно зрение.
DjVu е съперник на PDF като резервоар за сканирани документи. В същото време DjVu превъзхожда PDF във връзка с компресията. Според научна публикация, описваща формата, страниците на цветните списания се компресират до 40-70 KB, черно-белите механически документи – до 15-40 KB, а античните ръкописи – до към 100 KB; едно приемливо JPEG изображение нормално изисква 500 KB.
DjVu разделя истинското изображение на три пласта:
Преден проект. Информация за цвета на маската (3-ти слой), разграничителната дарба е оптимално понижена. Фон. Илюстрации и текстура на страницата: резолюцията им е понижена по дифолт, с цел да се пести място. Черно-бяла (еднобитова) маска. Маската се записва с разграничителната дарба на истинския файл и съдържа текстовото изображение и други отчетливи елементи.
Фонът и предният проект се компресират благодарение на вейвлет промяна (както в JPEG2000), а маската се компресира благодарение на логаритъма JB2. Това са били неповторими за времето си усъвършенствани технологии за компресиране.
Дискретното вейвлет превръщане в JPEG2000 DjVu е усъвършенстван за мрежови прехвърляния, тъй че страницата да може да бъде забелязана преди изтеглянето на файла да е завършило.
Подобно на PDF, DjVu файлът съдържа текст (OCR), което разрешава пълнотекстово търсене във файла. Файлът може да съдържа интерактивно наличие и дейни области – връзки, позволяващи лесна навигация в книгите.
Преди стандартизирането на PDF през 2008 година DjVu се считаше за най-подходящия отворен формат за предпазване на електронни документи. По това време даже нямаше стратегия за обзор на PDF за Linux, той беше затворен патентован формат. Общността беше склонна да одобри DjVu като обединен стандарт за цифрови документи.
Някои организации към момента употребяват DjVu за запазване и разпространяване на сканирани документи, като да вземем за пример Internet Archive (въпреки че през 2016 година сканирането на нови документи в DjVu беше преустановено).
Други планове
През 2002 година, дружно с Леон Боту, създава езика за програмиране Lush (Lisp Universal Shell), сходен на Lisp език за машинно образование, директен правоприемник на SN, написан през 1987 година като интерфейс за симулатор на невронни мрежи. Авторите на Lush са същите като тези на DjVu. Доколкото може да се разбере, Lush е лишен от известните дефекти на Python.
През последните десетилетия Лекун е съосновател, съветник и откривател на редица нови компании и стартъпи, в някои от които към момента взе участие:
Съосновател и консултант на Element (2012 година – понастоящем), която създава технологии и програмен продукт за биометрична автентификация, съосновател на MuseAmi (2007 – 2016 г.): създава новаторски софтуерни и хардуерни технологии за музикално продуциране, обучение и развлечения, в това число мобилните приложения Improvox, Hook’d и MusicPal, притежател на YLC Consulting LLC (2008 – 2013 г.): научноизследователска, развойна и софтуерна консултантска активност в региона на софтуера, машинното образование, машинното зрение, роботиката, извличането на данни, моделирането на данни, статистическия разбор, OCR, компресирането на данни, музикалните технологии и другиПо-нататъшна кариера
След Bell Labs и AT&T Labs през 2003 година откривателят заема позицията на професор по компютърни науки и неврология в Института за математически науки „ Курант “ към Нюйоркския университет (NYU). Той е и професор в Tandon School of Engineering на NYU.
През 2012 година основава Университетския център за просвета за данните с първата в света стратегия за висше обучение в региона на data science
Ян Лекун в Университета на Минесота От 2013 година управлява лабораторията за изкуствен интелект във Фейсбук, а в този момент е вицепрезидент и основен академик по изкуствен интелект в Meta (VP & Chief AI Scientist).
Всъщност тази обществена мрежа е една от първите, които стартират да употребяват машинно образование при създаването на приложения. Както сподели Лекун в известието за Moments от 2015 година, това мобилно приложение разпознава хората в фотосите и провежда фотоалбума в смарт телефона ви. Същата технология е приложена в уеб страницата на обществената мрежа. Тя се основава частично на работата, осъществена от екипа на Фейсбук AI Research (FAIR), тогава управителен от Ян Лекун.
През идващите години смисъла на машинното образование излиза наяве за по-широк кръг от хора, а към 2025 година – за съвсем всички. Както знаем, ИИ към този момент мина строгия тест на Тюринг и изпревари хората в осъществяването на огромен брой приложни задания.
Ян Лекун е притежател на голям брой награди и оценки, в това число премията „ Тюринг “ за 2018 година дружно с Йошуа Бенгио и Джефри Хинтън като „ татковци на революцията на дълбокото образование “.
От ляво на дясно: Ян Лекун, Джефри Хинтън и Йошуа Бенджио Нека си напомним, че Хинтън е бил теоретичен началник на Иля Суцкевер, водещ разработчик на всички GPT модели в OpenAI, който в този момент работи върху свръхмощен изкуствен интелект. AlexNet на Суцкевер е съперник на LeNet в сравнителните проби.
Джефри Хинтън и Джон Хопфийлд получиха и Нобелова премия за физика за 2024 година „ за фундаментални открития, довели до машинното образование и изкуствените невронни мрежи “.
Така че кръгът на изтъкнатите учени в региона на ИИ е добре прочут и стеснен. Впрочем, както и във всяка друга област. И е прекомерно рано да се каже да вземем за пример, че Гугъл DeepMind е победил всички и съперниците нямат никакъв късмет. В други компании също работят блестящи мозъци като Ян Лекун, а ресурсите на ИТ корпорациите са на практика неограничени, тъй че изходът от тази конкуренция никога не е сигурен.
Въпреки че работи в комерсиална корпорация, Ян Лекун остава пореден последовател на отворения код, пробва се да разгласява намерено резултатите от проучванията, извършени от неговата изследователска група в Meta, и изнася лекции (например една от последните е „ Математически спънки пред изкуствения разсъдък на човешко равнище “ на конференция по математика). Тоест той е на първо място академик и откривател, а по-късно чиновник на корпоративната машина. Неотдавнашната му обява, в която той цитира DeepSeek и другите китайски LLMs като образец за триумфа, реализиран благодарение на отворения код, се популяризира сходно на компютърен вирус:
Това е необикновена позиция, която е в прорез с общата злост към Китай. Всъщност ние би трябвало да се гордеем с това, което те са създали – то е наше общо достижение.




