Начало Свят Дори създателите не разбират напълно AI: проблемът с „черната кутия“

Дори създателите не разбират напълно AI: проблемът с „черната кутия“

от kritichno.e
AI генерирано изображение: инженери наблюдават черна кутия в сървърна зала, от която излиза светеща невронна мрежа, символизираща непрозрачността на изкуствения интелект.

Най-големите компании в света внедряват изкуствен интелект в търсачки, телефони, офиси, училища и държавни системи. Но зад обещанията за „революция“ стои неудобен факт: дори разработчиците на тези модели не винаги могат да обяснят защо изкуственият интелект дава точно определен отговор, греши по конкретен начин или проявява способности, които не са били изрично програмирани.

Какво всъщност призна Сундар Пичай

Сундар Пичай

Сундар Пичай/стоп кадър: YouTube/New York Times Events

Темата отново привлече внимание след старо интервю на Сундар Пичай, главен изпълнителен директор на Google и Alphabet, за предаването 60 Minutes на CBS, части, от което, отново се разпространяват. В него Пичай говори за изкуствения интелект като за технология с огромен потенциал, но признава и един от най-големите ѝ проблеми — че част от начина, по който тези системи работят, остава непрозрачен дори за хората, които ги създават. 

В интервюто журналистът Скот Пели поставя въпроса директно: как е възможно компании да пускат AI системи в обществото, след като самите те не разбират напълно как работят? Пичай отговаря, че в тази технология има аспект, който експертите наричат „черна кутия“ — система, при която се виждат входът и изходът, но вътрешният път между тях не може винаги да бъде проследен и обяснен.

Защо AI не е като обикновен софтуер

Това не означава, че разработчиците „не знаят какво са направили“. Те знаят архитектурата на модела, начина на обучение, вида на използваните данни, целите на оптимизацията и процедурите за тестване. Но при големите невронни мрежи крайното поведение не е резултат от ръчно написани правила, както при класическия софтуер. Моделът се обучава върху огромни масиви от данни и сам изгражда вътрешни статистически представяния. Именно тези представяния — милиарди параметри, връзки и зависимости — са трудни за човешко обяснение.

Тук е същината на проблема с „черната кутия“. При обикновена програма инженерът може да проследи логиката ред по ред: ако потребителят натисне бутон, програмата изпълнява предварително зададена инструкция. При големите езикови модели няма такъв прост маршрут. Те изчисляват вероятности, разпознават зависимости, комбинират контекст и генерират отговор, но невинаги може да се каже коя вътрешна „верига“ е довела до конкретната реплика.

Самата Anthropic, една от водещите компании в сектора, описва проблема по сходен начин. В публикация за изследванията си върху вътрешната структура на големите езикови модели компанията пише, че AI моделите често се третират като „черна кутия“: нещо влиза, нещо излиза, но не е ясно защо моделът е дал точно този отговор, а не друг. Според Anthropic това затруднява доверието в безопасността на системите — защото ако не знаем как работят, по-трудно можем да сме сигурни, че няма да произведат вреден, пристрастен, неверен или опасен резултат.

Причината разработчиците да не разбират напълно AI е в самия начин на създаване на тези системи. Класическият софтуер се програмира. Големите AI модели се обучават. Това е фундаментална разлика. При традиционна програма човекът задава правилата. При AI модела човекът задава архитектурата и процеса на обучение, но самите вътрешни зависимости се изграждат от модела в хода на обучението. В края на този процес разработчиците получават система, която работи впечатляващо добре, но не е напълно прозрачна.

Затова въпросът не е дали инженерите в Google, OpenAI, Anthropic или други компании са компетентни. Въпросът е, че самата технология е достигнала ниво на сложност, при което човешкото разбиране изостава от практическата ефективност. Моделите могат да пишат текстове, да превеждат, да програмират, да анализират изображения и да решават задачи, но причините за конкретните им решения невинаги могат да бъдат обяснени в човешки разбираем вид.

Това е и причината около AI да се развива отделна област, наречена обясняване или механистично обясняване. Целта ѝ е да „отвори“ черната кутия и да открие какви вътрешни структури отговарят за различни понятия, поведения и грешки.

Случаят с бенгалския език — между факт и преувеличение

Един от най-цитираните моменти от интервюто на CBS е примерът с бенгалския език. В разговора се казва, че AI система на Google е проявила неочаквана способност да превежда бенгалски след минимално подсказване. Това е представено като пример за т.нар. емергентни свойства — способности, които се появяват при достатъчно големи модели, без да са били директно програмирани като отделна функция.

Тук обаче е важно да се внимава с формулировката. Популярното твърдение, че моделът „сам се е научил на бенгалски от нищото“, е прекалено силно. Публикуваните технически материали за моделите PaLM и PaLM 2 показват, че те са обучавани върху многоезични данни и демонстрират силни способности при многоезични задачи. Тоест по-точно е да се каже, че системата е показала неочаквано добра езикова адаптация, а не че е придобила езикова способност напълно без контакт с езика.

Тази разлика е важна, защото темата лесно се превръща в митология. Реалният проблем не е, че AI „магически“ се е научил на език. Реалният проблем е, че при достатъчно големи модели могат да се появят способности, които разработчиците не са предвидили в детайли и които не могат лесно да обяснят след това.

Опитите да се отвори „черната кутия“

През 2024 г. Anthropic обяви, че е направила важна стъпка към картографиране на вътрешните представяния в голям езиков модел. Компанията твърди, че е идентифицирала милиони вътрешни „концепции“ в Claude Sonnet — модел, който вече се използва в реални продукти. Според Anthropic това е една от първите подробни карти на вътрешната работа на съвременен, производствен езиков модел.

През 2025 г. компанията публикува и ново изследване, в което описва методи за проследяване на вътрешните „мисловни“ процеси на езиков модел. Изследователите използват техники, вдъхновени от невронауката — например изолиране и промяна на части от вътрешното състояние на модела, за да видят как това влияе върху отговора му.

AI генерирано изображение: група инженери наблюдава огромен прозрачен мозък от светеща невронна мрежа, чиято част е скрита в тъмен непрозрачен куб.

OpenAI също работи по обясняването на невронните мрежи. В публикация от 2025 г. компанията описва подход със „спарс“ модели — мрежи, при които връзките са по-редки и по-лесни за проследяване. Идеята е, че ако моделите бъдат изградени по-„разплетено“, вътрешната им логика може да стане по-разбираема.

Тези изследвания показват, че проблемът не се игнорира. Напротив — водещите компании инвестират сериозно в опити да разберат собствените си системи. Но самият факт, че подобни усилия са необходими, потвърждава централния проблем: AI вече работи в реалния свят, докато науката за неговата вътрешна обяснимост все още догонва мащаба на внедряването.

Защо това вече е обществен, а не само технически проблем

Непрозрачността на AI не е просто академичен въпрос. Тя има пряко значение за безопасността, отговорността и регулацията. Ако система вземе погрешно решение, генерира невярна информация, дискриминира определена група или бъде използвана в критична инфраструктура, обществото трябва да може да разбере защо това се е случило и кой носи отговорност.

Това е особено важно, защото големите AI модели вече не са лабораторни експерименти. Те се използват в търсачки, образователни платформи, редакционни процеси, бизнес анализи, правни услуги, медицина, администрация и киберсигурност. Колкото по-широко се внедряват, толкова по-важен става въпросът дали могат да бъдат проверявани, обяснявани и контролирани.

AI революцията се движи по-бързо от разбирането за собствените ѝ инструменти. И именно това прави темата толкова важна: не защото изкуственият интелект е магия, а защото все по-често се държи като технология, която работи преди да бъде напълно разбрана.

Ако решите да подкрепите КритичноБГ, може да го направите тук. Предварително благодаря!

Дарения Revolut: @mariyatkwa

Дарения PayPal: @MariyanIvIvanov

Последвайте нашия канал в социалната мрежа Телеграм: КритичноБГ
nice fresh

Други новини