Штучний інтелект навчився бачити як людський мозок

Дослідники з IBS, університету Йонсе та Інституту Макса Планка розробили метод Lp-Convolution, який наближає штучний інтелект до принципів обробки зображень людським мозком, дозволяючи моделі бачити важливе й адаптувати свою увагу залежно від контексту.
Штучний інтелект. Фото - Pexels

Про це повідомляє “Kreschatic” з посиланням на SciTechDaily 

Група дослідників із Південної Кореї та Німеччини презентувала прорив у сфері комп’ютерного зору: нову методику Lp-Convolution, що імітує обробку зображень людським мозком. Науковці з Інституту базових наук, університету Йонсе та Інституту Макса Планка продемонстрували здатність штучного інтелекту не просто розпізнавати об’єкти, а й адаптивно реагувати на важливі деталі так, як це робить зоровий кортекс людини.

Запропонована технологія базується на вдосконаленій архітектурі нейронних мереж, яка дозволяє значно підвищити точність розпізнавання образів за рахунок використання адаптивних фільтрів. Вони змінюють форму залежно від контексту, наслідуючи спосіб, у який нейрони в мозку підсилюють інформацію з центральних і периферійних ділянок зорового поля.

Що таке Lp-Convolution і чим вона відрізняється

Стандартні згорткові нейронні мережі (CNN) оперують жорсткими квадратними фільтрами, які переміщуються зображенням та обробляють кожну частину однаково. Такий підхід обмежує здатність моделі вловлювати складні візуальні залежності, особливо коли об’єкти в зображенні частково перекриті або розкидані.

Метод Lp-Convolution змінює цей підхід, замінюючи фіксовані фільтри на адаптивні, побудовані за принципами математичної функції MPND (мультиваріантного p-узагальненого нормального розподілу). Це дозволяє мережам розтягувати фільтри в різні боки та підлаштовуватися під контекст, імітуючи, як мозок реагує на значущі деталі у зображенні.

Мозкові механізми як джерело натхнення

Людський зоровий кортекс працює не за жорсткими геометричними правилами, а використовує плавні зв’язки між нейронами, які поширюються по колу навколо центральної точки. Інтенсивність зв’язку зменшується з відстанню, формуючи гаусівську криву. Такий механізм дозволяє мозку інтегрувати інформацію з різних частин зображення й адаптивно фокусуватись на важливому.

На відміну від традиційних CNN, які ізольовано обробляють невеликі фрагменти зображень, Lp-Convolution надає змогу моделі бачити більш цілісну картину. Вона наслідує біологічну логіку обробки сигналів, що забезпечує точнішу реакцію системи на візуальні подразники.

Переваги у продуктивності та стійкості

У випробуваннях на базах зображень CIFAR-100 та TinyImageNet нова технологія показала суттєве зростання точності класифікації в порівнянні як із класичними, так і з сучасними архітектурами. Особливо важливо, що модель продемонструвала високу стійкість до пошкоджених або зашумлених даних, що має критичне значення для практичного застосування.

Також було встановлено, що коли маски, використані в Lp-Convolution, близькі до гаусівського розподілу, внутрішня активність нейромережі виявляє схожість із патернами роботи мозку мишей. Це свідчить про глибоку біологічну відповідність між новим AI-підходом і природними процесами обробки інформації.

Потенційні застосування в критичних галузях

Технологія має великий потенціал для впровадження в різних сферах. У системах автономного керування транспортом вона здатна швидше розпізнавати перешкоди. У медицині — точніше ідентифікувати патології на знімках. У робототехніці — забезпечити адаптивне бачення в складних або змінних середовищах.

Розробники відзначають, що Lp-Convolution відкриває нові горизонти для CNN, поєднуючи ефективність із біологічною реалістичністю. У перспективі ця технологія може бути використана для розв’язання логічних задач, аналізу складних візуальних патернів та реального часу обробки даних в інтерактивних системах.

Нагадаємо, раніше ми писали про жінок, які сформували майбутнє штучного інтелекту.

Share This Article
Щоб бути вільним потрібно знати правду.
Коментувати

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Exit mobile version