Про це повідомляє “Kreschatic” з посиланням на Tech Crunch
Стартап Mistral AI презентував свою першу мультимодальну модель Pixtral 12B, яка здатна працювати не тільки з текстом, але й із зображеннями, що робить її конкурентом для гігантів галузі, таких як OpenAI.
Pixtral 12B — це вражаюча модель із 12 мільярдами параметрів, що здатна обробляти візуальні та текстові дані одночасно. Вона створена на базі текстової моделі Mistral Nemo 12B та вже доступна для безкоштовного використання під ліцензією Apache 2.0.
Це відкриває широкі можливості для її комерційного застосування без обмежень. Завдяки Pixtral 12B можна створювати підписи до зображень, ідентифікувати об’єкти та отримувати відповіді на запитання щодо контенту зображень.
Розробники також анонсували інтеграцію моделі в чат-бот Le Chat та платформу API La Platforme, що лише підвищує її потенціал для комерційного застосування. І хоча модель здатна принести чимало користі, її навчання, яке передбачає використання публічних веб-даних, може стати причиною судових позовів через можливі порушення авторських прав.
Pixtral 12B вийшла на ринок невдовзі після того, як Mistral AI залучила 645 мільйонів доларів інвестицій, що підняло її ринкову вартість до 6 мільярдів. Серед інвесторів — Microsoft, яка також активно вкладається в американську OpenAI. Французький стартап впевнено займає своє місце у світі штучного інтелекту, змагаючись з лідерами індустрії на міжнародній арені.
Нагадаємо, раніше ми писали про те, що OpenAI представила нову модель ChatGPT яка вміє «думати».