DeepSeek завдав ще одного удару по OpenAI. Китайський ШІ-стартап, який сколихнув Кремнієву долину своєю LLM, випустив сімейство мультимодальних ШІ-моделей Janus-Pro, що перевершують, за його словами, генератор картинок DALL-E 3 американського конкурента.
Моделі доступні для скачування на Hugging Face. Розмір варіюється від 1 млрд до 7 млрд параметрів. Моделі поширюються за ліцензією MIT і можуть вільно використовуватися в комерційних цілях.
Моделі Janus-Pro вміють як аналізувати готові зображення, так і створювати нові. Стартар стверджує, що на ШІ-бенчмарках GenEval і DPG-Bench найбільша з моделей набору – Janus-Pro-7B – обганяє моделі DALL-E 3, PixArt-alpha, Emu3-Gen і Stable Diffusion XL.
Моделі Janus-Pro здатні аналізувати і генерувати зображення всього в 384×384 пікселів. Але розробники кажуть, що незважаючи на невелику роздільну здатність створені картинки виходять досить детальними. Вони також звертають увагу на простоту, гнучкість і ефективність моделей Janus-Pro. TechCrunch теж зазначає, що продуктивність моделей з урахуванням їхнього розміру вражає.
Минулого тижня DeepSeek випустив модель R1. Застосунок вийшов у лідери в безкоштовному топі в американському сегменті App Store, обігнавши ChatGPT.