ChatGPT перейшов на GPT-4o для генерації зображень, обіцяючи якість та контрольовану свободу творчості

Користувачі ChatGPT тепер отримуватимуть значно якісніші та деталізованіші зображення

Популярний ШІ-чат OpenAI оновив систему генерації зображень, замінивши попередню модель DALL-E на новітню GPT-4o. Це означає, що користувачі ChatGPT тепер отримуватимуть значно якісніші та деталізованіші зображення.

У своєму офіційному блозі OpenAI продемонстрували вражаючі можливості GPT-4o. Модель здатна створювати складні комікси, поетапно перетворювати фотографії на ігрових персонажів, а також генерувати чіткі таблиці, графіки та формули з читабельним текстом, розміщеним у правильних місцях. Особливо відзначається вражаюча фотореалістичність згенерованих зображень.

"Генерація зображень у GPT‑4o слідує детальним запитам з увагою до деталей. Тоді як інші системи зазвичай справляються з ~5–8 об’єктами, GPT‑4o може обробляти до 10–20 різних об’єктів. Тісніший зв’язок між об’єктами, їхніми характеристиками та взаємозв’язками забезпечує кращий контроль", — повідомили в OpenAI.

Однією з ключових переваг нової моделі є її здатність використовувати контекст чату для створення зображень або аналізувати надані референси для генерації контенту в схожому стилі. У прикладі, наведеному OpenAI, GPT-4o успішно перетворив схему будівлі на фотографію, зберігши всі деталі.

Попри значний прогрес, розробники визнають, що модель ще не є ідеальною. Проблема галюцинацій залишається актуальною, а також можуть виникати складнощі з обробкою великої кількості тексту в таблицях або з розумінням складної послідовності дій.

Оновлений генератор зображень на базі GPT-4o вже доступний для користувачів планів Plus, Pro, Team і Free в ChatGPT за замовчуванням. Найближчим часом доступ отримають також підписники планів Enterprise і Edu. Розробникам API стане доступним протягом наступних кількох тижнів.

Генеральний директор OpenAI Сем Альтман привітав команду з запуском нової моделі, назвавши це "новим етапом у наданні творчої свободи". Він також зазначив, що хоча компанія прагне уникнути генерації образливого контенту, вона вважає важливим "надавати користувачам інтелектуальну свободу й контроль" у "межах розумного", уважно спостерігаючи за реакцією суспільства.

У блозі OpenAI підкреслюється, що модель і надалі блокуватиме контент, який порушує політику компанії, зокрема матеріали сексуального насильства над дітьми та фейки сексуального характеру.

Теги: