Последние обновления и нововведения в ChatGPT, OpenAI

Самые свежие события из мира глобальной сети: обновления популярных сервисов, запуски новых платформ, изменения в законодательстве и политике ведущих IT-компаний. Следите за развитием социальных сетей, поисковых систем, стриминговых сервисов и облачных технологий.
Узнавайте о кибератаках, утечках данных, новшествах в сфере цифровой конфиденциальности и защите прав пользователей. Полезные материалы о трендах веб-технологий, развитии 5G , Wi-Fi 6 , интернета вещей (IoT ) и влиянии цифровизации на бизнес и повседневную жизнь.
Для тех, кто хочет быть в курсе изменений и тенденций, формирующих современный цифровой мир — актуально, понятно и по делу.
Аватара пользователя
vladgrin
Сообщения: 1523
Зарегистрирован: 19 янв 2025 17:19
Пол: Мужской
Благодарил (а): 7740 раз
Поблагодарили: 1813 раз

Последние обновления и нововведения в ChatGPT, OpenAI

Сообщение vladgrin »

OpenAI выпустила ИИ-модель ChatGPT Images 2.0, которая отлично генерирует текст на картинках (Фото. Видео)
22.04.2026 [06:26]

OpenAI представила модель генерации изображений ChatGPT Images 2.0, которая впервые среди массовых ИИ корректно отрисовывает текст на картинках. Если два года назад диффузионные ИИ-модели не могли составить меню мексиканского ресторана без выдуманных слов вроде «enchuita» и «burrto», то новая модель создаёт изображения с надписями, пригодными к использованию без правок.
Изображение

Ещё в 2024 году диффузионные ИИ-модели систематически искажали надписи. По словам Асмелаша Тека Хадгу (Asmelash Teka Hadgu), основателя и гендиректора Lesan AI, модели восстанавливают изображение из шума и усваивают паттерны, покрывающие основную массу пикселей, а текст занимает ничтожную долю площади.
Изображение
Слева — меню, сгенерированное ChatGPT Images 2.0: все надписи читаемы, ни одного выдуманного слова. Справа — три варианта от Microsoft Designer на основе DALL-E 3: «Enchidas», «Tamrielo», «Churiros», «Margartas» и десятки других искажений. Источник изображений: ChatGPT Images 2.0, Microsoft Designer (DALL-E 3) / techcrunch.com
Спойлер
С тех пор исследователи опробовали альтернативные подходы — в частности, авторегрессионные модели, которые предсказывают содержание изображения и работают по принципу, близкому к большим языковым моделям (LLM).



OpenAI не раскрыла, какая архитектура лежит в основе Images 2.0. Компания пояснила лишь, что новинка умеет «рассуждать» — искать информацию в интернете, генерировать несколько изображений по одному запросу и перепроверять результаты. Благодаря этому Images 2.0 создаёт маркетинговые материалы в разных размерах и даже комиксы. У ИИ-модели также улучшена работа с нелатинскими шрифтами — японским, корейским, хинди и бенгальским. Однако знания Images 2.0 ограничены декабрём 2025 года, что может сказаться на точности генерации по запросам о недавних событиях.
Изображение
«Images 2.0 выводит детализацию и точность генерации на беспрецедентный уровень. Модель способна продумать сложную композицию и воплотить её на практике: следовать инструкциям, сохранять заданные детали и отрисовывать элементы, на которых обычно спотыкаются генераторы, — мелкий текст, пиктограммы, элементы интерфейса, насыщенные композиции и тонкие стилистические ограничения, — и всё это в разрешении до 2K», — говорится в пресс-релизе компании. Генерация при этом занимает больше времени, чем обычный текстовый запрос к ChatGPT, но даже многопанельный комикс укладывается в несколько минут.
Изображение
Доступ к Images 2.0 получат все пользователи ChatGPT и Codex. Платные подписчики смогут генерировать более сложные изображения. OpenAI также откроет программный интерфейс (API) gpt-image-2 — стоимость будет зависеть от качества и разрешения выходных изображений.
Опубликовано: 22 Апрель 2026, 11:54