OpenAI снова всех удивила, новое будущее: ChatGPT стал сильнее, новый GPT-4o (omni)

13 мая OpenAI представила GPT-4 Omni (GPT-4o), новую улучшенную модель, способную одновременно работать с текстом, изображениями, видео и аудио. Это переосмысление мультимодальности в нейросетях значительно улучшает скорость и качество ответов.

Особое внимание на презентации уделили возможностям GPT-4o как голосового помощника. Нейросеть теперь может эмоционально разговаривать, использовать разные интонации и даже проявлять харизму. Будущее уже здесь, и эпоха искусственного разума наступила, словно начало фантастического фильма катастрофы, не находите?

Функционал Джпт 4 Омни: может все?

Презентация Опен АИ

GPT-4 Omni (GPT-4o) представляет собой значительное усовершенствование по сравнению с предыдущими моделями. Новый ИИ может практически что угодно, от разговора с эмоциями до пения и изменения голоса как угодно. Вот ключевые отличия и возможности новой нейросети:

🗣️ Голосовой ассистент: GPT-4o распознает речь и поддерживает диалоги в реальном времени. Взаимодействие стало более естественным, с временем отклика на аудиозапросы в среднем 0,3 секунды, что сопоставимо со скоростью реакции человека.

Эмоциональная речь: Нейросеть больше не говорит роботизированным монотонным голосом. Она умеет смеяться, выражать эмоции, менять интонации и даже петь, делая общение более живым и человечным.

📹 Распознавание видео и изображений: GPT-4o превосходит предшественников в анализе и интерпретации визуальных данных. Она распознает объекты, действия и сцены в видео. Например, модель способна транскрибировать видеоролики и различать спикеров на записи встречи, тогда как раньше она работала только со статичными изображениями, такими как фотографии и скриншоты.

📈 Мультимодальность: GPT-4o может обрабатывать любые комбинации текста, аудио и изображений, принимая их на входе и генерируя на выходе. Модель функционирует по принципу end-to-end, что означает обработку всех типов данных одной нейросетью.

📄 Обработка текста: GPT-4o достигает уровня GPT-4 Turbo в обработке английского текста, существенно улучшая работу на других языках.

🗂️ Увеличенное контекстное окно: Нейросеть может обрабатывать большие объемы информации. На презентации GPT-4o поддерживала разговор в течение семи минут, а на примерах на сайте OpenAI создавала краткий пересказ 40-минутного видео.

🌅 Улучшенная работа с изображениями: GPT-4o создает текст практически без артефактов и создает консистентных персонажей в разных позах и 3D-модели.

Где и как пользоваться новым чатом?

Чтобы получить доступ к GPT-4o, есть несколько вариантов:

  1. разработчики: GPT-4o доступна через API, работает в два раза быстрее и стоит в два раза дешевле, чем GPT-4 Turbo.
  2. платные подписчики ChatGPT: некоторым платным подписчикам предоставлен доступ к GPT-4o; вскоре она станет доступна всем.
  3. бесплатные пользователи ChatGPT: доступ к GPT-4o предоставлен на сайте OpenAI с ограничением по количеству сообщений.
  4. на сайте Chatbot Arena: текстовые возможности GPT-4o доступны бесплатно, но с ограничениями по количеству запросов.

Бесплатность доступа к GPT-4o может зависеть от типа пользователя и платформы, но обычно доступ бесплатен с ограничениями по использованию.

Обновления для пользователей ChatGPT:

  • десктопное приложение для macOS: теперь вы можете открыть ChatGPT в окне рядом с другими программами на вашем Mac и задавать вопросы о содержимом экрана. Пока это доступно только для платных пользователей;
  • версия для Windows: ожидается выпуск в 2024 году;
  • поддержка аудио: планируется в будущем для приложения;
  • бесплатные функции: некоторые платные функции станут доступны всем пользователям, включая модель GPT-4o, веб-поиск, анализ данных и магазин ботов GPTs. Ранее для этого требовалась подписка;
  • редизайн сайта: теперь интерфейс более дружелюбный и разговорный.
Новый дизайн сайта Опен АИ Open AI

FAQ

Что такое OpenAI?

OpenAI — это исследовательская компания, занимающаяся разработкой и внедрением передовых технологий искусственного интеллекта (ИИ). Цель компании — обеспечить, чтобы ИИ приносил пользу всему человечеству.

Какова миссия OpenAI?

Миссия OpenAI — гарантировать, что искусственный интеллект принесет максимальную пользу обществу и будет использоваться для решения самых значимых проблем человечества.

Какие продукты и сервисы предоставляет OpenAI?

OpenAI предоставляет различные продукты и сервисы, включая API для разработки приложений на основе ИИ, модели обработки естественного языка, такие как GPT (Generative Pre-trained Transformer), инструменты для создания изображений (например, DALL-E), и многое другое.

Каковы ограничения использования OpenAI API?

Существуют ограничения на количество запросов, объем данных и типы использования в зависимости от выбранного плана подписки. Также важно соблюдать политику использования, чтобы избежать злоупотреблений и неправильного применения технологий ИИ.

Как OpenAI обеспечивает безопасность своих технологий?

OpenAI активно работает над обеспечением безопасности своих технологий путем внедрения строгих протоколов и проведения исследований в области безопасности ИИ. Компания также взаимодействует с международным сообществом экспертов для разработки этических норм и стандартов.

Оставьте комментарий