OpenAI снова всех удивила, новое будущее: ChatGPT стал сильнее, новый GPT-4o (omni)
13 мая OpenAI представила GPT-4 Omni (GPT-4o), новую улучшенную модель, способную одновременно работать с текстом, изображениями, видео и аудио. Это переосмысление мультимодальности в нейросетях значительно улучшает скорость и качество ответов.
Особое внимание на презентации уделили возможностям GPT-4o как голосового помощника. Нейросеть теперь может эмоционально разговаривать, использовать разные интонации и даже проявлять харизму. Будущее уже здесь, и эпоха искусственного разума наступила, словно начало фантастического фильма катастрофы, не находите?
Функционал Джпт 4 Омни: может все?
GPT-4 Omni (GPT-4o) представляет собой значительное усовершенствование по сравнению с предыдущими моделями. Новый ИИ может практически что угодно, от разговора с эмоциями до пения и изменения голоса как угодно. Вот ключевые отличия и возможности новой нейросети:
🗣️ Голосовой ассистент: GPT-4o распознает речь и поддерживает диалоги в реальном времени. Взаимодействие стало более естественным, с временем отклика на аудиозапросы в среднем 0,3 секунды, что сопоставимо со скоростью реакции человека.
Эмоциональная речь: Нейросеть больше не говорит роботизированным монотонным голосом. Она умеет смеяться, выражать эмоции, менять интонации и даже петь, делая общение более живым и человечным.
📹 Распознавание видео и изображений: GPT-4o превосходит предшественников в анализе и интерпретации визуальных данных. Она распознает объекты, действия и сцены в видео. Например, модель способна транскрибировать видеоролики и различать спикеров на записи встречи, тогда как раньше она работала только со статичными изображениями, такими как фотографии и скриншоты.
📈 Мультимодальность: GPT-4o может обрабатывать любые комбинации текста, аудио и изображений, принимая их на входе и генерируя на выходе. Модель функционирует по принципу end-to-end, что означает обработку всех типов данных одной нейросетью.
📄 Обработка текста: GPT-4o достигает уровня GPT-4 Turbo в обработке английского текста, существенно улучшая работу на других языках.
🗂️ Увеличенное контекстное окно: Нейросеть может обрабатывать большие объемы информации. На презентации GPT-4o поддерживала разговор в течение семи минут, а на примерах на сайте OpenAI создавала краткий пересказ 40-минутного видео.
🌅 Улучшенная работа с изображениями: GPT-4o создает текст практически без артефактов и создает консистентных персонажей в разных позах и 3D-модели.
Где и как пользоваться новым чатом?
Чтобы получить доступ к GPT-4o, есть несколько вариантов:
- разработчики: GPT-4o доступна через API, работает в два раза быстрее и стоит в два раза дешевле, чем GPT-4 Turbo.
- платные подписчики ChatGPT: некоторым платным подписчикам предоставлен доступ к GPT-4o; вскоре она станет доступна всем.
- бесплатные пользователи ChatGPT: доступ к GPT-4o предоставлен на сайте OpenAI с ограничением по количеству сообщений.
- на сайте Chatbot Arena: текстовые возможности GPT-4o доступны бесплатно, но с ограничениями по количеству запросов.
Бесплатность доступа к GPT-4o может зависеть от типа пользователя и платформы, но обычно доступ бесплатен с ограничениями по использованию.
Обновления для пользователей ChatGPT:
- десктопное приложение для macOS: теперь вы можете открыть ChatGPT в окне рядом с другими программами на вашем Mac и задавать вопросы о содержимом экрана. Пока это доступно только для платных пользователей;
- версия для Windows: ожидается выпуск в 2024 году;
- поддержка аудио: планируется в будущем для приложения;
- бесплатные функции: некоторые платные функции станут доступны всем пользователям, включая модель GPT-4o, веб-поиск, анализ данных и магазин ботов GPTs. Ранее для этого требовалась подписка;
- редизайн сайта: теперь интерфейс более дружелюбный и разговорный.
FAQ
OpenAI — это исследовательская компания, занимающаяся разработкой и внедрением передовых технологий искусственного интеллекта (ИИ). Цель компании — обеспечить, чтобы ИИ приносил пользу всему человечеству.
Миссия OpenAI — гарантировать, что искусственный интеллект принесет максимальную пользу обществу и будет использоваться для решения самых значимых проблем человечества.
OpenAI предоставляет различные продукты и сервисы, включая API для разработки приложений на основе ИИ, модели обработки естественного языка, такие как GPT (Generative Pre-trained Transformer), инструменты для создания изображений (например, DALL-E), и многое другое.
Существуют ограничения на количество запросов, объем данных и типы использования в зависимости от выбранного плана подписки. Также важно соблюдать политику использования, чтобы избежать злоупотреблений и неправильного применения технологий ИИ.
OpenAI активно работает над обеспечением безопасности своих технологий путем внедрения строгих протоколов и проведения исследований в области безопасности ИИ. Компания также взаимодействует с международным сообществом экспертов для разработки этических норм и стандартов.
Отправить комментарий