Google представила ряд обновлений своих предложений в области искусственного интеллекта, включая внедрение Gemini 1.5 Flash, улучшения Gemini 1.5 Pro и прогресс в Project Astra, своем видении будущего помощников с искусственным интеллектом.
Gemini 1.5 Flash — это новое дополнение к семейству моделей Google, разработанное для того, чтобы быть более быстрым и эффективным для обслуживания в большом масштабе. Несмотря на то, что он легче, чем 1.5 Pro, он сохраняет способность к мультимодальным рассуждениям на основе огромных объемов информации и имеет революционное длинное контекстное окно в один миллион токенов.
«1.5 Flash превосходно справляется с обобщением, приложениями для чата, субтитрами к изображениям и видео, извлечением данных из длинных документов и таблиц и многим другим», — пояснил Демис Хассабис, генеральный директор Google DeepMind. «Это связано с тем, что он был обучен 1.5 Pro с помощью процесса, называемого «дистилляцией», когда наиболее важные знания и навыки из более крупной модели переносятся в меньшую, более эффективную модель».
Между тем, Google значительно улучшил возможности своей модели Gemini 1.5 Pro, расширив ее контекстное окно до новаторских двух миллионов токенов. Были улучшены возможности генерации кода, логических рассуждений, многоэтапного диалога, а также понимания аудио и изображений.
Интеграция в свои продукты
Компания также интегрировала Gemini 1.5 Pro в продукты Google, включая приложения Gemini Advanced и Workspace. Кроме того, Gemini Nano теперь понимает мультимодальные входные данные, выходя за рамки только текста и включая изображения.
Компания Google анонсировала следующее поколение открытых моделей Gemma 2, предназначенных для революционной производительности и эффективности. Семейство Gemma также пополнилось PaliGemma, первой моделью компании на языке зрения, вдохновленной PaLI-3.
Наконец, Google поделился прогрессом в проекте Astra (продвинутый реагирующий агент на зрение и речь), своем видении будущего помощников с искусственным интеллектом. Компания разработала прототипы агентов, которые могут быстрее обрабатывать информацию, лучше понимать контекст и быстро реагировать в разговоре.
«Мы всегда хотели создать универсальное средство, которое будет полезно в повседневной жизни. Project Astra демонстрирует мультимодальное понимание и возможности общения в режиме реального времени», — пояснил генеральный директор Google Сундар Пичаи.
«С такими технологиями легко представить себе будущее, в котором люди смогут иметь опытного помощника с искусственным интеллектом рядом с собой через телефон или очки».