На Google I/O 2024 анонсировали множество новинок в области искусственного интеллекта, включая модели Gemini AI и их интеграцию в приложения компании
Этот материал написан ИИ в рамках эксперимента «РБК Трендов» по взаимодействию с «сотрудником» на базе нейросетей, который пишет новости и создает изображения по запросу редакции.
Что происходит
- На ежегодной конференции Google I/O 2024 компания сделала акцент на своих моделях искусственного интеллекта Gemini, а также на их интеграции в такие приложения, как Workspace и Chrome.
- Google Lens теперь позволяет искать информацию по видеозаписям. Функция позволяет записывать видео, задавать вопросы во время записи, а ИИ будет находить соответствующие ответы в интернете.
- Функция Ask Photos позволит пользователям задавать ИИ вопросы о содержимом фототеки пользователя в Google Photos. Например, можно узнать номер номерного знака автомобиля по фотографии.
- Google представила новую модель AI — Gemini 1.5 Flash, которая оптимизирована так, чтобы выполнять задачи почти без задержки. Модель улучшена в области перевода, рассуждений и программирования.
- Модель Gemini 1.5 Pro будет интегрирована в приложения Google Workspace: Docs, Sheets, Slides, Drive и Gmail, начиная со следующего месяца для платных подписчиков.
- Проект Astra от Google представляет собой мультимодального ИИ-ассистента, который может выполнять различные задачи, такие как отслеживание объектов через камеру устройства и даже выполнение задач от имени пользователя.
- Модель Veo будет генерировать видео на основе текстовых, графических и видеоподсказок. Функция будет доступна создателям контента на YouTube и предлагается для использования в кинематографе.
- Также Google запускает создание настраиваемых чат-ботов под названием Gems. Пользователи смогут создавать специализированных чат-ботов, например, для мотивации к бегу.
- Функция Gemini Live улучшит взаимодействие с ИИ через голосовые чаты. Пользователи смогут прерывать ИИ и получать информацию в реальном времени на основе видеопотока с камеры смартфона.
- Circle to Search на Android позволит пользователям искать решение математических задач, обводя их прямо на экране смартфона.
- Поиск Google также получит обновления с использованием ИИ и сможет давать пользователям обобщенные ответы на запросы.
- Android-устройства теперь смогут обнаруживать мошеннические звонки с помощью нейросетей, анализируя разговоры в реальном времени.
- В целом ИИ в Android будет улучшен, чтобы отвечать на вопросы о видео и документах на экране.
- Браузер Google Chrome получит встроенного ассистента, который поможет генерировать текст и другие задачи.
- Кроме того, Google расширяет возможности SynthID для встраивания водяных знаков в видео, созданные с помощью Veo.
Что это значит
- Конференция Google I/O — ежегодное мероприятие, где Google демонстрирует новейшие технологии и разработки. В этом году акцент был сделан на искусственном интеллекте и интеграции искусственного интеллекта в повседневные приложения.
- Новые функции, такие как поиск по видео и Ask Photos, упрощают взаимодействие с информацией и делают поиск более интуитивным.
- Введение моделей Gemini в Workspace и другие сервисы Google призвано упростить выполнение повседневных и рабочих задач.
- Проект Astra и модель Veo — попытка выйти на новые сектора рынка ИИ, создавая новые возможности для взаимодействия человека с машиной и создания контента.
- Обновления Google Search и Android в свою очередь подчеркивают стремление компании снизить порог входа и сделать нейросетевые технологии доступными для большего числа людей.