ИИ-модель Gemini: что это и как ей пользоваться

Фото: Shutterstock
Фото: Shutterstock
В начале декабря 2023 года Google представила модель искусственного интеллекта Gemini. По словам разработчиков, она лучше, чем самая продвинутая модель ИИ GPT-4. Рассказываем о Gemini подробнее

Содержание:

Что такое Gemini

Gemini — это модель искусственного интеллекта, разработанная компанией Google DeepMind. Она будет доступна в трех версиях:

  • Gemini Nano на смартфонах Google Pixel 8 Pro;
  • Gemini Pro — на ее основе теперь работает Google Bard. Позволяет генерировать тексты и изображения, задавать вопросы и искать информацию;
  • Gemini Ultra — веб-версия ИИ-модели, где реализовано наибольшее количество функций, конкурент GPT-4.

Фото:Midjourney
Экономика инноваций Что умеет чат-бот Google Bard и как им воспользоваться

Возможности Gemini

Модель ИИ Gemini Ultra умеет распознавать и анализировать тексты, изображения, аудио и даже видео (этого GPT-4 еще не умеет), а также генерировать текст и изображения. Примеры возможностей Gemini:

  • распознает рукописный текст на изображениях;
  • проверяет наличие ошибок в тексте (как в письменном, так и на изображении) и объясняет, что нужно исправить и почему;
  • создает отдельный интерфейс для каждой задачи — например, пошаговую инструкцию с иллюстрациями, как приготовить блюдо;
  • генерирует компьютерный код, таблицы, различные виды текстов и изображений;
  • ведет с пользователем «осознанный» диалог.

Согласно заявлениям Google, Gemini Ultra превзошел GPT-4 по 30 из 32 тестов. Gemini лучше отвечает на вопросы, понимает запросы пользователей, пишет код на Python, решает сложные математические задачи, расшифровывает аудио.

Одно из главных преимуществ модели от Google — взаимодействие с видео. В демонстрационном ролике было показано, как Gemini распознает и озвучивает действия, происходящие на видео, предсказывает, что будет дальше, и предлагает варианты развития событий. Также модель предложила пользователю сыграть в игру, сравнила предметы по разным характеристикам, предложила и проиллюстрировала, что можно сделать с двумя клубками пряжи, распознала гитару и включила мелодию на гитаре.

Кадр из демонстрационного ролика Google с возможностями Gemini Ultra: ИИ-модель распознала, что на видео кот собирается запрыгнуть на шкаф, и предположила, что он туда успешно приземлится
Кадр из демонстрационного ролика Google с возможностями Gemini Ultra: ИИ-модель распознала, что на видео кот собирается запрыгнуть на шкаф, и предположила, что он туда успешно приземлится (Фото: YouTube)

Как пользоваться Gemini в России

Воспользоваться Gemini Nano можно только на смартфонах Pixel 8 Pro, а Gemini Ultra будет доступна в 2024 году. Сейчас у пользователей есть возможность протестировать только Gemini Pro. Для этого нужно включить VPN и открыть Google Bard.

Пример использования Google Bard. Нейросеть подтвердила, что теперь работает на модели Gemini Pro
Пример использования Google Bard. Нейросеть подтвердила, что теперь работает на модели Gemini Pro

Примеры использования Gemini

Пример использования Gemini Ultra пока можно увидеть только в демонстрационном ролике.

Взаимодействие Gemini Ultra с видео.
(Видео: YouTube)

Зато каждому пользователю доступна возможность генерировать контент с помощью нейросети Google Bard. Для этого в диалоговом окне нужно написать запрос. «РБК Тренды» попробовали сгенерировать стихотворение и компьютерный код и описать изображение.

Обновлено 08.12.2023
Главная Лента Подписаться Поделиться
Закрыть