Эволюция ChatGPT: новые возможности за два года развития

Фото: Shutterstock
Фото: Shutterstock
За два года ChatGPT превратился из текстового помощника в мультифункциональный инструмент с поддержкой файлов и голосовыми запросами. Рассказываем, чему он научился и как это изменило пользовательский опыт

Содержание:

ChatGPT — это нейросеть, разработанная OpenAI, которая прошла значительный путь развития с момента своего появления.

  • Июнь 2020 года — представлена первая версия GPT-3.
  • Ноябрь 2022 года — ChatGPT на базе GPT-3.5 стал доступен широкой аудитории.
  • Март 2023 года — выход GPT-4 с улучшенной точностью и расширенными возможностями.
  • Май 2024 года — выпуск GPT-4o, который поддерживает мультимодальность (текст, изображения, аудио) и обеспечивает более быстрые и качественные ответы.
  • Сентябрь 2024 года — представлены модели OpenAI o1-preview и o1-mini с улучшенной цепочкой рассуждений перед ответом, доступны платным пользователям.

GPT-4o vs. GPT-3.5: более умный и точный

Было: сильный, но ограниченный

GPT-3.5 произвел впечатление на пользователей, предоставив быстрые и четкие ответы на широкий спектр вопросов. Он справлялся с текстовыми задачами, помогал с написанием статей, решением задач, генерацией идей и даже творческим письмом. Однако у этой версии были свои ограничения:

  • Потеря контекста: в длинных беседах модель могла забывать, о чем шла речь в начале, или предоставлять ответы, которые не всегда логично вписывались в предыдущие реплики.
  • Ошибки в расчетах: хотя GPT-3.5 мог решать простые математические задачи, его алгоритмы часто давали сбои при работе с более сложными расчетами.
  • Ограниченные способности к абстрактному мышлению: сложные и многослойные запросы, требующие объединения разных данных или анализа на нескольких уровнях, часто приводили к неточным или упрощенным ответам.

Фото:Иван Звягин
Индустрия 4.0 Что такое ChatGPT и на что он способен: от кода до стихов и диалогов

Стало: умнее, точнее, глубже

С выходом GPT-4o пользователи получили модель, которая существенно превосходит своего предшественника. Она демонстрирует значительное улучшение в нескольких ключевых аспектах:

  • Контекстное понимание: GPT-4o значительно лучше справляется с сохранением контекста даже в длинных диалогах. Теперь вы можете вести сложные обсуждения, переходить между темами, возвращаться к ранее упомянутым деталям — и модель будет помнить и учитывать все это.
  • Математическая точность: GPT-4o не только исправил ошибки в расчетах, но и стал более уверенно решать сложные задачи, включая те, которые требуют пошагового подхода или анализа данных.
  • Анализ сложных запросов: модель научилась лучше обрабатывать задачи, требующие многослойного анализа, комбинирования данных из разных источников или применения логики.
  • Эмоциональная чувствительность: GPT-4o стал лучше понимать тональность и эмоциональный подтекст в сообщениях, что делает его ответы более персонализированными и релевантными.

Функция Memory позволяет ChatGPT запоминать важную информацию — и неважно, в каком чате шло обсуждение
Функция Memory позволяет ChatGPT запоминать важную информацию — и неважно, в каком чате шло обсуждение (Фото: ChatGPT)

Работа с данными: от текстов к аналитике

Было: ограничения текстового подхода

Изначально ChatGPT воспринимался как мощный инструмент для работы с текстами: он помогал создавать статьи, редактировать документы, генерировать идеи и автоматизировать рутину. Однако пользователи, работающие с большими объемами данных или сложными задачами анализа, сталкивались с ограничениями. Например:

  • Нет поддержки файлов: загрузка файлов была невозможна. Любую информацию приходилось вручную копировать в текстовый формат.
  • Ограниченные вычисления: модель могла выполнить простой расчет, но не справлялась с анализом сложных данных: многомерных таблиц или статистических массивов.
  • Отсутствие визуализации: для построения графиков или диаграмм приходилось обращаться к сторонним инструментам.

Фото:Shutterstock
Индустрия 4.0 Два года ChatGPT: цифры и факты о чат-боте

Стало: универсальный аналитический помощник

С выходом Advanced Data Analysis (ADA), ранее известного как Code Interpreter, ChatGPT получил новый набор функций, который позволил ему обрабатывать и анализировать данные, а также визуализировать их. Теперь модель может не только читать и интерпретировать текст, но и выполнять сложные операции с файлами и таблицами.

Ключевые улучшения:

  1. Поддержка файлов: пользователи могут загружать файлы прямо в чат — от простых текстовых документов до сложных таблиц Excel. Это упрощает процесс передачи данных для анализа.
  2. Анализ таблиц: Модель умеет читать и анализировать данные из Excel, CSV и других форматов, выполнять фильтрацию, сортировку, находить тренды и аномалии.
  3. Визуализация: ChatGPT может строить графики, диаграммы и визуализировать данные прямо в чате. Это делает процесс анализа наглядным и доступным.
  4. Математическая точность: модель способна выполнять сложные расчеты, включая статистический и регрессионный анализ, обработку временных рядов и прогнозирование.
  5. Интерактивность: пользователи могут задавать уточняющие вопросы или менять параметры визуализации — и все это в реальном времени.

Для примера был создан тестовый датасет с официальными данными о курсах валют. ChatGPT смогла ознакомиться с информацией и построить по ним график
Для примера был создан тестовый датасет с официальными данными о курсах валют. ChatGPT смогла ознакомиться с информацией и построить по ним график (Фото: ChatGPT)

Интерактивность: от текста к мультимодальности

Было: только текст

Изначально ChatGPT работал исключительно в текстовом формате. Пользователи могли задавать вопросы, получать ответы и решать задачи только с помощью текстового взаимодействия. Это подходило для задач, где достаточно обмена текстовой информацией, однако существовали значительные ограничения.

  • Отсутствие работы с изображениями: модель не могла анализировать фотографии, графики, схемы или другие визуальные данные, что делало невозможным использование ChatGPT для задач, связанных с визуальным контентом. Например, нельзя было загрузить график и спросить: «Что он показывает?».
  • Нет голосового ввода: для взаимодействия требовалось вводить текст вручную. В условиях, когда набор текста был неудобен, например, при вождении автомобиля или занятиях спортом, это создавало трудности.
  • Линейное взаимодействие: модель не поддерживала мультимодальность — возможность обработки не только текста, но и изображений, аудио или видео. Это ограничивало ее универсальность и способность адаптироваться к различным сценариям.

Стало: мультимодальный подход

С 2024 года ChatGPT стал поддерживать голосовой и визуальный ввод, что радикально изменило подход к взаимодействию с пользователями. Теперь модель способна обрабатывать данные из разных источников и представлять информацию в удобном для пользователя формате.

Голосовые возможности сделали взаимодействие более естественным. Пользователи могут задавать вопросы голосом и получать аудиовоспроизведение ответов. Это особенно удобно, если руки заняты или набор текста неудобен. Голосовые функции делают модель более доступной, включая людей с нарушениями зрения, которые теперь могут общаться с ИИ в аудиоформате. Голосовой формат также помогает создать более «живой» диалог, благодаря чему общение с искусственным интеллектом становится все больше похожим на реальное взаимодействие между людьми.

Работа с изображениями открыла новый уровень универсальности. Теперь пользователи могут загружать фотографии, графики, диаграммы и даже рукописные заметки для анализа. Модель способна интерпретировать визуальные данные и предоставлять подробные объяснения. Например, она может:

  • анализировать графики и объяснять, какие данные они отображают;
  • распознавать текст на изображениях, что полезно для обработки фотографий документов или вывесок;
  • интерпретировать сложные визуальные схемы с краткими и понятными описаниями.

Кроме этого, в ChatGPT можно создавать изображения по текстовому описанию с помощью другой нейросети — DALL·E 3.

Мультимодальность улучшила удобство использования и сделала взаимодействие с ChatGPT более интуитивным. Теперь можно выбрать наиболее подходящий способ общения с моделью в зависимости от своих задач и предпочтений.

В качестве иллюстрации ChatGPT предложили инфографику, иллюстрирующую закон Мура. Нейросеть смогла корректно распознать график и интерпретировать его
В качестве иллюстрации ChatGPT предложили инфографику, иллюстрирующую закон Мура. Нейросеть смогла корректно распознать график и интерпретировать его (Фото: ChatGPT)

Функционал: от генератора ответов к инструменту для задач

Было: простое взаимодействие с текстом

Изначально ChatGPT был предназначен для работы с текстовыми запросами. Он помогал генерировать ответы, писать эссе, решать задачи и выполнять другие текстовые операции. Модель использовала обученные данные для ответа на вопросы и создания контента.

Однако эти возможности ограничивались простыми ответами и не подходили для более сложных запросов. Отсутствие интеграции с внешними сервисами и гибкости в настройке ограничивало использование модели для специфичных задач.

Фото:Unsplash
Индустрия 4.0 Топ-10 аналогов ChatGPT, которые работают в России

Стало: плагины

С 2023 года ChatGPT получил новые функции, расширяющие его возможности. Плагины позволяют адаптировать модель под разные задачи, интегрируя ее с внешними сервисами и данными.

Плагины — это дополнения, которые добавляются в ChatGPT и позволяют расширять функционал нейросети. С помощью них можно работать с данными в реальном времени, обращаться к онлайн-ресурсам и выполнять операции, которые выходят за пределы стандартных возможностей модели.

Примеры плагинов:

  • Запросы к базам данных: плагин может быть настроен для работы с корпоративными базами данных, что позволяет ChatGPT выполнять запросы и анализировать информацию по запросу пользователя.
  • Плагины для бизнеса: некоторые плагины специально ориентированы на маркетинг, финансы, юридическую сферу и другие отрасли. Например, подключение плагинов для автоматизации маркетинговых кампаний или анализа юридических документов.

Плагины также делают возможным использование ChatGPT в реальных бизнес-процессах, где требуется работа с актуальными данными и интеграция с другими платформами.

В официальном чате с ChatGPT можно найти множество дополнительных инструментов — плагинов и модификаций нейросетей — для решения самых разных задач
В официальном чате с ChatGPT можно найти множество дополнительных инструментов — плагинов и модификаций нейросетей — для решения самых разных задач (Фото: ChatGPT)

Поиск: от знаний до реального времени

Было: база знаний ограничивалась данными до 2021 года

Изначально ChatGPT использовал фиксированную базу знаний, собранную до 2021 года. Это обеспечивало точные и информативные ответы по широкому кругу вопросов, включая науку, историю, культуру и технологии. Модель могла помочь с объяснением исторических событий, анализом научных теорий или обсуждением культурных явлений. Однако ограничение базы данных временными рамками становилось заметным по мере устаревания информации.

Со временем модель теряла актуальность в темах, где важны свежие данные. Например, она не могла рассказать о новых научных открытиях, изменения в законодательстве оставались недоступными, а политические события последних лет или месяцев вовсе выпадали из поля ее компетенции. Это создавало барьеры для пользователей, которым требовались ответы на вопросы о текущих событиях или новинках в различных областях.

Фото:Freepik
Социальная экономика Лингвист Александр Пиперски: «Нейросети привлекают нас многословием»

Стало: поиск в интернете в реальном времени

С внедрением функции поиска в интернете ChatGPT получил возможность обращаться к актуальным ресурсам, что позволило значительно расширить его функциональность. Теперь модель может предоставлять свежую информацию о событиях, произошедших в последние дни, недели или месяцы.

Эта функция стала настоящим прорывом для пользователей, которые ищут актуальные данные. Например, ChatGPT может:

  • рассказывать о новых законах, которые были приняты недавно;
  • давать информацию о последних научных открытиях и разработках;
  • анализировать текущие политические события, включая выборы, изменения в международных отношениях или новые экономические тенденции.

Такой подход значительно повышает ценность модели в реальных сценариях, где требуется актуальная информация. Теперь ChatGPT может быть полезным инструментом не только для анализа и объяснения исторических данных, но и для принятия решений, основанных на текущих событиях.

Теперь ChatGPT умеет выходить в интернет — в будущем ИИ-поисковики позволят искать информацию проще и быстрее
Теперь ChatGPT умеет выходить в интернет — в будущем ИИ-поисковики позволят искать информацию проще и быстрее (Фото: ChatGPT)

➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.

Обновлено 06.02.2025
Авторы
Теги
Главная Лента Подписаться Поделиться
Закрыть