Что такое нейросеть DeepSeek: чат-бот с опцией поиска в интернете

Фото: Sutterstock
Фото: Sutterstock
Чат-бот китайской компании DeepSeek предлагает поиск данных в Сети без специальной подписки и доступен для российских пользователей. В конце января приложение с нейросетью стало самым скачиваемым на iPhone

В ноябре 2024 года китайская компания DeepSeek открыла доступ к большой языковой модели DeepSeek V3. Разработчики утверждают, что чат-бот на базе модели способен конкурировать с ChatGPT, а основатели компании и вовсе нацелились на создание «сверхразумного» ИИ. Рассказываем, что представляет собой модель, какие она предлагает опции и как с ней работать.

Содержание:

Что такое DeepSeek V3

DeepSeek V3 — это большая языковая модель с открытым исходным кодом, которая после содержит 671 млрд параметров и обучена на 14,8 трлн токенов. Она способна анализировать тексты, делать переводы и писать эссе, а также создавать код.

Особенности модели кроются в ее архитектуре и методах обучения. Она использует:

  • Архитектуру Multi-token Prediction (MTP). Это позволяет модели предсказывать несколько слов вместо одного, анализируя одновременно разные части предложения. Такой метод повышает точность работы модели и ее производительность;
  • Mixture of Experts (MoE). Эта архитектура использует несколько специализированных и заранее обученных нейросетей-«экспертов» для анализа различных входных данных. Это позволяет ускорить обучение и повысить эффективность ИИ. DeepSeek V3 работает с 256 такими нейросетями, из которых восемь активируются для обработки каждого токена;
  • Технологию Multi-head Latent Attention (MLA) — механизм внимания, который обычно используется в больших языковых моделях и помогает им идентифицировать наиболее важные части предложения. MLA позволяет извлекать ключевые детали из фрагмента текста несколько раз, а не только один. Это означает, что ИИ с меньшей вероятностью упустит важную информацию.

Благодаря этим особенностям модель потребовала всего 2,788 млн часов или два месяца работы графических процессоров Nvidia H800 для обучения. Затраты на него составили $5,5 млн. Для сравнения — OpenAI потратила на обучение GPT $78 млн.

Фото:Иван Звягин
Индустрия 4.0 Что такое ChatGPT и на что способен чат-бот: от кода до стихов и диалогов

Разработчики утверждают, что в тестах нейросеть превзошла GPT-4о от OpenAI, Llama 3 от Meta (признана экстремистской, запрещена в России) и Claude 3.5 Sonnet от Anthropic в задачах программирования и обработки текста.

Результаты тестов DeepSeek V3 и конкурентов
Результаты тестов DeepSeek V3 и конкурентов (Фото: github.com)

Главная особенность новой модели — это полностью открытый код, который позволяет разработчикам не только использовать технологию для коммерческих целей, но и адаптировать ее для решения различных задач в сфере искусственного интеллекта.

В марте 2025 года DeepSeek представила улучшенную версию модели DeepSeek-V3, получившую название V3-0324. Она значительно улучшила показатели, особенно в математических задачах и написании кода.

Фото:Freepik
Экономика инноваций 7 нейросетей для написания текстов: от поста до сценария

Возможности DeepSeek V3

Модель предлагает контекстное окно в 128 тыс. токенов, как и GPT-4o, что позволяет ей анализировать до 300 страниц текста. Она способна:

  • генерировать тексты разных объемов и в разных жанрах;
  • искать информацию в интернете;
  • расшифровывать диаграммы и объяснять картинки;
  • писать код, корректно форматировать его и решать сложные задачи по программированию на языках C++, Go, Java, JavaScript, Python и Rust. Модель успешно интегрируется с редакторами кода;
  • рассуждать подобно GPT-o1 и o1-mini в режиме DeepThink.

DeepSeek V3 предлагает мультиязычность высокого уровня, а ее глубокое понимание китайского и английского позволяет работать с текстами без потери качества переводенного текста и смысла. Модель также поддерживает русский язык.

Минус нейросети в том, что пока она не позволяет анализировать материалы по ссылкам, а поддерживает только загрузки или выдержки из текстов.

Как пользоваться DeepSeek V3 в России

DeepSeek предлагает несколько вариантов доступа, в том числе через открытые модели на Hugging Face, бесплатную версию на собственном сайте с контекстным окном до 32 тыс. токенов, API для коммерческого использования, локальное развертывание и мобильные приложения для iOS и Android. При выходе DeepSeek-R1 пользователям было доступно 50 бесплатных запросов в день, сейчас ограничения на сайте не указаны.

Как воспользоваться бесплатной версией на сайте

Пользователи в России могут получить доступ к DeepSeek V3 через сайт. Для этого нужно:

  • перейти на сайт DeepSeek, нажать Start Now;
  • пройти регистрацию (можно с помощью аккаунта Google);
  • откроется диалоговое окно с чат-ботом. В нем, помимо обычного ответа, можно выбрать опцию DeepThink для рассуждений или Search для поиска данных в Интернете. Также для анализа можно прикрепить до 50 файлов разного формата размером до 100 МБ каждый.

Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek
Регистрация в DeepSeek

Как воспользоваться мобильным приложением

В декабре 2024 года DeepSeek выпустила бесплатное мобильное приложение для своего чат-бота. Оно доступно в российских магазинах App Store и Google Play. Также приложение можно скачать с сайта разработчиков, выбрав Get DeepSeek App и просканировав QR-код.

После установки и открытия приложения нужно нажать Agree, чтобы согласиться с условиями его использования, пройти регистрацию, после чего появится диалоговое окно с чат-ботом.

Интерфейс мобильного приложения DeepSeek
Интерфейс мобильного приложения DeepSeek (Фото: deepseek.com)

Примеры использования DeepSeek

Протестируем возможности модели в задаче генерации текста — попросим ее написать статью о трендах развития нейросетей в 2025 году. Чат-бот выдал структурированный материал на 4,5 тыс. знаков.

Статья про нейросети от DeepSeek V3
Статья про нейросети от DeepSeek V3 (Фото: deepseek.com)

А теперь попросим нейросеть подобрать специализированные англоязычные источники для этого материала. DeepSeek V3 предложила выборку из 41 ресурса, в том числе сайтов научных работ arXiv, IEEEXplore и Nature со ссылками и пояснениями.

Выборка сайтов от DeepSeek V3
Выборка сайтов от DeepSeek V3 (Фото: deepseek.com)

Предложим чат-боту порассуждать — отправим ему рассказ «Лигейя» Эдгара Аллана По и попросим объяснить, в чем смысл предисловия.

DeepSeek V3 объясняет суть предисловия к рассказу в режиме DeepThink
DeepSeek V3 объясняет суть предисловия к рассказу в режиме DeepThink (Фото: deepseek.com)

Вернемся к актуальным событиям и попросим чат-бота подготовить подборку десяти ресурсов с афишами культурных мероприятий Москвы. Нейросеть подготовила выборку не только российских, но и англоязычных сайтов.

Выборка афиш от DeepSeek V3
Выборка афиш от DeepSeek V3 (Фото: deepseek.com)

А теперь попросим чат-бота отобрать самые интересные театральные премьеры зимнего сезона.

Подборка театральных премьер от DeepSeek V3
Подборка театральных премьер от DeepSeek V3 (Фото: deepseek.com)

Испытаем возможности DeepSeek V3 в анализе больших текстов. Попросим ИИ кратко пересказать сюжет «Маленького принца» Антуана де Сент-Экзюпери объемом 112 страниц. DeepSeek V3 в ответ не только передает сюжет, но и представляет главных героев, описывает основные темы рассказа и кратко резюмирует его.

Анализ «Маленького принца» от DeepSeek V3
Анализ «Маленького принца» от DeepSeek V3 (Фото: deepseek.com)

Напоследок попросим нейросеть решить задачу по программированию, написав алгоритм для поиска минимального числа линий, которые необходимы для построения диаграммы. В ответ DeepSeek V3 не только выдает искомый алгоритм на языке Python, но и объясняет ход решения задачи, а также возможные сложности.

Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3
Алгоритм решения задачи от DeepSeek V3

Фото:Freepik
Индустрия 4.0 Что такое промпт, для чего он нужен и как правильно его написать

Краткие тезисы

  • DeepSeek V3 — новый мощный ИИ с открытым исходным кодом, претендующий на лидерство.
  • Рекордные параметры: 671 млрд параметров и обучение на 14,8 трлн токенов.
  • Уникальная архитектура: сочетает несколько инновационных технологий обработки.
  • Экономичное обучение: всего $5,5 млн против $78 млн у GPT-4.
  • Огромное контекстное окно: до 300 страниц текста за один запрос.
  • Мультиязычный ассистент с особым акцентом на китайский и английский.
  • Бесплатный доступ через сайт, API и мобильные приложения.
  • Широкий функционал: от текстов до программирования.
  • Работа с файлами: поддержка загрузки документов.
  • Текущие ограничения: нет анализа по внешним ссылкам.

➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.

Обновлено 28.07.2025
Авторы
Теги
Мария Решетникова
Главная Лента Подписаться Поделиться
Закрыть