Презентация китайской модели искусственного интеллекта DeepSeek-R1 изменила фундаментальные представления о разработке больших языковых моделей и вывела КНР на уровень конкуренции с США. Основатель DeepSeek Лян Вэньфэн предугадал тренды обучения искусственного интеллекта (ИИ) и занимался скупкой видеокарт Nvidia в те времена, когда об этом не задумывались даже крупные компании отрасли. «РБК Тренды» рассказывают о пути визионера, его достижениях и прогнозах о будущем ИИ.
Содержание:
Кто такой Лян Вэньфэн и почему о нем все говорят
Имя Лян Вэньфэна до января 2025 года было известно только энтузиастам технологий искусственного интеллекта. Однако, когда его компания DeepSeek выпустила модель DeepSeek‑R1, та произвела эффект разорвавшейся бомбы, так как демонстрировала возможности на уровне топовых решений OpenAI. После этого работу DeepSeek и ее основателя обсуждали в Кремниевой долине и даже в Белом доме, а правительство Китая объявило разработку компании национальным достоянием.
Весной 2025 года Лян Вэньфэн попал в рейтинг IT-миллиардеров по версии Forbes, а журнал Time включил его в ежегодный список 100 самых влиятельных людей в категории «Пионеры».
Биография Лян Вэньфэна
Лян Вэньфэн родился в 1985 году в деревне, в китайской провинции Гуандун. Он рос в семье учителя начальной школы. С ранних лет мальчик проявлял способности к точным наукам. После окончания школы Лян Вэньфэн поступил в один из ведущих технических вузов КНР — Чжэцзянский университет, который окончил в 2007 году, получив степень бакалавра технических наук в области электронной информационной инженерии. В 2010 году он также получил степень магистра в области информационной и коммуникационной инженерии. Вэньфэн изучал в том числе и машинное обучение. Его диссертация была посвящена алгоритму отслеживания объектов на основе недорогой PTZ-камеры (камеры с удаленным управлением направлением и приближением).
После выпуска предприниматель посвятил себя финансам. К 2015 году Вэньфэн и два его бывших однокурсника основали квантовый хедж-фонд High-Flyer. Он занимался алгоритмической торговлей и хеджированием рисков. Вэньфэн начал активно внедрять в работу фонда методы искусственного интеллекта и машинного обучения для анализа финансовых рынков. Всего за шесть лет High-Flyer вырос до управления примерно $14,1 млрд, став одним из «четырех королей количественного инвестирования» Китая. Это привело к созданию в 2019 году компании High-Flyer AI, которая занималась исследованиями алгоритмов искусственного интеллекта и их базовыми приложениями. Вэньфэн заявил, что миссия High-Flyer — повысить эффективность вторичного рынка Китая.
В 2021 году предприниматель начал скупать тысячи графических процессоров Nvidia для своего побочного проекта в области искусственного интеллекта, одновременно управляя High-Flyer. Некоторые инсайдеры отрасли назвали такое поведение эксцентричным. Сам Вэньфэн отмечал, что хочет создать что-то, что изменит правила игры на рынке, где доминируют такие IT-гиганты, как ByteDance и Alibaba.
В итоге High-Flyer приобрела более 10 тыс. графических процессоров Nvidia A100 до того, как в США вступили в силу экспортные ограничения в отношении Китая. Эти мощности задействовали для усовершенствования суперкомпьютера компании Fire-Flyer, ориентированного на глубокое обучение. Стратегия Лян Вэньфэна заложила основу для создания ИИ-стартапа DeepSeek.
Несмотря на успех в качестве предпринимателя, визионер по-прежнему глубоко вовлечен в исследования. Профиль Лян Вэньфэна на портале IEEE показывает, что в 2024 году он публиковал статьи об ИИ в сфере производства и новых материалов.
Основание DeepSeek
В мае 2023 года Лян объявил, что High-Flyer будет заниматься разработкой общего искусственного интеллекта, и запустил стартап DeepSeek. На тот момент венчурные фонды неохотно предоставляли финансирование по данному направлению, поэтому разработку технологий ИИ было решено спонсировать из средств материнской компании. В DeepSeek сосредоточились на поиске глубоко мотивированных и талантливых сотрудников. В основном туда нанимали лучших выпускников местных университетов и аспирантов, которые публиковались в ведущих журналах, но имели мало опыта в отрасли.
Стартап быстро выпустил свой первый продукт, модель для разработчиков DeepSeek Coder, а затем DeepSeek LLM и улучшенные версии — Coder-V2 и DeepSeek-V2. В июле 2024 года Вэньфэн заявил, что ценовая война в Китае, вызванная выходом DeepSeek-V2, стала для команды огромным сюрпризом. Тогда цены на использование ИИ-моделей резко снизились. Визионер отмечал, что по мере развития экономики Китая страна должна постепенно становиться участницей мировых трендов.
В ноябре 2024 года DeepSeek открыла доступ к большой языковой модели DeepSeek-V3, способной конкурировать с ChatGPT.
В январе 2025 года компания представила модель DeepSeek-R1 — рассуждающий ИИ с открытым исходным кодом и 671 млрд параметров, который назвали «убийцей ChatGPT». Разработчики опубликовали подробный технический документ, объясняющий архитектуру и методологию обучения ИИ. Модель была построена с использованием всего 2048 графических процессоров Nvidia H800 стоимостью $5,6 млн, что отличало разработку от миллиардных проектов западных компаний. К 27 января приложение DeepSeek обогнало по популярности ChatGPT, заняв первое место в американском App Store. На этом фоне американские акции и рыночная капитализация компаний упали более чем на $1 трлн.
В августе 2025 года DeepSeek презентовала модель v3.1, которая основана на предшественнике DeepSeek‑v3, но получила дополнительно 840 млрд токенов для обучения, чтобы лучше понимать длинный контекст. Гибридная модель может переключаться между двумя режимами: think mode (deepseek‑reasoner) для многошаговых рассуждений и использования инструментов, а также non‑think mode (deepseek‑chat) для более простых задач. В тестах на рассуждение модель обошла предшественника R1 и Claude Opus 4 от Anthropic.
В стартапе работают 200–300 человек, а разработкой модели занимались от 100 до 140 сотрудников. DeepSeek обязуется предоставлять открытый исходный код своей работы. Хотя команда сосредоточилась на исследованиях, а не на извлечении прибыли, зарплатные предложения DeepSeek не уступают ByteDance и другим крупным игрокам.
О работе стартапа положительно отзывались ряд видных деятелей Кремниевой долины. Так, главный научный сотрудник Meta (признана экстремистской компанией, ее деятельность запрещена в России) по искусственному интеллекту Ян Лекун похвалил приверженность DeepSeek открытому исходному коду как следование истинному духу открытых исследований. А старший научный сотрудник Nvidia Джим Фан увидел в небольших ресурсах преимущество: «Ограниченность ресурсов — прекрасная вещь. Инстинкт выживания в условиях жесткой конкуренции в сфере искусственного интеллекта — главный стимул для прорывов».
Однако есть и те, кто критикует разработки стартапа, в том числе за активный сбор данных пользователей чат-бота и следование государственной китайской цензуре.
Наконец, DeepSeek обвиняли в использовании позаимствованных наборов данных и обучения на основе моделей OpenAI посредством дистилляции — метода передачи знаний из крупной сложной модели на меньшую и более простую. Тем не менее глава последней Сэм Альтман отказался от претензий к DeepSeek. Он заявил: «Относительно легко скопировать то, что, как вы знаете, работает. Чрезвычайно сложно сделать что‑то новое, рискованное и сложное, когда вы не знаете, сработает ли это. Отдельные исследователи по праву получают много славы за это, когда они это делают! Это самая крутая вещь в мире». Кроме того, топ-менеджер признавал, что OpenAI оказалась «не на той стороне истории» в отношении открытого исходного кода.
Новаторский подход к ИИ
Лян Вэньфэн выступает сторонником открытого исходного кода и считает, что технологии искусственного интеллекта должны стать частью повседневной жизни. У визионера также большие планы насчет общего искусственного интеллекта (AGI). Вот несколько интересных цитат из его интервью.
«Мы не перейдем на закрытый исходный код. Мы считаем, что создание надежной технологической экосистемы важнее. Если цель компании — разрабатывать приложения, то использование структуры Llama (большие языковые модели Meta) для быстрого запуска продукта — разумный выбор. Однако наша цель — AGI (искусственный интеллект общего назначения), который требует от нас изучения новых структур и фундаментальных исследований. Это может занять два года, пять или десять лет, но это произойдет в течение нашей жизни».
«Наш главный защитный барьер — это не код, а команда: накопленные знания, инновационная культура и непрерывный рост экспертизы. Публикации и открытые разработки не ослабляют нас, а наоборот, укрепляют. Для настоящих инженеров быть первым — это честь, а не риск. Открытость — это не просто стратегия, а целая философия, которая привлекает лучших специалистов».
«Инновации не рождаются из стремления к быстрой выгоде — они требуют любопытства и настоящего творческого дерзновения. Мы заложники старых привычек, но это временно».
«Прогресс отрасли по-прежнему соответствует ожиданиям. OpenAI не боги, они не могут лидировать вечно».
«Будущее за узкой специализацией. Базовые модели ИИ требуют постоянных инноваций, а у крупных компаний есть свои ограничения — не всегда они могут быть лучшими в этой роли».
«Появятся специализированные компании, разрабатывающие базовые модели и сервисы, формируя длинную цепочку ценности с четким разделением ролей. Со временем появятся новые игроки, которые будут адаптировать эти технологии для удовлетворения самых разных потребностей общества».
«Если нам нужно найти коммерческую причину, мы, вероятно, не сможем этого сделать, потому что это невыгодно. С коммерческой точки зрения фундаментальные исследования имеют очень низкий коэффициент окупаемости инвестиций, и, когда первые инвесторы OpenAI вкладывали свои деньги, они не думали о прибыли. Они делали это, потому что хотели этого».
«Если вы ищете немедленные результаты, нанимайте тех, у кого есть опыт. Но если вы хотите изменить мир, вам нужны любопытство и страсть».
«Наша цель — не просто построить модель. Мы хотим переопределить правила инноваций».
Энтузиаст-одиночка: интересные факты о Лян Вэньфэне
- Как рассказывают те, кто знал Лян Вэньфэна с юности, молодой человек был «замкнутым и нелюдимым». Тем не менее это не помешало ему в разгар кризиса 2008 года объединить команду одногруппников для сбора данных о финансовых рынках.
- После выпуска из университета Лян Вэньфэн отказался от партнерства со своим другом и будущим основателем DJI — ведущей мировой компании по производству дронов. Он верил, что ИИ обладает еще большим потенциалом, чем просто внедрение в дроны, и видел возможность создать что-то большее.
- Лян Вэньфэн всегда считал, что «ИИ изменит мир», но многие посмеивались над предпринимателем, говоря, что тот «смотрит слишком много научной фантастики». «Когда мы впервые встретились с ним, он был очень занудным парнем с ужасной прической, который рассказывал о создании кластера на 10 тыс. чипов для обучения своих собственных моделей. Мы не восприняли его всерьез», — признавал один из деловых партнеров Ляна. Сам предприниматель объяснял массовую скупку видеокарт тем, что ему «было любопытно, как далеко может зайти ИИ».
- Визионер выступает за горизонтальные связи в компании. По его мнению, инновации требуют минимального вмешательства и управления, а у каждого участника проекта должны быть пространство для самовыражения и возможность совершать ошибки. «Убедитесь, что ценности согласованы при подборе персонала, а затем используйте корпоративную культуру для обеспечения согласованности темпов. У нас нет прописанной корпоративной культуры, потому что все, что написано, может помешать инновациям. Чаще всего речь идет о личном примере» — так Лян объяснял принцип работы DeepSeek.
- Лян Вэньфэн не стремится привлекать инвестиции со стороны, несмотря на то, что DeepSeek стал одним из самых популярных стартапов в сфере ИИ в мире. Топ-менеджер не делает никаких анонсов, игнорируя интерес венчурных инвесторов. При этом DeepSeek на 84% принадлежит самому визионеру. Когда Лян в прошлом пытался привлечь капитал, его отталкивало то, что инвесторы стремились к быстрой монетизации, а не к фундаментальным исследованиям. «Деньги никогда не были для нас проблемой, проблема в запрете на поставки передовых чипов», — говорил он в 2023 году.
➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.