Будущее науки, 29 ноя 2024, 13:02

Ученый совет: как искусственный интеллект помогает научным исследованиям

Читать в полной версии

Фото: Midjourney

От открытия новых лекарств и моделирования эволюции Вселенной до распознавания речи и интерпретации визуальной информации — рассказываем о самых впечатляющих способах применения ИИ в науке

Содержание:

Обработка естественного языка
Компьютерное зрение
Распознавание речи
Глубокое обучение
Генеративные модели
Предиктивная аналитика

Обработка естественного языка

Обработка естественного языка (Natural Language Processing — NLP) помогает компьютерам понимать человеческий язык и улавливать контекст, снижая когнитивную нагрузку людей при работе с текстами. Такие технологии, как Named Entity Recognition (NER) и Text Mining, помогают автоматически извлекать из научных статей ключевые термины, имена авторов, названия учреждений и упоминания. Благодаря извлечению структурированной информации становится проще сопоставлять результаты разных исследований и объединять данные из различных источников, что значительно экономит время.

Методы NLP автоматизируют анализ текста, выявляют закономерности, придумывают гипотезы и даже генерируют новые тексты. Программы на основе NLP используются для поиска научных публикаций, обобщения выводов, выбора релевантных статей и извлечения их краткого содержания, что ускоряет написание и рецензирование научных работ. А некоторые научные журналы даже допускают использование ИИ для генерации текстов, описывающих исследования.

В медицине системы обработки естественного языка анализируют неструктурированные данные из электронных медицинских записей для извлечения ключевой информации, такие как диагнозы, назначения и аллергии, облегчая работу врачей и повышая эффективность медицинской помощи. NLP может быть полезен при интерпретации информации о медикаментозной терапии из историй болезни. Кроме того, с помощью этой технологии можно генерировать электронные карты пациентов. Это крайне полезно для исследований, так как ученые зачастую не могут пользоваться картами реальных пациентов из-за ограничений по защите персональных данных.

Общение с врачами вместо бумажной рутины: как идет цифровизация фармы

Индустрия 4.0

В генетике NLP используется для обработки текстов из биологических баз данных, что позволяет извлекать и интерпретировать результаты генетических исследований, объединяя их с клиническими данными. В геномных исследованиях часто необходимо размечать последовательности ДНК, определяя, какие части кодируют белки, а какие управляют их биосинтезом. NLP может помочь в автоматизации этого процесса. Кроме того, используя методы NLP, можно идентифицировать, какие гены упоминаются в последовательности ДНК и какую функцию они выполняют.

В экономике эти технологии упрощают обработку и анализ больших объемов информации, таких как финансовые отчеты и статистика, выявляя ключевые показатели и закономерности.

В социологии исследователи анализируют данные из социальных сетей и онлайн-отзывов для определения общественного мнения о различных темах и явлениях, например при изучении здоровья населения или реакции общества на важные события.

Технология NLP позволяет исследовать эволюцию языка, выявлять изменения в лексике и фразеологии в рамках лингвистических исследований. Она также предоставляет инструменты для анализа больших объемов текстовых данных, что позволяет лингвистам изучать структуру, семантику и стиль языков. В корпусной лингвистике NLP помогает выявлять языковые закономерности в больших корпусах текстов.

Кризис рационального: как меняется отношение к науке и что будет дальше

Экономика образования

Компьютерное зрение

Компьютерное зрение — это область искусственного интеллекта, занимающаяся автоматическим извлечением информации из изображений и видео, например каких-то признаков или сегментов. Оно позволяет машинам «видеть», воспринимать и интерпретировать визуальную информацию из окружающего мира. В последние годы возможности компьютерного зрения значительно облегчили различные исследовательские процессы в науке.

Одним из самых значимых применений компьютерного зрения является диагностика заболеваний, таких как рак и патологии органов. Распознавание изображений позволяет анализировать медицинские снимки, что способствует раннему обнаружению потенциальных угроз для здоровья пациентов. Например, ИИ научился анализировать рентгеновские снимки для выявления опухолей и других аномалий, которые могут указывать на рак. В рамках московского радиологического эксперимента по использованию компьютерного зрения, проводимого несколько лет, уже до 90% снимков маммографии анализируются с помощью ИИ. Он также может по фотографиям кожи эффективно распознавать рак кожи.

ИИ помогает обрабатывать сложные изображения УЗИ, МРТ или КТ, обнаруживая кисты и заболевания на ранних стадиях. Даже опытный врач может пропустить незначительные отклонения, а ИИ способен заметить любые мельчайшие изменения в тканях. Это позволяет врачам быстрее и точнее определять наличие заболеваний.

Меньше рутины, больше дела: как нейросети помогают московским врачам

Индустрия 4.0

В биологии компьютерное зрение помогает в исследовании тканей автоматически определять тип клеток или наличие патогенов в образцах. В молекулярной биологии распознавание изображений дополняет различные методы анализа ДНК и РНК, исследующие изменения в них.

В экологии распознавание изображений помогает отслеживать изменения в окружающей среде и мониторить биоразнообразие. Например, отслеживать изменения в экосистемах, такие как вырубка лесов или высыхание болот.

В астрономии ИИ стал незаменимым инструментом для обработки огромного объема данных, получаемых с помощью телескопов и космических миссий из необъятных просторов космоса. Алгоритмы компьютерного зрения могут анализировать данные с телескопов, спектрометров и других инструментов для обнаружения небесных тел и явлений, которые в противном случае могли бы остаться незамеченными.

Например, ИИ используется для обнаружения экзопланет путем анализа на снимках с телескопов кривых блеска звезд на предмет периодических падений яркости, которые указывают на прохождение планеты перед своим светилом. Методики распознавания также помогают в интерпретации спектров света, излучаемого астрономическими объектами, что позволяет изучать их состав, температуру и движение.

А технология распознавания текста OCR (Optical Character Recognition — оптическое распознавание символов) используется для исследований и оцифровки старых книг и бумажных документов. OCR позволяет быстро и точно извлекать информацию из исторических документов, рукописей и книг. Это особенно полезно для исследователей, работающих в области истории, археологии и литературоведения. Благодаря OCR ученые могут изучать древние тексты, которые ранее были недоступны для анализа из-за сложности их чтения.

Тренды 2025 года от Gartner: незримый ИИ и нейроинтерфейсы

Индустрия 4.0

Цифровизация архивов также способствует развитию междисциплинарных исследований, так как ученые из разных областей могут легко получить доступ к необходимым данным. Кроме того, данные, полученные с помощью технологии OCR, могут быть использованы для обучения моделей искусственного интеллекта. Это способствует развитию технологий машинного обучения и глубокого обучения.

Распознавание речи

Распознавание речи — это технология, позволяющая компьютерам и другим устройствам понимать и интерпретировать человеческую речь, преобразовывать ее в текстовый формат. Распознавание речи применяется во многих сферах: от голосовых помощников (таких как «Алиса» или Siri) до автоматических систем обработки обращений в службах поддержки и создания субтитров для видео. В науке, например, распознавание речи может использоваться для написания статей, когда ученые надиктовывают машине, словно секретарю, наброски будущей работы.

Анализ голосовых данных полезен и для диагностики заболеваний: изменение тембра или ритма голоса может указывать на негативные состояния, такие как депрессия или заболевания легких.

В психологии распознавание речи может использоваться для анализа общения и поведения, позволяя выявлять интонации и эмоции, которые могут быть связаны с определенными психическими состояниями и стрессом. Например, программы могут анализировать способность пациентов к эмоциональному выражению, их уровень стресса и уверенности, основываясь на их интонации и ритме речи.

Социологи активно применяют распознавание речи для упрощения сбора данных в рамках качественных исследований, посвященных мнениям и предпочтениям людей. Например, во время интервью с участниками исследователи могут записывать разговоры, а затем автоматически преобразовывать их в текст. Это позволяет им более эффективно анализировать ответы, выявляя закономерности и ключевые темы, без необходимости тратить много времени на ручной ввод.

Часто исследователи прибегают к программному обеспечению для анализа текста, которое помогает им находить ключевые слова и фразы, что значительно ускоряет процесс исследования. Благодаря этому они могут не только анализировать ответы, но и выявлять общие тенденции в поведении людей.

Поймать полутона: как искусственный интеллект распознает эмоции в речи

Индустрия 4.0

Лингвисты также находят применение распознаванию речи в своих научных изысканиях. Например, они могут использовать эту технологию для анализа произношения определенных слов и фраз в разных диалектах и говорах. Записывая разговоры и анализируя их с помощью распознавания речи, ученые могут выявить фонетические особенности и закономерности, которые отличают одни языковые группы от других. Это позволяет глубже понять специфику различных языков и культур, что может быть полезно как для преподавания языков, так и для диалектных исследований.

За прошедшие годы технология распознавания речи значительно усовершенствовалась, позволив врачам расшифровывать заметки для записи рекомендаций и заключений. Например, доктор может записать голосовое сообщение с диагнозом или советами для пациента, которое автоматически преобразуется в текст и сохраняется в электронной медицинской карте.

Эта технология экономит время врачей и позволяет уделять больше внимания пациентам — это особенно важно в ситуациях, когда требуется неотложная помощь. При этом ИИ обнаруживает и исправляет любые ошибки в транскрипции, прежде чем передавать ее человеку для проверки. Это сокращает время на написание документов и снижает вероятность ошибок.

Глубокое обучение

Глубокое обучение — это совокупность методов ИИ, использующих многослойные нейронные сети для моделирования абстрактных понятий, обработки больших объемов данных и поиска паттернов. Его методы в разном виде сегодня используются практически во всех технологиях искусственного интеллекта. Алгоритмы ИИ способны анализировать огромные массивы данных для выявления тенденций и закономерностей, которые могут быть упущены из виду живыми исследователями. Эта возможность облегчила работу ученых в различных научных областях, позволив получить более глубокое понимание проблем и делать более точные прогнозы.

Глубокое обучение помогает в решении уравнений квантовой механики, что может привести к созданию новых материалов и технологий. В физике нейронные сети могут моделировать сложные физические процессы, например динамику частиц в плазме.

В физике элементарных частиц глубокое обучение играет ключевую роль в обработке потоков данных, которые генерируются ускорителями частиц, такими как Большой адронный коллайдер. Алгоритмы глубокого обучения помогают идентифицировать и классифицировать события распада частиц, находя редкие события, которые могут иметь большое значение для подтверждения гипотез.

Глубокое обучение также используется для моделирования сложных биологических процессов. Например, алгоритмы могут применяться для предсказания структуры белков на основе их аминокислотной последовательности. Алгоритм AlphaFold от компании DeepMind показал выдающиеся результаты в предсказании структуры белков, что применяется в биохимии и разработке новых лекарств. В 2024 году авторы AlphaFold получили Нобелевскую премию по химии.

Традиционные методы поиска новых лекарств требуют много времени и средств, часто на это уходит более десяти лет и миллиарды долларов. ИИ значительно ускоряет этот процесс. Алгоритмы машинного обучения анализируют обширные наборы данных о химических свойствах веществ, чтобы выявить перспективные соединения, которые могут оказывать терапевтическое воздействие. Это сокращает время на проведение экспериментов и повышает эффективность выявления кандидатов на роль лекарств.

Как работают искусственный интеллект, машинное и глубокое обучение

Индустрия 4.0

В генетике ИИ помогает в секвенировании геномов и выявлении генетических маркеров, связанных с заболеваниями. Алгоритмы глубокого обучения могут также прогнозировать влияние изменений в ДНК на экспрессию генов, что помогает в разработке новых методов лечения. Модели на основе глубокого обучения могут анализировать огромные объемы генетических данных, чтобы выявлять вариации и мутации, связанные с конкретными заболеваниями. Это позволяет совершенствовать персонализированную медицину, где лечение может быть адаптировано к генетическому профилю конкретного человека.

Модели ИИ на основе глубокого обучения повышают точность прогнозов погоды и анализа изменений климата. Традиционные климатические модели часто ограничены сложностью вычислений и огромным объемом данных, которые они должны обрабатывать. ИИ может более эффективно анализировать эти данные, предоставляя более точные краткосрочные прогнозы погоды и долгосрочные прогнозы климата. Например, модели машинного обучения могут выявлять закономерности в исторических данных о погоде, чтобы прогнозировать будущие события: ураганы, засухи и аномальную жару.

Глубокое обучение помогает в анализе нейровизуализационных данных, таких как МРТ, для понимания работы мозга и выявления аномалий, связанных с различными психическими заболеваниями. В математике — решать задачи оптимизации, например находить наилучшие маршруты для доставки или минимизировать затраты в производстве. В робототехнике глубокое обучение используется, чтобы сделать роботов более адаптивными.

Генеративные модели

Модели, генерирующие новые данные, называются генеративными. Они используются в науке для моделирования физических систем. Такие модели могут более точно, чем традиционные алгоритмы, рассчитать характеристики системы. Кроме того, они требуют меньше вычислительных ресурсов. Это упрощает работу ученых, так как им не нужно разрабатывать отдельные алгоритмы для каждого физического процесса. Генеративные модели ИИ могут моделировать разнообразные явления — от эволюции Вселенной до биологических процессов, что делает их универсальным инструментом для изучения окружающего мира.

В астрономии генерация изображений позволяет создавать реалистичные визуализации космических объектов и явлений — черные дыры, галактики и звездные скопления. Эти изображения могут быть использованы для анализа светимости и предсказания характеристик далеких объектов. Ученые также могут использовать генеративные модели для интерполяции и восстановления недостающих данных в астрономических наборах.

Инструменты на базе ИИ позволяют строить интерактивные визуализации, что дает ученым возможность глубже анализировать сложные наборы данных и принимать решения на их основе. А сгенерированные изображения позволяют увидеть и представить то, о чем исследователи могут только догадываться.

В медицине алгоритмы могут генерировать 3D-визуализации органов пациентов на основе обычных изображений, что помогает врачам более точно оценивать состояние здоровья. А при обучении нейронных сетей используются так называемые синтетические данные — сгенерированные снимки с различными патологиями. Поскольку использование для обучения реальных медицинских снимков может быть проблематичным из-за правовых и этических ограничений, синтетические данные могут обеспечить необходимый объем информации для обучения алгоритмов.

Такое увеличение набора обучающих данных называется аугментацией и является сегодня важным этапом при обучении нейросетей, распознающих изображения. Генерация синтетических изображений позволяет создать разнообразные примеры, которые могут быть повернуты, иметь измененный масштаб, цифровой шум и т.д. Это помогает улучшать точность моделей, обучая их распознавать патологии, несмотря на плохое качество или искажения на снимках.

Стратегическая технология: перспективы и риски генеративного ИИ

Индустрия 4.0

В биологии ИИ помогает в визуализации биомолекул, таких как белки и ДНК. С помощью генеративных адверсариальных сетей (GAN) можно создать 3D-модели молекул, что позволяет исследовать их структуру и взаимодействия. В нейробиологии с помощью нейросетей можно создавать карты активности мозга, что важно для понимания различных неврологических заболеваний.

Также ИИ применяется для визуализации археологических находок и реконструкции древних сооружений. Генеративные модели могут создавать изображения, основываясь на остатках, найденных археологами на раскопках.

В физике частиц ИИ используется для анализа данных, полученных в ходе экспериментов, например в Большом адронном коллайдере. Генеративная модель может создавать визуализации событий, происходящих при столкновениях частиц.

Предиктивная аналитика

Метод использования данных, алгоритмов и машинного обучения для предсказания будущих событий называют предиктивной аналитикой. Этот метод может использоваться в самых различных сценариях: от медицины до экологии и экономики.

Предиктивная аналитика помогает ученым определять наиболее эффективные методы исследования и прогнозировать результаты научных экспериментов еще до их начала. Такой подход позволяет оптимизировать процесс и сосредоточить внимание на наиболее перспективных направлениях, а также находить новые способы решения научных задач. Например, предиктивную аналитику можно использовать для анализа больших объемов научных данных. Она помогает выявлять скрытые взаимосвязи, что может привести к открытию новых явлений и закономерностей.

Данный вид аналитики помогает исследователям управлять научными проектами, прогнозируя возможные риски и оптимизируя ресурсы. Это позволяет более эффективно распределять бюджеты и кадры. Например, предиктивная аналитика может использоваться для прогнозирования сроков выполнения проектов и определения наиболее критичных этапов, что позволяет своевременно принимать меры для предотвращения задержек.

Предикативная аналитика: как предсказать эпидемию и успех в бизнесе

Футурология

В медицине предиктивная аналитика используется для диагностики заболеваний и прогнозирования их течения. С помощью алгоритмов машинного обучения можно анализировать медицинские данные пациентов, истории болезней, результаты анализов и изображения (например, МРТ или рентген) и затем предсказывать риски развития таких заболеваний, как рак или диабет, даже на ранних стадиях.

Предиктивная аналитика используется в астрономии для прогнозирования появления астероидов и комет, которые могут представлять угрозу для Земли. Это позволяет разработать меры по защите от возможных столкновений.

Для прогнозирования природных катастроф — землетрясений, извержений вулканов и других опасных явлений — также используется предиктивная аналитика. В области экологии ИИ применяется для анализа данных о природе и экосистемах, что помогает в принятии решений по охране окружающей среды. Предиктивная аналитика может использоваться и для прогнозирования изменений климата, распространения различных видов организмов и устойчивости экосистем к воздействию человека.

В области социальных наук предиктивная аналитика позволяет исследовать и предсказывать тренды в поведении людей и общества. Например, исследователи могут использовать ИИ для анализа социальных сетей с целью прогнозирования общественного мнения по различным вопросам, а также для оценки вероятности возникновения социальных конфликтов или изменений в политической ситуации. Модели могут анализировать не только количественные данные, такие как число лайков или репостов, но и качественные, например тональность текстовых сообщений, что дает возможность глубже понять социальные настроения и предсказать возможные события.

➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.

Автор

Тимофей Кочкар

Будущее науки Наука Исследования и доклады Искусственный интеллект