ИИ определит безопасность родов прямо во время операции
Думаю, нет смысла лишний раз говорить об опасностях, с которыми женщина и её будущий ребёнок сталкиваются во время беременности и родов. Вы и без меня наверняка слышали хотя бы одну историю, которую хочется поскорее забыть 🥶
Но технологии в медицине развиваются быстро, так что печальных случаев становится всё меньше 👩⚕️ Хочу рассказать об успехах американцев из крупного исследовательского центра — клиники Мейо. Они разработали ИИ-алгоритм, который рассчитывает индивидуальные риски для роженицы и её ребёнка.
👩🏻💻 Модель учитывает где-то 700 параметров, её обучили на 66 с лишним тысячах родов. Причём в этих наборах данных была информация не только о самом процессе рождения, но и обо всех осмотрах/анализах с момента поступления женщин в роддома.
Если алгоритм успешно пройдёт все этапы тестирования, его станут применять в реальном времени, прямо во время “процесса”. То есть врачам и акушерам нужно будет вводить новые данные в программу, а та будет моментально пересчитывать риск неблагоприятного исхода (и заодно давать рекомендации медикам) 🩺
Это поможет легче решать, нужно ли, например, делать кесарево сечение. А ещё такой подход, в теории, должен снизить риск осложнений у мам и новорождённых.
👆 Авторы исследования говорят, что с алгоритмом удобнее будет определять состояние будущей матери во время беременности. Если ИИ заподозрит что-то неладное ещё до родов, у женщины останется больше времени на госпитализацию или на перевод в более подходящую клинику.
📉 Как неочевидный бонус — искусственный интеллект поможет ещё и государству. Он может снизить расходы на здравоохранение (в США на лечение матерей после тяжёлых родов уходит по 30 млрд долларов в год).
Будем надеяться, что ИИ спасёт не одну жизнь. Но когда это будут внедрять — пока неясно. Ведь исследователи ещё даже не опубликовали оценки результатов работы алгоритма.
Думаю, нет смысла лишний раз говорить об опасностях, с которыми женщина и её будущий ребёнок сталкиваются во время беременности и родов. Вы и без меня наверняка слышали хотя бы одну историю, которую хочется поскорее забыть 🥶
Но технологии в медицине развиваются быстро, так что печальных случаев становится всё меньше 👩⚕️ Хочу рассказать об успехах американцев из крупного исследовательского центра — клиники Мейо. Они разработали ИИ-алгоритм, который рассчитывает индивидуальные риски для роженицы и её ребёнка.
👩🏻💻 Модель учитывает где-то 700 параметров, её обучили на 66 с лишним тысячах родов. Причём в этих наборах данных была информация не только о самом процессе рождения, но и обо всех осмотрах/анализах с момента поступления женщин в роддома.
Если алгоритм успешно пройдёт все этапы тестирования, его станут применять в реальном времени, прямо во время “процесса”. То есть врачам и акушерам нужно будет вводить новые данные в программу, а та будет моментально пересчитывать риск неблагоприятного исхода (и заодно давать рекомендации медикам) 🩺
Это поможет легче решать, нужно ли, например, делать кесарево сечение. А ещё такой подход, в теории, должен снизить риск осложнений у мам и новорождённых.
👆 Авторы исследования говорят, что с алгоритмом удобнее будет определять состояние будущей матери во время беременности. Если ИИ заподозрит что-то неладное ещё до родов, у женщины останется больше времени на госпитализацию или на перевод в более подходящую клинику.
📉 Как неочевидный бонус — искусственный интеллект поможет ещё и государству. Он может снизить расходы на здравоохранение (в США на лечение матерей после тяжёлых родов уходит по 30 млрд долларов в год).
Будем надеяться, что ИИ спасёт не одну жизнь. Но когда это будут внедрять — пока неясно. Ведь исследователи ещё даже не опубликовали оценки результатов работы алгоритма.
👍10🔥5
Гуманоид лежит на траве, он корчится и не может встать. Примерно так началось обучение виртуальных человечков игре в футбол ⚽️
На Wired вышла забавная заметка о том, как исследователи из гугловской DeepMind шаг за шагом разрабатывали сильный ИИ (AGI), который сможет пинать мяч не хуже человека-футболиста.
Зачем вообще это нужно? Чтобы роботы будущего и аватары в метавселенных двигались максимально естественно, как реальные люди 🕺🏿 Футбол здесь — не конечная цель, а способ обучения.
Сначала учёные создали модельки с ограниченным диапазоном движений. Гуманоиды не могут выворачивать коленный сустав, чтобы лучше подстроиться под мяч. В общем, анатомия получилась близкой к человеческой.
Чуть ли не самым сложным оказалось научить AGI управлению телом, координацией 🦿 Ведь для этого нужно овладеть и моторикой, и долгосрочным планированием. Если вам кажется, что ничего сложного здесь нет — ̶п̶о̶с̶м̶о̶т̶р̶и̶т̶е̶ ̶н̶а̶ ̶н̶а̶ш̶и̶х̶ ̶ф̶у̶т̶б̶о̶л̶и̶с̶т̶о̶в̶ попробуйте сыграть в браузерную QWOP. Задача элементарная: заставить человечка идти и не падать. Через пару попыток поймёте, в чем загвоздка.
🤖 Для начала в DeepMind поставили перед виртуальными агентами цель: пробежать или ударить по мячу. Но метод обучения с подкреплением не сработал из-за огромного количества вариантов и недостатка предварительных знаний — модельки просто корчились на земле.
Тогда учёные «скормили» ИИ данные, которые получили с помощью захвата движения реальных футболистов. Это ограничило гуманоидов — через какое-то время их движения стали похожи на человеческие.
Дальше «спортсменов» начали учить дриблингу, бегу и удару по мячу. И только после этого их допустили до матчей. Сначала модельки хаотично бегали за мячом, как собаки за фрисби 🐕 Они постоянно спотыкались и почти падали. Голы залетали в ворота случайно, мяч удачно отскакивал от стены.
Но через несколько дней тренировок футболисты научились командной работе. Теперь они не просто тупо бегут к воротам с мячом, но ждут партнёров и даже пасуются (ну, или пытаются). Учёные говорят, что впервые видят такую координацию в настолько сложной модели ИИ.
Видео: https://www.youtube.com/watch?v=KHMwq9pv7mg&t=49s
На Wired вышла забавная заметка о том, как исследователи из гугловской DeepMind шаг за шагом разрабатывали сильный ИИ (AGI), который сможет пинать мяч не хуже человека-футболиста.
Зачем вообще это нужно? Чтобы роботы будущего и аватары в метавселенных двигались максимально естественно, как реальные люди 🕺🏿 Футбол здесь — не конечная цель, а способ обучения.
Сначала учёные создали модельки с ограниченным диапазоном движений. Гуманоиды не могут выворачивать коленный сустав, чтобы лучше подстроиться под мяч. В общем, анатомия получилась близкой к человеческой.
Чуть ли не самым сложным оказалось научить AGI управлению телом, координацией 🦿 Ведь для этого нужно овладеть и моторикой, и долгосрочным планированием. Если вам кажется, что ничего сложного здесь нет — ̶п̶о̶с̶м̶о̶т̶р̶и̶т̶е̶ ̶н̶а̶ ̶н̶а̶ш̶и̶х̶ ̶ф̶у̶т̶б̶о̶л̶и̶с̶т̶о̶в̶ попробуйте сыграть в браузерную QWOP. Задача элементарная: заставить человечка идти и не падать. Через пару попыток поймёте, в чем загвоздка.
🤖 Для начала в DeepMind поставили перед виртуальными агентами цель: пробежать или ударить по мячу. Но метод обучения с подкреплением не сработал из-за огромного количества вариантов и недостатка предварительных знаний — модельки просто корчились на земле.
Тогда учёные «скормили» ИИ данные, которые получили с помощью захвата движения реальных футболистов. Это ограничило гуманоидов — через какое-то время их движения стали похожи на человеческие.
Дальше «спортсменов» начали учить дриблингу, бегу и удару по мячу. И только после этого их допустили до матчей. Сначала модельки хаотично бегали за мячом, как собаки за фрисби 🐕 Они постоянно спотыкались и почти падали. Голы залетали в ворота случайно, мяч удачно отскакивал от стены.
Но через несколько дней тренировок футболисты научились командной работе. Теперь они не просто тупо бегут к воротам с мячом, но ждут партнёров и даже пасуются (ну, или пытаются). Учёные говорят, что впервые видят такую координацию в настолько сложной модели ИИ.
Видео: https://www.youtube.com/watch?v=KHMwq9pv7mg&t=49s
👍14
Лучшие ИИ-стартапы для маркетинга и разработки ПО
Увидела на TechCrunch интересную подборку молодых компаний, которые вышли из американского бизнес-инкубатора Y Combinator. Вполне возможно, что у стартапов большое будущее — этот венчурный фонд в своё время заметил и помог Reddit, Dropbox, AirBnB и Twitch.
Pilot AI
Стартап разрабатывает инструмент для торговых представителей и менеджеров по продажам. Он автоматически преобразует записи телефонных разговоров в структурированные данные и сразу вбивает их в базу (CRM). В общем, менеджерам нужно будет меньше работать руками — всю бюрократическую часть сделает робот.
Похожие платформы уже работают — на рынке есть Fireflies.ai и Viva Sales от Microsoft. Но основатель компании Макс Лу (бывший инженер-программист Salesforce) уверяет, что его продукт проработан тщательнее. Например, алгоритм умеет генерировать сводку по каждому звонку.
TypeWise
Изначально швейцарский стартап разработал виртуальную клавиатуру для пользователей смартфонов. Благодаря ИИ она могла качественно исправлять опечатки и предсказывать следующие слова. Но недавно компания переключилась на B2B-сегмент. Топ-менеджеры посчитали, что их разработку лучше всего оценят в бизнесе, где цена ошибки гораздо выше.
Расширение для браузера совместимо со всеми существующими CRM-системами. По словам разработчиков, инструмент могут использовать любые компании — он быстро обучается. Так, TypeWise умеет заканчивать предложения, проверять стилистику и орфографию, а также автоматически отвечать на письма клиентов.
Hello
Грубо говоря, Hello — это удобный поисковик для программистов. Разработчик пишет какой-нибудь запрос, а программа моментально выдаёт ему максимально релевантный ответ. С пояснениями и соответствующими фрагментами кода из интернета.
Алгоритм основан на больших языковых моделях (скорее всего, GPT-3). Он сверяется с информацией одновременно в разных источниках, чтобы выдать самый вероятный ответ.
Увидела на TechCrunch интересную подборку молодых компаний, которые вышли из американского бизнес-инкубатора Y Combinator. Вполне возможно, что у стартапов большое будущее — этот венчурный фонд в своё время заметил и помог Reddit, Dropbox, AirBnB и Twitch.
Pilot AI
Стартап разрабатывает инструмент для торговых представителей и менеджеров по продажам. Он автоматически преобразует записи телефонных разговоров в структурированные данные и сразу вбивает их в базу (CRM). В общем, менеджерам нужно будет меньше работать руками — всю бюрократическую часть сделает робот.
Похожие платформы уже работают — на рынке есть Fireflies.ai и Viva Sales от Microsoft. Но основатель компании Макс Лу (бывший инженер-программист Salesforce) уверяет, что его продукт проработан тщательнее. Например, алгоритм умеет генерировать сводку по каждому звонку.
TypeWise
Изначально швейцарский стартап разработал виртуальную клавиатуру для пользователей смартфонов. Благодаря ИИ она могла качественно исправлять опечатки и предсказывать следующие слова. Но недавно компания переключилась на B2B-сегмент. Топ-менеджеры посчитали, что их разработку лучше всего оценят в бизнесе, где цена ошибки гораздо выше.
Расширение для браузера совместимо со всеми существующими CRM-системами. По словам разработчиков, инструмент могут использовать любые компании — он быстро обучается. Так, TypeWise умеет заканчивать предложения, проверять стилистику и орфографию, а также автоматически отвечать на письма клиентов.
Hello
Грубо говоря, Hello — это удобный поисковик для программистов. Разработчик пишет какой-нибудь запрос, а программа моментально выдаёт ему максимально релевантный ответ. С пояснениями и соответствующими фрагментами кода из интернета.
Алгоритм основан на больших языковых моделях (скорее всего, GPT-3). Он сверяется с информацией одновременно в разных источниках, чтобы выдать самый вероятный ответ.
TechCrunch
7 AI startups that stood out in YC’s Summer ’22 batch
A number of startups in Y Combinator's 2022 Summer Batch leverage AI in innovative ways. Here's a few that caught our eye.
🔥9🤔5
Искусственный интеллект поможет нам общаться с младенцами?
🤔 Ещё недавно эксперты считали, что машины вряд ли научатся анализировать языки наравне с людьми. Но исследователи из MIT и ещё нескольких американских университетов, кажется, сделали большой шаг в обучении ИИ.
Их новая система умеет сама определять правила в разных языковых моделях. Ей достаточно скормить небольшой набор слов в разных временах, падежах и родах — тогда программа предложит принципы, по которым словоформа в этих случаях меняется.
Учёные привели такой пример. Если в русском языке на конце слова появляется буква «а», значит, алгоритм поймёт, что скорее всего мужской род здесь меняется на женский.
Лингвисты обучили модель на задачах из учебников на 58 различных языках. Уникальность системы в том, что она работает не с одним большим набором данных, а с множеством маленьких, взаимосвязанных. Чтобы определить правила, ей достаточно всего нескольких десятков слов.
👶 А теперь самое интересное (для нас): зачем вообще нужна такая модель? Например, с её помощью исследователи надеются лучше понять, как учатся говорить младенцы.
При этом разработчики не хотят ограничиваться лингвистикой. Они считают, что модель можно будет использовать и в других областях. Например, в физике — модифицированный алгоритм смог бы выводить дифференциальные уравнения из наборов данных о движении объектов в пространстве.
Во время первых тестов алгоритм показал хорошие результаты. Ему дали 70 задач из учебников по лингвистике — в 79% случаев программа правильно меняла словоформу.
Для чистоты эксперимента учёные решили дообучить модель с помощью дополнительных знаний, которые обычный человек мог бы усвоить на курсах лингвистики. После этого процент правильных ответов вырос (правда, не пишут, на сколько конкретно).
🎓 Плюс модели ещё и в том, что она понимает, когда правила для одного языка применимы к другому. Так, знание русского облегчило ей решение задачи на польском — потому что языки похожи.
🤔 Ещё недавно эксперты считали, что машины вряд ли научатся анализировать языки наравне с людьми. Но исследователи из MIT и ещё нескольких американских университетов, кажется, сделали большой шаг в обучении ИИ.
Их новая система умеет сама определять правила в разных языковых моделях. Ей достаточно скормить небольшой набор слов в разных временах, падежах и родах — тогда программа предложит принципы, по которым словоформа в этих случаях меняется.
Учёные привели такой пример. Если в русском языке на конце слова появляется буква «а», значит, алгоритм поймёт, что скорее всего мужской род здесь меняется на женский.
Лингвисты обучили модель на задачах из учебников на 58 различных языках. Уникальность системы в том, что она работает не с одним большим набором данных, а с множеством маленьких, взаимосвязанных. Чтобы определить правила, ей достаточно всего нескольких десятков слов.
👶 А теперь самое интересное (для нас): зачем вообще нужна такая модель? Например, с её помощью исследователи надеются лучше понять, как учатся говорить младенцы.
При этом разработчики не хотят ограничиваться лингвистикой. Они считают, что модель можно будет использовать и в других областях. Например, в физике — модифицированный алгоритм смог бы выводить дифференциальные уравнения из наборов данных о движении объектов в пространстве.
Во время первых тестов алгоритм показал хорошие результаты. Ему дали 70 задач из учебников по лингвистике — в 79% случаев программа правильно меняла словоформу.
Для чистоты эксперимента учёные решили дообучить модель с помощью дополнительных знаний, которые обычный человек мог бы усвоить на курсах лингвистики. После этого процент правильных ответов вырос (правда, не пишут, на сколько конкретно).
🎓 Плюс модели ещё и в том, что она понимает, когда правила для одного языка применимы к другому. Так, знание русского облегчило ей решение задачи на польском — потому что языки похожи.
MIT News
AI that can learn the patterns of human language
Researchers from MIT and elsewhere developed a machine-learning model that can automatically learn the rules and patterns of human languages on its own, and also learn some inductive biases that are applicable across many languages. This work could pave the…
👍8🔥2
ИИ-новинки NVIDIA на GTC
Вчера NVIDIA показала новые видеокарты. Но мне куда интереснее другой анонс — сервисы NeMo LLM и BioNeMo LLM, которые упрощают адаптацию больших языковых моделей и развёртывание приложений на базе ИИ.
Проблема в том, что разработка и обучение LLM обходится дорого. Говорят, на недавнюю PaLM от Google потратили минимум девять миллионов долларов (а возможно, и в два раза больше). Да и времени это занимает немало: обычно несколько недель или даже месяцев.
По словам представителей NVIDIA, с помощью новых инструментов можно будет создавать модели размерами от 3 до 530 млрд параметров. И это займёт часы или даже минуты!
Такая высокая скорость достигается за счёт того, что модели не придётся разрабатывать с нуля — можно будет адаптировать уже существующие базовые (с помощью метода prompt learning). Для этого достаточно «скормить» нейросети всего несколько сотен примеров. Фишка ещё и в том, что одну и ту же модель получится настраивать для нескольких вариантов использования.
На презентации мельком упомянули функцию playground — она позволит «играться», то есть экспериментировать с моделями без использования кода. Видимо, нейросетки можно будет настраивать с помощью текстовых подсказок или других инструментов. В любом случае, настройка станет доступнее.
После развёртывания модель можно будет запускать в облаке, локально или через API.
Платформа BioNeMo LLM предназначена для учёных, занимающихся естественными науками. Инструмент поддерживает форматы данных о белках, ДНК и РНК. Другими словами, он поможет лучше понимать болезни и находить для них лечение. А ещё фреймворк включает две новые языковые модели, которые работают с приложениями в области химии и биологии.
Пока разработчики не назвали точную дату релиза. Но ожидается, что NeMo LLM и BioNeMop LLM откроются в раннем доступе уже в октябре. А сторонние разработчики могут подать заявку уже сейчас.
Вчера NVIDIA показала новые видеокарты. Но мне куда интереснее другой анонс — сервисы NeMo LLM и BioNeMo LLM, которые упрощают адаптацию больших языковых моделей и развёртывание приложений на базе ИИ.
Проблема в том, что разработка и обучение LLM обходится дорого. Говорят, на недавнюю PaLM от Google потратили минимум девять миллионов долларов (а возможно, и в два раза больше). Да и времени это занимает немало: обычно несколько недель или даже месяцев.
По словам представителей NVIDIA, с помощью новых инструментов можно будет создавать модели размерами от 3 до 530 млрд параметров. И это займёт часы или даже минуты!
Такая высокая скорость достигается за счёт того, что модели не придётся разрабатывать с нуля — можно будет адаптировать уже существующие базовые (с помощью метода prompt learning). Для этого достаточно «скормить» нейросети всего несколько сотен примеров. Фишка ещё и в том, что одну и ту же модель получится настраивать для нескольких вариантов использования.
На презентации мельком упомянули функцию playground — она позволит «играться», то есть экспериментировать с моделями без использования кода. Видимо, нейросетки можно будет настраивать с помощью текстовых подсказок или других инструментов. В любом случае, настройка станет доступнее.
После развёртывания модель можно будет запускать в облаке, локально или через API.
Платформа BioNeMo LLM предназначена для учёных, занимающихся естественными науками. Инструмент поддерживает форматы данных о белках, ДНК и РНК. Другими словами, он поможет лучше понимать болезни и находить для них лечение. А ещё фреймворк включает две новые языковые модели, которые работают с приложениями в области химии и биологии.
Пока разработчики не назвали точную дату релиза. Но ожидается, что NeMo LLM и BioNeMop LLM откроются в раннем доступе уже в октябре. А сторонние разработчики могут подать заявку уже сейчас.
NVIDIA Newsroom
NVIDIA Launches Large Language Model Cloud Services to Advance AI and Digital Biology
NVIDIA today announced two new large language model cloud AI services — the NVIDIA NeMo Large Language Model Service and the NVIDIA BioNeMo LLM Service — that enable developers to easily adapt LLMs and deploy customized AI applications for content generation…
👍9🔥2😱1
Кодеры больше не нужны?
С таких слов началась любопытная статья на сайте IEEE Spectrum. Если вдруг не слышали про это издание, то где вы были все эти годы? Один из ведущих научных и инженерных журналов в мире, издаётся аж с 60-х!
Извините, отвлеклась. Авторы материала решили поспрашивать именитых экспертов, сможет ли искусственный интеллект заменить программистов. Спойлер — программисты могут выдохнуть.
Но индустрия паникует не просто так. В 2020 году языковую модель GPT-3 обучили фронтенду — сначала модель рисовала макеты по текстовому описанию, а затем научилась создавать веб-элементы. Позже появились системы, которые могут писать (пусть и пока простые) компьютерные программы — достаточно их об этом попросить.
Вице-президент Amazon, отвечающий за ИИ, Васи Филомин не верит, что искусственный интеллект хоть сколько-нибудь заменит людей-разработчиков. Напротив — новые инструменты освободят программистов от рутины, чтобы у них оставалось больше времени для творчества.
Впрочем, я не ожидала услышать от него ничего другого. Ведь всего пару месяцев назад Филомин презентовал инструмент CodeWhisperer, который умеет писать целые функции на основе комментария или нескольких строчек кода.
Соучредитель Diffblue Питер Шраммель тоже уверен, что автоматическая генерация кода поможет разработчикам сосредоточиться на более важных задачах. Но есть нюанс: даже в этом случае человеку придётся взаимодействовать с ИИ, чтобы проверить, правильно ли машина поняла его инструкции.
Ориол Виньялс, руководитель группы глубокого обучения DeepMind предупреждает: даже если ИИ заменит живых программистов, до этого ещё нужно будет дожить. Возможно, потребуются десятилетия. С ним согласен основатель и СЕО Landing AI Эндрю Нг.
«Мы все еще очень далеки от того, чтобы человек мог сообщить компьютеру о требованиях к произвольной сложной компьютерной программе и автоматически закодировать её», — сказал он.
Чтобы давать компьютеру инструкции на естественном языке, разработчикам по-прежнему нужно понимать некоторые концепции логики и функций. Без опыта в программировании, без основ это невозможно, говорят эксперты.
С таких слов началась любопытная статья на сайте IEEE Spectrum. Если вдруг не слышали про это издание, то где вы были все эти годы? Один из ведущих научных и инженерных журналов в мире, издаётся аж с 60-х!
Извините, отвлеклась. Авторы материала решили поспрашивать именитых экспертов, сможет ли искусственный интеллект заменить программистов. Спойлер — программисты могут выдохнуть.
Но индустрия паникует не просто так. В 2020 году языковую модель GPT-3 обучили фронтенду — сначала модель рисовала макеты по текстовому описанию, а затем научилась создавать веб-элементы. Позже появились системы, которые могут писать (пусть и пока простые) компьютерные программы — достаточно их об этом попросить.
Вице-президент Amazon, отвечающий за ИИ, Васи Филомин не верит, что искусственный интеллект хоть сколько-нибудь заменит людей-разработчиков. Напротив — новые инструменты освободят программистов от рутины, чтобы у них оставалось больше времени для творчества.
Впрочем, я не ожидала услышать от него ничего другого. Ведь всего пару месяцев назад Филомин презентовал инструмент CodeWhisperer, который умеет писать целые функции на основе комментария или нескольких строчек кода.
Соучредитель Diffblue Питер Шраммель тоже уверен, что автоматическая генерация кода поможет разработчикам сосредоточиться на более важных задачах. Но есть нюанс: даже в этом случае человеку придётся взаимодействовать с ИИ, чтобы проверить, правильно ли машина поняла его инструкции.
Ориол Виньялс, руководитель группы глубокого обучения DeepMind предупреждает: даже если ИИ заменит живых программистов, до этого ещё нужно будет дожить. Возможно, потребуются десятилетия. С ним согласен основатель и СЕО Landing AI Эндрю Нг.
«Мы все еще очень далеки от того, чтобы человек мог сообщить компьютеру о требованиях к произвольной сложной компьютерной программе и автоматически закодировать её», — сказал он.
Чтобы давать компьютеру инструкции на естественном языке, разработчикам по-прежнему нужно понимать некоторые концепции логики и функций. Без опыта в программировании, без основ это невозможно, говорят эксперты.
IEEE Spectrum
Coding Made AI—Now, How Will AI Unmake Coding?
Are coders doomed? That question has been bouncing around computer programming communities ever since OpenAI’s large language model, GPT-3, surprised everyone with its ability to create html websites from simple written instructions.
❤4👍4🤔4🔥1
Синтез с преобразователями
Регулярно читаю гугловский блог, у них много интересного про ИИ. Например, пару дней назад разработчики рассказали, как отчасти решили давнюю проблему на границе компьютерного зрения и графики — синтез трёхмерных сцен.
Если в двух словах описать сложность, то нейросети пока не всегда хорошо справляются с тем, чтобы создавать новую сцену из статичных изображений.
Проблема в том, что для точного синтеза модель должна собирать данные разной природы: 3D, информацию об освещённости и тд. И всё это нужно получить иногда всего из нескольких снимков.
И вот недавно исследователи представили модель глубокого обучения, которая может создавать новые сцены по нескольким картинкам. Причём в очень хорошем качестве. Технология называется Light Field Neural Rendering (LFNR).
Входные данные для моделей состоят из набора фотографий, параметров камеры (фокусное расстояние, положение и ориентация в пространстве) и параметры среды.
Вместо полной обработки каждого изображения, модели рассматривают только те области, которые могут повлиять на целевой пиксель. Они определяются с помощью эпиполярной геометрии, которая отображает каждый целевой пиксель в линию на каждом кадре. Для надёжности нейросети берут небольшие участки вокруг точек на эпиполярной линии.
Затем на этот участок воздействует последовательность из двух преобразователей. Первый агрегирует информацию по каждой эпиполярной линии, а второй — по каждому представленному изображению. Так исследователи сопоставляют наборы фрагментов, выделенных вдоль эпиполярных линий, с целевым цветом пикселя.
LFNR показал отличные результаты в самых популярных тестах синтеза изображений. Посмотрите на гифку ниже — это результат работы модели. Отражение на компакт-диске и преломление света через бутылку выглядят очень реалистично.
Регулярно читаю гугловский блог, у них много интересного про ИИ. Например, пару дней назад разработчики рассказали, как отчасти решили давнюю проблему на границе компьютерного зрения и графики — синтез трёхмерных сцен.
Если в двух словах описать сложность, то нейросети пока не всегда хорошо справляются с тем, чтобы создавать новую сцену из статичных изображений.
Проблема в том, что для точного синтеза модель должна собирать данные разной природы: 3D, информацию об освещённости и тд. И всё это нужно получить иногда всего из нескольких снимков.
И вот недавно исследователи представили модель глубокого обучения, которая может создавать новые сцены по нескольким картинкам. Причём в очень хорошем качестве. Технология называется Light Field Neural Rendering (LFNR).
Входные данные для моделей состоят из набора фотографий, параметров камеры (фокусное расстояние, положение и ориентация в пространстве) и параметры среды.
Вместо полной обработки каждого изображения, модели рассматривают только те области, которые могут повлиять на целевой пиксель. Они определяются с помощью эпиполярной геометрии, которая отображает каждый целевой пиксель в линию на каждом кадре. Для надёжности нейросети берут небольшие участки вокруг точек на эпиполярной линии.
Затем на этот участок воздействует последовательность из двух преобразователей. Первый агрегирует информацию по каждой эпиполярной линии, а второй — по каждому представленному изображению. Так исследователи сопоставляют наборы фрагментов, выделенных вдоль эпиполярных линий, с целевым цветом пикселя.
LFNR показал отличные результаты в самых популярных тестах синтеза изображений. Посмотрите на гифку ниже — это результат работы модели. Отражение на компакт-диске и преломление света через бутылку выглядят очень реалистично.
research.google
View Synthesis with Transformers
Posted by Carlos Esteves and Ameesh Makadia, Research Scientists, Google Research A long-standing problem in the intersection of computer vision an...
👍3🔥2
Ухаживаем за курочками с помощью ИИ
Помните, я недавно рассказывала об алгоритме, который рассчитывает риски для будущих матерей и помогает сделать роды более безопасными? Так вот, теперь ИИ приспособили ещё и для ухода за куриным потомством.
Энтузиаст Актар Кутлухан построил IoT-систему на базе искусственного интеллекта, которая автоматически кормит пернатых и следит за невылупившимися яйцами. Как пояснил инженер, на частоту кладки яиц и здоровье будущих птенцов влияет множество факторов, за которыми не всегда получается уследить. Например, если неправильно выстроить график кормления, курицы и вовсе могут перестать нестись. Остановка несения яиц — это ли не проклятье фермера?
Вот что использовал Актар для проекта:
👉 Алгоритм Edge Impulse FOMO (Faster Objects More Objects) для обучения модели обнаружения объектов
👉 Компактная система компьютерного зрения OpenMV Cam H7
👉 Модуль WizFi360-EVB-Pico, чтобы подключить камеру к Wi-Fi
👉 8,9-дюймовый IPS-дисплей DFRobot
👉 1,8-дюймовый TFT-дисплей ST7735
👉 Датчик температуры и влажности DHT22
👉 Пауэрбанк на 20 000 мА*ч
Кстати, весь набор очень бюджетный. Без учета 8,9-дюймового тачскрина за детали придётся отдать где-то 125 долларов (чуть больше 7 тысяч рублей).
Как это всё работает?
Искусственный интеллект подсчитывает число снесённых яиц и следит за тем, чтобы у пернатых всегда была еда. Также система проверяет, чтобы в клетке сохранялись комфортные температура и влажность. Все данные отправляются курозаводчику через WhatsApp.
Очевидно, что вы захотите построить себе такой же аппарат, специально для вас подробная инструкция от Кутлухана.
Помните, я недавно рассказывала об алгоритме, который рассчитывает риски для будущих матерей и помогает сделать роды более безопасными? Так вот, теперь ИИ приспособили ещё и для ухода за куриным потомством.
Энтузиаст Актар Кутлухан построил IoT-систему на базе искусственного интеллекта, которая автоматически кормит пернатых и следит за невылупившимися яйцами. Как пояснил инженер, на частоту кладки яиц и здоровье будущих птенцов влияет множество факторов, за которыми не всегда получается уследить. Например, если неправильно выстроить график кормления, курицы и вовсе могут перестать нестись. Остановка несения яиц — это ли не проклятье фермера?
Вот что использовал Актар для проекта:
👉 Алгоритм Edge Impulse FOMO (Faster Objects More Objects) для обучения модели обнаружения объектов
👉 Компактная система компьютерного зрения OpenMV Cam H7
👉 Модуль WizFi360-EVB-Pico, чтобы подключить камеру к Wi-Fi
👉 8,9-дюймовый IPS-дисплей DFRobot
👉 1,8-дюймовый TFT-дисплей ST7735
👉 Датчик температуры и влажности DHT22
👉 Пауэрбанк на 20 000 мА*ч
Кстати, весь набор очень бюджетный. Без учета 8,9-дюймового тачскрина за детали придётся отдать где-то 125 долларов (чуть больше 7 тысяч рублей).
Как это всё работает?
Искусственный интеллект подсчитывает число снесённых яиц и следит за тем, чтобы у пернатых всегда была еда. Также система проверяет, чтобы в клетке сохранялись комфортные температура и влажность. Все данные отправляются курозаводчику через WhatsApp.
Очевидно, что вы захотите построить себе такой же аппарат, специально для вас подробная инструкция от Кутлухана.
👍8🔥3
Через 2 дня Tesla наконец покажет своего человекоподобного робота
Компания анонсировала AI Day ещё в августе. Но Маск написал, что мероприятие решили перенести на 30 сентября — видимо, раньше они не успевали допилить своего Оптимуса (так будет называться их антропоморфный робот).
Уже реально интересно посмотреть хотя бы на прототип. Пока мы знаем некоторые характеристики модели:
👆 Рост — 1,73 см
⚖ Вес — почти 57 кг
🚀 Максимальная скорость — 8 км/ч (сможете от него убежать, если что)
🏋♀️ Вес, который он сможет поднять — 68 кг
Логичный вопрос: а зачем он вообще нужен? В теории, этот терминатор пригодится на заводах. Он будет таскать тяжелые детали и выполнять другую монотонную (или опасную) работу.
Для ориентации в пространстве у робота будет восемь камер. А управлять Оптимусом будет тот же FSD-компьютер, который используется в автомобилях Tesla.
В общем, любопытно будет посмотреть на результат. Потому что вопросов осталось очень много. Сколько он будет работать без подзарядки (и куда вставлять провод)? Как будет реагировать на обычные «человеческие» команды?
Последние новости об этом роботе были только в прошлом году. Вот, кстати, отрывок той презентации.
Компания анонсировала AI Day ещё в августе. Но Маск написал, что мероприятие решили перенести на 30 сентября — видимо, раньше они не успевали допилить своего Оптимуса (так будет называться их антропоморфный робот).
Уже реально интересно посмотреть хотя бы на прототип. Пока мы знаем некоторые характеристики модели:
👆 Рост — 1,73 см
⚖ Вес — почти 57 кг
🚀 Максимальная скорость — 8 км/ч (сможете от него убежать, если что)
🏋♀️ Вес, который он сможет поднять — 68 кг
Логичный вопрос: а зачем он вообще нужен? В теории, этот терминатор пригодится на заводах. Он будет таскать тяжелые детали и выполнять другую монотонную (или опасную) работу.
Для ориентации в пространстве у робота будет восемь камер. А управлять Оптимусом будет тот же FSD-компьютер, который используется в автомобилях Tesla.
В общем, любопытно будет посмотреть на результат. Потому что вопросов осталось очень много. Сколько он будет работать без подзарядки (и куда вставлять провод)? Как будет реагировать на обычные «человеческие» команды?
Последние новости об этом роботе были только в прошлом году. Вот, кстати, отрывок той презентации.
Twitter
Tesla AI Day pushed to Sept 30, as we may have an Optimus prototype working by then
👍9🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
А это интро из той самой презентации Маска. Да, такой Оптимус я бы и сама купила!
🤩11👏4😁2👍1🔥1
«Инопланетный» интеллект играет в покер лучше профессионалов
Немецкий журналист Фред Швалер написал очень интересный материал о том, почему ИИ решает человеческие проблемы не так, как мы к этому привыкли. Автор объяснил разницу практически на пальцах — всё видно очень наглядно на примере игры в покер.
Пару лет назад бот Pluribus обыграл пятерых лучших гемблеров — они отдали ему 1,7 млн долларов. Тогда игроков спросили, мол, что произошло. Оказалось, бот слишком круто блефовал. «Ни один человек никогда бы не делал такие ставки» — жаловались игроки. Они даже сравнили бота с инопланетянином.
Почему так происходит? Потому что люди и ИИ учатся играть по-разному. Человек приобретает два основных навыка: как принимать лучшие математические решения и как «читать» оппонентов. А Pluribus пошёл другим путём: он натренировал искусство блефа через триллионы игр, методом проб и ошибок. Помог метод обучения с подкреплением.
У людей нет ни времени, ни ресурсов на такие тренировки. Наш мозг теряет много воспоминаний, которые считает лишними, неважными для выживания. А машины всё это накапливают и используют. Архитектура компьютера и мозга отличаются очень сильно — отсюда и разные способы решения проблем.
ИИ кажется «инопланетным» неслучайно. Он не только думает по-другому, но и лишён эмоций. А из-за них люди не могут научиться блефовать так же круто. Бот не боится потерять деньги, поэтому может идти ва-банк с любыми картами.
При этом нестандартное «мышление» искусственного интеллекта помогает учёным делать открытия. Идеальный пример — нейросеть AlphaFold, которая предсказала трёхмерную структуру почти всех существующих белков. А это, на секундочку, один из фундаментальных вопросов биологии (недавно писала про это подробный пост).
Но в «инопланетности» есть и минусы. Человек должен хорошо понимать, как работает ИИ, чтобы контролировать его. А с этим у нас могут возникнуть проблемы.
Немецкий журналист Фред Швалер написал очень интересный материал о том, почему ИИ решает человеческие проблемы не так, как мы к этому привыкли. Автор объяснил разницу практически на пальцах — всё видно очень наглядно на примере игры в покер.
Пару лет назад бот Pluribus обыграл пятерых лучших гемблеров — они отдали ему 1,7 млн долларов. Тогда игроков спросили, мол, что произошло. Оказалось, бот слишком круто блефовал. «Ни один человек никогда бы не делал такие ставки» — жаловались игроки. Они даже сравнили бота с инопланетянином.
Почему так происходит? Потому что люди и ИИ учатся играть по-разному. Человек приобретает два основных навыка: как принимать лучшие математические решения и как «читать» оппонентов. А Pluribus пошёл другим путём: он натренировал искусство блефа через триллионы игр, методом проб и ошибок. Помог метод обучения с подкреплением.
У людей нет ни времени, ни ресурсов на такие тренировки. Наш мозг теряет много воспоминаний, которые считает лишними, неважными для выживания. А машины всё это накапливают и используют. Архитектура компьютера и мозга отличаются очень сильно — отсюда и разные способы решения проблем.
ИИ кажется «инопланетным» неслучайно. Он не только думает по-другому, но и лишён эмоций. А из-за них люди не могут научиться блефовать так же круто. Бот не боится потерять деньги, поэтому может идти ва-банк с любыми картами.
При этом нестандартное «мышление» искусственного интеллекта помогает учёным делать открытия. Идеальный пример — нейросеть AlphaFold, которая предсказала трёхмерную структуру почти всех существующих белков. А это, на секундочку, один из фундаментальных вопросов биологии (недавно писала про это подробный пост).
Но в «инопланетности» есть и минусы. Человек должен хорошо понимать, как работает ИИ, чтобы контролировать его. А с этим у нас могут возникнуть проблемы.
Science
Superhuman AI for multiplayer poker
An AI dubbed Pluribus performs significantly better than human professionals in six-player no-limit Texas hold’em poker.
🔥10👍3
Недельный дAIджест души питона
Решила по пятницам делать небольшую подборку самых интересных (для меня) новостей. Поехали.
Text-to-video
Генерацией картинок уже никого не удивишь, поэтому сразу несколько компаний (сами знаете каких) показали достижения в новых областях. Один из алгоритмов делает короткие видео по текстовым описаниям. Пока результаты с низким разрешением, а доступ есть только у разработчиков. Но все равно кадры впечатляют.
Второй алгоритм создает 3D-модельки, метод называется DreamFusion, он использует 2D-диффузию. В качестве входных данных опять же текстовые подсказки.
BigCode
Стартап Hugging Face и ServiceNow Research запустили проект, который решает часть этических и правовых проблем при создании больших языковых моделей. Например, недавно разработчиков платного сервиса Copilot обвинили в том, что алгоритм обучался, в том числе, на материале, авторы которого не давали своего согласия.
BigCode должен выпустить большой набор данных для обучения систем генерации кода. Он понадобится для создания прототипа — модели с 15 млрд параметров (это больше чем у Codex с 12 млн, но почти в три раза меньше AlphaCode). Алгоритм будет открыт для исследователей.
Tesla AI
Так сказать, новость будущего во всех смыслах. Мероприятие Маска начнется 30 сентября в 17:00 по Тихоокеанскому времени, то есть в 3:00 субботы по Москве. Помимо долгожданного робота Оптимуса, там могут показать усовершенствованный автопилот и много другого. Если планируете на выходных тотальный «диджитал-детокс», то заходите в канал в понедельник, я расскажу с утра о главном.
Whisper
Open AI выпустила нейросеть для распознавания речи с 1,5 млрд параметров и открытым исходным кодом. Её натренировали на 680 тысячах часов аудиоданных с расшифровками на 98 языках.
С моделькой уже можно поиграться: код разработчики сразу выложили на GitHub. Из плюсов — она автоматически распознаёт несколько языков, в том числе русский.
Решила по пятницам делать небольшую подборку самых интересных (для меня) новостей. Поехали.
Text-to-video
Генерацией картинок уже никого не удивишь, поэтому сразу несколько компаний (сами знаете каких) показали достижения в новых областях. Один из алгоритмов делает короткие видео по текстовым описаниям. Пока результаты с низким разрешением, а доступ есть только у разработчиков. Но все равно кадры впечатляют.
Второй алгоритм создает 3D-модельки, метод называется DreamFusion, он использует 2D-диффузию. В качестве входных данных опять же текстовые подсказки.
BigCode
Стартап Hugging Face и ServiceNow Research запустили проект, который решает часть этических и правовых проблем при создании больших языковых моделей. Например, недавно разработчиков платного сервиса Copilot обвинили в том, что алгоритм обучался, в том числе, на материале, авторы которого не давали своего согласия.
BigCode должен выпустить большой набор данных для обучения систем генерации кода. Он понадобится для создания прототипа — модели с 15 млрд параметров (это больше чем у Codex с 12 млн, но почти в три раза меньше AlphaCode). Алгоритм будет открыт для исследователей.
Tesla AI
Так сказать, новость будущего во всех смыслах. Мероприятие Маска начнется 30 сентября в 17:00 по Тихоокеанскому времени, то есть в 3:00 субботы по Москве. Помимо долгожданного робота Оптимуса, там могут показать усовершенствованный автопилот и много другого. Если планируете на выходных тотальный «диджитал-детокс», то заходите в канал в понедельник, я расскажу с утра о главном.
Whisper
Open AI выпустила нейросеть для распознавания речи с 1,5 млрд параметров и открытым исходным кодом. Её натренировали на 680 тысячах часов аудиоданных с расшифровками на 98 языках.
С моделькой уже можно поиграться: код разработчики сразу выложили на GitHub. Из плюсов — она автоматически распознаёт несколько языков, в том числе русский.
DreamFusion: Text-to-3D using 2D Diffusion
We combine neural rendering with a multi-modal text-to-2D image diffusion generative model to synthesize diverse 3D objects from text.
👍9🔥5
Думаете, в России не происходит ничего интересного в сфере исследований ИИ? Как бы не так!
Например, я с огромным интересом за выходные прочитала от корки до корки свежий выпуск Альманаха «Искусственный интеллект». Он уже 11-й по счёту! И посвящен очень актуальной и проблемной теме использования ИИ в медицине и здравоохранении.
⚛️ Выпускает Альманах команда Центра искусственного интеллекта МФТИ под руководством Игоря Пивоварова. Ребята занимаются созданием единственного регулярного аналитического издания по проблемам ИИ в России с 2019 года. Новый номер получился самым объёмным за всю историю — 40 статей почти на 200 страницах. Куча полезной и занимательной инфографики.
🧬 Авторский коллектив решил подойти к созданию и сбору материалов системно. Несколько разделов посвящены революции, которую произвели омикс-данные в биологии, и как алгоритмы помогают биоинформатикам, фармакологам и молеклярным биологам изучать процессы внутри живых клеток, искать и создавать новые лекарства от рака и других тяжёлых заболеваний, развивать прецизионную — почти индивидуальную для каждого пациента медицину.
🩻 Конечно же много материалов и о применении компьютерного зрения и классификаторов в диагностике — одна из самых быстрорастущих областей в медицинском ИИ. Другие разделы понравятся поклонникам биохакинга, движения «количественное измерение себя» (Quantified Self), лайфлоггинга и т.д. Речь, естественно, о носимых устройствах и перманентном снятии и анализе множества физиологических данных в повседневной жизни.
🩺 Интересно, что я ещё в июне писала о внедренной в Якутии системе поддержки принятия врачебных решений Webiomed, разработанной отечественным стартапом «К-Скай». Всего за три месяца система проанализировала 2,8 миллиона документов и уже помогает выявлять пациентов с высоким риском развития более 40 различных заболеваний. А в Альманахе можно прочитать несколько статей от специалистов из этой компании об использовании ИИ в инфраструктуре здравоохранения и о предиктивной аналитике.
💊 Не обошлось и без систем анализа микробиома, разработке новых фармпрепаратов in silico, использовании чатботов в психологическом консультировании и т.д. Но самое главное — в Альманахе поднята центральная тема — почему при столь грандиозных успехах в научных лабораториях, стартапах и наличии готовых технологий, они так медленно внедряются в практическую врачебную деятельность. Почему на обложках журналов у нас уже давно XXI век, а в здравоохранении конец 1980-х.
Например, я с огромным интересом за выходные прочитала от корки до корки свежий выпуск Альманаха «Искусственный интеллект». Он уже 11-й по счёту! И посвящен очень актуальной и проблемной теме использования ИИ в медицине и здравоохранении.
⚛️ Выпускает Альманах команда Центра искусственного интеллекта МФТИ под руководством Игоря Пивоварова. Ребята занимаются созданием единственного регулярного аналитического издания по проблемам ИИ в России с 2019 года. Новый номер получился самым объёмным за всю историю — 40 статей почти на 200 страницах. Куча полезной и занимательной инфографики.
🧬 Авторский коллектив решил подойти к созданию и сбору материалов системно. Несколько разделов посвящены революции, которую произвели омикс-данные в биологии, и как алгоритмы помогают биоинформатикам, фармакологам и молеклярным биологам изучать процессы внутри живых клеток, искать и создавать новые лекарства от рака и других тяжёлых заболеваний, развивать прецизионную — почти индивидуальную для каждого пациента медицину.
🩻 Конечно же много материалов и о применении компьютерного зрения и классификаторов в диагностике — одна из самых быстрорастущих областей в медицинском ИИ. Другие разделы понравятся поклонникам биохакинга, движения «количественное измерение себя» (Quantified Self), лайфлоггинга и т.д. Речь, естественно, о носимых устройствах и перманентном снятии и анализе множества физиологических данных в повседневной жизни.
🩺 Интересно, что я ещё в июне писала о внедренной в Якутии системе поддержки принятия врачебных решений Webiomed, разработанной отечественным стартапом «К-Скай». Всего за три месяца система проанализировала 2,8 миллиона документов и уже помогает выявлять пациентов с высоким риском развития более 40 различных заболеваний. А в Альманахе можно прочитать несколько статей от специалистов из этой компании об использовании ИИ в инфраструктуре здравоохранения и о предиктивной аналитике.
💊 Не обошлось и без систем анализа микробиома, разработке новых фармпрепаратов in silico, использовании чатботов в психологическом консультировании и т.д. Но самое главное — в Альманахе поднята центральная тема — почему при столь грандиозных успехах в научных лабораториях, стартапах и наличии готовых технологий, они так медленно внедряются в практическую врачебную деятельность. Почему на обложках журналов у нас уже давно XXI век, а в здравоохранении конец 1980-х.
aireport.ru
AI Report - ИИ в здравоохранении
Альманах Искусственный Интеллект №11. ИИ в здравоохранении
🔥13👍10❤🔥1
Шок-контент: учёные приблизились к решению одной из главных задач квантовой физики с помощью нейросети
Я прочитала несколько дней назад новость, что ИИ помог исследователям рассчитать движение электронов по квадратной решётке. Причем сетка сделала это с помощью всего четырёх уравнений. Я не физик, поэтому решила разобрать новость с одним из научных сотрудников физфака МГУ, имя не назову. Дальше будет длиннопост, потерпите.
Так вот, раньше для этой задачи требовались сотни тысяч уравнений — по одной на каждый пиксель визуализации! Разложим теперь всё по полочкам.
🤝 Взаимодействие движущихся по решётке электронов — это чуть ли не основная проблема для физиков. Это связано с тем, что даже находящиеся далеко друг от друга (в разных узлах решётки) элементарные частицы могут взаимодействовать. Поэтому их нельзя рассматривать по отдельности — нужно смотреть на всю картину целиком. А в зависимости от количества участвующих электронов, эта картина может невероятно усложняться.
🎓 Один из способов изучения квантовой системы — метод ренормализационной группы. Физики используют этот математический аппарат, чтобы посмотреть, как электроны ведут себя при разных условиях (например, если изменить температуру). Но этот метод может содержать сотни тысяч отдельных уравнений для отслеживания всех возможных связей между этими частицами.
🤖 Для упрощения задачи учёные разработали нейросеть. Сначала она воспроизводит соединения в полноразмерной ренормализационной группе. Затем алгоритм ищет небольшой набор уравнений, которые генерируют то же самое решение, что и «оригинальная» группа с сотнями тысяч. В некоторых случаях хватало всего четырёх уравнений, причём вообще без ущерба для точности.
Обучение нейронки заняло несколько недель. Зато теперь её можно адаптировать для работы над другими проблемами конденсированных сред. Возможно, такой подход к решению огромного числа уравнений поможет при решении аналогичных задач, например, в космологии, нейробиологии и т.д.
⚛️ Но главный плюс метода — потенциальная возможность в дальнейшей разработке сверхпроводников. Сейчас сверхпроводящее состояние материалов достигается либо при сверхнизких температурах (ниже температуры кипения жидкого азота -196 С), либо под гигантским давлением порядка 1 млн атмосфер. А ученые давно ведут работы над получением материалов с такими свойствами при комнатной температуре и менее экстремальном давлении — потери мощности на проводах из таких материалов ничтожны!
В общем, технологии ИИ продолжают доказывать, что в правильно заточенных руках они становятся уникальным инструментом даже в фундаментальной науке.
Я прочитала несколько дней назад новость, что ИИ помог исследователям рассчитать движение электронов по квадратной решётке. Причем сетка сделала это с помощью всего четырёх уравнений. Я не физик, поэтому решила разобрать новость с одним из научных сотрудников физфака МГУ, имя не назову. Дальше будет длиннопост, потерпите.
Так вот, раньше для этой задачи требовались сотни тысяч уравнений — по одной на каждый пиксель визуализации! Разложим теперь всё по полочкам.
🤝 Взаимодействие движущихся по решётке электронов — это чуть ли не основная проблема для физиков. Это связано с тем, что даже находящиеся далеко друг от друга (в разных узлах решётки) элементарные частицы могут взаимодействовать. Поэтому их нельзя рассматривать по отдельности — нужно смотреть на всю картину целиком. А в зависимости от количества участвующих электронов, эта картина может невероятно усложняться.
🎓 Один из способов изучения квантовой системы — метод ренормализационной группы. Физики используют этот математический аппарат, чтобы посмотреть, как электроны ведут себя при разных условиях (например, если изменить температуру). Но этот метод может содержать сотни тысяч отдельных уравнений для отслеживания всех возможных связей между этими частицами.
🤖 Для упрощения задачи учёные разработали нейросеть. Сначала она воспроизводит соединения в полноразмерной ренормализационной группе. Затем алгоритм ищет небольшой набор уравнений, которые генерируют то же самое решение, что и «оригинальная» группа с сотнями тысяч. В некоторых случаях хватало всего четырёх уравнений, причём вообще без ущерба для точности.
Обучение нейронки заняло несколько недель. Зато теперь её можно адаптировать для работы над другими проблемами конденсированных сред. Возможно, такой подход к решению огромного числа уравнений поможет при решении аналогичных задач, например, в космологии, нейробиологии и т.д.
⚛️ Но главный плюс метода — потенциальная возможность в дальнейшей разработке сверхпроводников. Сейчас сверхпроводящее состояние материалов достигается либо при сверхнизких температурах (ниже температуры кипения жидкого азота -196 С), либо под гигантским давлением порядка 1 млн атмосфер. А ученые давно ведут работы над получением материалов с такими свойствами при комнатной температуре и менее экстремальном давлении — потери мощности на проводах из таких материалов ничтожны!
В общем, технологии ИИ продолжают доказывать, что в правильно заточенных руках они становятся уникальным инструментом даже в фундаментальной науке.
phys.org
Artificial intelligence reduces a 100,000-equation quantum physics problem to only four equations
Using artificial intelligence, physicists have compressed a daunting quantum problem that until now required 100,000 equations into a bite-size task of as few as four equations—all without sacrificing ...
👍23🔥7🤔2👏1🤩1
Какой из проектов больше всего впечатлил?
Anonymous Poll
39%
Видео от экс-сотрудника Google
9%
Анимированный коала
11%
Текстуры из текстовых подсказок
23%
Ремастер Fallout 2
31%
Просто покажите мне результаты!
👍10