NEW BOT Телеграм, страница

Этихлид

Разбор статьи про внедрение ИИ в R&D лабе (1/3)

Попалось интересное исследование о последствиях внедрения ИИ в научную/изобретательскую деятельность:
Toner-Rodgers, Aidan. 2024. "Artificial Intelligence, Scientific Discovery, and Product Innovation." MIT, December 25, 2024.

Интересно оно тем, что в нём рассматривается то, как ИИ вписывается в по-настоящему интеллектуальную сферу, а так же тем, что показывает как изменение эффективности исследований, так и влияние внедрения ИИ на людей.

Эти результаты можно отчасти экстраполировать и на другие похожие области, ту же разработку софта - об этом в третьем посте.

Сеттинг эксперимента

Эксперимент проводился в R&D лаборатории неназванной крупной американской компании, специализирующейся на создании и применении материалов в здравоохранении, оптике и промышленном производстве.

В исследовании участвовали 1018 ученых со степенями в области химии, физики и инженерии.

ИИ-инструмент представляет собой набор графовых нейронных сетей (GNNs), обученных на структуре и свойствах существующих материалов, и используется для "обратного проектирования", генерируя новые соединения на основе заданных характеристик.

Влияние ИИ на эффективность R&D

* ученые, использующие ИИ, открывали на 44% больше новых материалов;
* в результате количество патентных заявок возросло на 39%;
* через несколько месяцев после внедрения ИИ наблюдалось увеличение на 17% числа прототипов продуктов с новыми материалами;
* с учетом затрат на внедрение ИИ, эффективность R&D увеличилась на 13-15%.

Влияние на новизну

* материалы, предложенные ИИ, имеют более уникальные химические структуры;
* ИИ способствовал созданию новых продуктовых линеек, а не просто улучшению существующих;
* показано отсутствие "эффекта уличного фонаря" - опасения, что ИИ будет направлять поиск в уже изученные, но малоперспективные области, не подтверждаются.

Неравномерность влияния на производительность

ИИ оказывает неравномерное влияние на работу ученых, при этом наиболее продуктивные исследователи получают гораздо больше пользы от использования ИИ:
* ученые в нижней трети распределения производительности увидели минимальные улучшения;
* разрыв в производительности между 90-м и 10-м перцентилями - более чем в 2 раза.

Автор выделяет два ключевых навыка, которые влияют на продуктивность ученых: генерация идей новых материалов и оценка их перспективности.

Оказывается, что именно различия в способности оценивать предложения ИИ объясняют почти всю неоднородность во влиянии ИИ на ученых.
ИИ увеличивает общее количество перспективных кандидатов, но делает их оценку более сложной.
А ученые с высокими навыками оценки лучше определяют перспективные материалы, предложенные ИИ, и избегают false positives, что позволяет им тестировать меньше материалов, но с более высокой вероятностью успеха.

Опрос ученых показывает, что их способность оценивать предложения ИИ во многом зависит от их экспертных знаний в области материалов.
Это является демонстрацией того, что ИИ не является "уравнивающим" инструментом - напротив, он усиливает различия между учеными, и это подчеркивает важность экспертизы в эпоху ИИ.

Последствия в работе

Показано перераспределение рабочего времени на разные задачи после внедрения ИИ-инструмента:
* ИИ автоматизировал большую часть задач по генерации идей, сократив время, затрачиваемое учеными на эти задачи, с 39% до менее 16%;
* время, затрачиваемое на оценку предложений ИИ, увеличилось на 74% (с 23% до 40% от общего времени исследований);
* время, посвященное экспериментам (синтез и тестирование материалов), выросло с 37% до 44%.

В ответ на изменения в процессе исследований лаборатория начала адаптировать свои кадровые практики.
В последний месяц исследования 3% ученых были уволены, причем 83% из них находились в нижнем квартиле по навыкам оценки.
Однако одновременно с этим было нанято больше новых сотрудников, чем было уволено. Автор предполагает, что эти новые сотрудники с большой долей вероятности обладают именно высокими навыками оценки материалов.

#ai #science #article

👍6🔥4❤2

345 views04:46

Этихлид

Разбор статьи про внедрение ИИ в R&D лабе (2/3)

Влияние на удовлетворенность работой

Ученые сообщают о значительном снижении удовлетворенности своей работой после внедрения ИИ, причем этот эффект наблюдается практически у всех, включая тех, кто получил наибольшие преимущества от ИИ.

Основные причины снижения удовлетворенности:
* 73% отмечают, что их навыки используются не в полной мере;
* 53% считают, что их работа стала менее творческой и более рутинной;
* 21% выражают обеспокоенность тем, что ИИ затрудняет определение их личного вклада в открытия;
* 19% отмечают, что ИИ-инструмент сложен в использовании.

Несмотря на удовольствие от повышения продуктивности, 82% ученых сообщают об общем снижении удовлетворенности. Это показывает то, что положительные эффекты от увеличения продуктивности не компенсируют негативное влияние изменений в рабочих задачах и снижение творческой составляющей работы.

Ученые в нижнем квартиле по продуктивности испытывают наибольшее снижение удовлетворенности, даже если их продуктивность немного увеличилась. Это связано с тем, что продвижение по карьерной лестнице в лаборатории зависит от относительной, а не абсолютной продуктивности.

Также ученые сообщают о небольшом снижении удовлетворенности своим выбором профессии.
Это связано с тем, что работа с ИИ изменила их ожидания от научной деятельности, сделав ее менее творческой и более ориентированной на оценку предложений ИИ.
Инструмент, с которым они работали, автоматизирует именно те задачи, которые ученые находят наиболее увлекательными - создание идей для новых материалов.

Изменение взглядов на ИИ

Ученые не ожидали тех эффектов, которые были задокументированы в исследовании. Это в целом соответствует тенденции, когда эксперты в своей области недооценивают возможности ИИ.

После работы с ИИ ученые начинают более позитивно оценивать его потенциал для повышения продуктивности. Уровень согласия с утверждением "ИИ сделает ученых в моей области более продуктивными" почти удвоился.

Однако опасения по поводу потери рабочих мест остались на прежнем уровне, т.е. и не увеличились, и не уменьшились. Это связано с тем, что ученые понимают, что ИИ не заменяет их полностью, но меняет характер их работы.

Ученые также верят, что ИИ изменит навыки, необходимые для успеха в их области. В результате 71% ученых планируют переобучение, чтобы лучше взаимодействовать с ИИ.

Заключение

Долгосрочное влияние ИИ будет зависеть от того, насколько связанные с ним технологии смогут трансформировать науку и инновации. Результаты этого исследования показывают, что ИИ значительно ускоряет открытие новых материалов, что приводит к увеличению числа патентных заявок и росту инноваций в продуктах. Однако технология эффективна только в сочетании с достаточно квалифицированными учеными.

Исследуя механизмы, лежащие в основе этих результатов, автор показывает, что ИИ автоматизирует большую часть задач, связанных с генерацией идей, перераспределяя усилия ученых на оценку материалов, предложенных моделью. Топовые ученые лучше определяют перспективные предложения ИИ, в то время как другие тратят значительные ресурсы на тестирование false positives, что показывает, что ИИ меняет навыки, необходимые для научных открытий.
Несмотря на рост продуктивности, ученые сообщают о снижении удовлетворенности своей работой.

Эти результаты вносят вклад в более широкую дискуссию о роли человеческой экспертизы и творчества в мире ИИ.
Одна точка зрения, часто связанная с сообществом ИИ-исследователей, предполагает, что большие данные и глубокое обучение сделают экспертные знания устаревшими, поскольку модели автоматизируют большинство форм когнитивного труда.
Другие, напротив, скептически относятся к способности ИИ выполнять экономически значимые задачи, особенно в таких областях, как научные открытия, где требуются творческие прорывы.
Данная статья предлагает промежуточную точку зрения. В материаловедении ИИ может значительно ускорить изобретательство, но модель должна быть дополнена экспертами, которые могут оценивать и улучшать ее предсказания.

#ai #science #article

👍4🔥4❤2

354 views04:47

Этихлид

Разбор статьи про внедрение ИИ в R&D лабе (3/3)

Личные выводы

Я вижу в этой статье много аналогий тому, что уже происходит или будет происходить в сфере разработки ПО, и этот пост об этих аналогиях.

Общее повышение продуктивности

Если вкратце - при правильном подходе писать код с ИИ и делать проекты можно в несколько раз быстрее.
Для развёрнутого примера сошлюсь на себя же.

Отсутствие "эффекта уличного фонаря": опасения, что ИИ будет направлять поиск в уже изученные, но малоперспективные области, не подтверждаются

Тут и да, и нет - с одной стороны, на типовой вопрос вам ИИ даст типовой ответ, а с другой стороны - нам вместо лишнего креатива в коде нужны надёжные проверенные решения :)
Если же запрос у нас не совсем типовой - стоит его обсуждать с моделями-ризонерами (DeepSeek R1, ChatGPT o1).
У топовых моделей также шире те знания, которые могут быть ими перенесены между языками/платформами, что позволяет выуживать из них нестандартные решения.
Рассчитывать на креатив, впрочем, не приходится, но синтез довольно интересным бывает.

ИИ не является "уравнивающим" инструментом - напротив, он усиливает различия между учеными, и это подчеркивает важность экспертизы в эпоху ИИ

Именно условные сеньоры/техлиды больше всего получают выгоды от работы с ИИ, и именно их продуктивность может вырасти в 10x+ раз за счёт того, что они могут верно выбрать направление и оценить решения, которые принимает ИИ.
Плюс, грядёт новая эра интеллектуального неравенства, и для тех кто хочет развиваться, есть куча возможностей.

Перераспределение рабочего времени на разные задачи после внедрения ИИ

Да, мне нравится давать ссылки на самого себя: при работе с ИИ пропадает часть задач и освобождается время на другие, которые уже могут быть и не связаны с программированием (что не всегда плохо, как по мне).

Значительное снижение удовлетворенности своей работой после внедрения ИИ.
Инструмент, с которым работали ученые, автоматизирует именно те задачи, которые они находят наиболее увлекательными - создание идей для новых материалов

Легко могу себе представить фрустрацию разработчиков, которые любят именно писать код, но я не смогу их утешить, увы, - индустрия радикально изменится, и мне бы очень не хотелось, чтобы талантливые ребята, способные развиваться, оказались в позиции разработчиков-староверов.

Ученые не ожидали тех эффектов, которые были задокументированы в исследовании. Это в целом соответствует тенденции, когда эксперты в своей области недооценивают возможности ИИ.
После работы с ИИ ученые начинают более позитивно оценивать его потенциал для повышения продуктивности.
Ученые понимают, что ИИ не заменяет их полностью, но меняет характер их работы

Наблюдал такое уже не раз - человек отнекивается и не верит, пока не покажешь ему эффективный подход для работы с ИИ, после чего - эйфория (я столько всего сделаю!) вперемешку с отчаянием (я больше не нужен!), потом понимание ограничений, отрезвление и осознанное включение нового инструментария в работу по месту, а не как придётся.
И да, аугментация, усиление себя при помощи ИИ, делегируя ему посильные задачи - это то, к чему нужно стремиться для повышения своей ценности на меняющемся рынке труда.

Было нанято больше новых сотрудников, чем было уволено

Есть подозрение, что спрос на разработчиков-автоматизаторов нового поколения только возрастёт.

71% ученых планируют переобучение, чтобы лучше взаимодействовать с ИИ

Новые технологии всегда требуют времени на их изучение, и смена привычек и устоявшихся подходов тоже не происходит мгновенно.

В случае с ИИ разработчикам нужно ещё и менять mindset: переходить на более высокий уровень абстракции, учиться ставить и делегировать задачи, проверять их исполнение, брать задачи из смежных областей - словом, становиться кем-то между архитектором и project-менеджером, со способностью иногда покодить.

И чем раньше начать, тем проще будет в дальнейшем.

—
📚 Моя серия постов для разработчиков по старту работы с AI в начале 2025 всё ещё актуальна и я буду рад, если эти знания кому-то помогут.

Фидбек тоже приветствуется :)
—

#ai #article #work #development

👍9🔥5❤2

385 viewsedited 04:47

Этихлид

Хабр

Искусственный интеллект, научные открытия и инновации в продуктах

Попалось интересное исследование о последствиях внедрения ИИ в работу R&D лаборатории: Toner-Rodgers, Aidan. 2024. "Artificial Intelligence, Scientific Discovery, and Product Innovation." MIT,...

Решил попробовать длинный формат кросспостить на Хабр:

https://habr.com/ru/articles/876788/
(это 3 предыдущих поста в виде цельной статьи)

Telegram, конечно, для таких больших текстов не очень подходит:
* слабые возможности форматирования - к примеру, нельзя вставить картинку куда-то в середину текста;
* ограничение на длину поста, из-за чего приходится его разбивать на несколько;
* узкая полоска текста для чтения, ну и т.п.

С нулевым аккаунтом ждал 3 дня пока статья пройдёт песочницу и модерацию.

И вот теперь я прям полноценный хабравчанин, можно начинать переживать за карму :)

👍9🔥7🎉2👏1

314 viewsedited 05:33

Этихлид

DeepSeek Moment (1/2)

Пока даже бабульки у подъезда ещё не начали обсуждать DeepSeek и драму вокруг него, вспомним про схожий момент в истории и подумаем о перспективах.

Вот как этот момент описывает Стивен Кинг в своих воспоминаниях:

Впервые в жизни я испытал ужас - настоящий, неподдельный ужас, а не встречу с демонами или призраками из воображения - в октябрьский день 1957 года. Мне только исполнилось 10 лет, и я смотрел "Земля против летающих тарелок" - ужастик, замаскированный под научную фантастику, - на одном из тех субботних детских дневных сеансов в старом кинотеатре в Стратфорде, Коннектикут.

Ближе к концу, как раз когда началась самая захватывающая часть - с горящим Вашингтоном и финальной катастрофической битвой в космосе, - экран внезапно погас.

Дети начали хлопать и свистеть, думая, что киномеханик допустил ошибку или пленка порвалась. Но вдруг в зале включили полный свет, что всех сильно удивило, ведь ничего подобного раньше в середине фильма не происходило. Затем по центральному проходу вышел управляющий кинотеатра, выглядел он бледным. Поднявшись на сцену, он дрожащим голосом сказал: "Я хочу сообщить вам, что русские запустили спутник на орбиту Земли. Они называют его Спутник".

Последовала долгая, напряженная пауза. Эта толпа детей 50-х годов, в подвернутых джинсах, с короткими стрижками, хвостиками, пыталась переварить услышанное. И вдруг чей-то голос, почти плачущий, но полный ярости, прорезал ошеломленную тишину: "Да включите фильм, врун!"

Через несколько минут фильм снова запустили, но я так и остался сидеть замороженным на своем месте, потому что понял, что управляющий не лжет.

Менеджер даже не посмотрел в ту сторону, откуда раздался голос, и почему-то это было самое ужасное. Это было доказательством. Русские опередили нас в космосе. Где-то над нашими головами триумфально летел электронный шар, созданный и запущенный за железным занавесом.

Он летел там... и его называли Спутник.

Это событие получило название Sputnik moment.

Нечто похожее происходит сейчас с резким ростом популярности китайских AI-разработок, самой известной из которых стала DeepSeek.
Всё преподносится так, что западные компании оказались застигнуты врасплох, общество в недоумении и не может поверить в случившееся.

На фоне всего этого:
* DeepSeek стал первым по скачиваниям из бесплатных приложений в App Store в Штатах;
* по его поводу высказались все топы AI компаний, блоггеры и прочие инфлюенсеры, зачастую многократно переварив, переврав всё, что можно, докинув эмоций и слухов;
* Трамп упомянул его в своей речи - отличная реклама, как по мне;
* истерика вокруг этих новостей стоила западным финансовым рынкам потери $2T в моменте;
* сами сервера DeepSeek завалили запросами и атаками, в результате чего он теперь подтормаживает вторые сутки.

#ai #news

🔥5👍4

325 viewsedited 20:05

Этихлид

DeepSeek Moment (2/2)

А что было после Sputnik moment?

Гонка вооружений и космическая гонка: усиление глобальной конкуренции за технологическое превосходство. Многие страны начали активно вкладываться в науку, исследования и разработку космических технологий.

Развитие науки и образования: в ответ на успех СССР страны стали уделять больше внимания STEM-дисциплинам (наука, технологии, инженерия, математика). Например, США создали NASA и увеличили финансирование образования.

Биполярный мир: успех спутника показал миру технологические достижения СССР, повысив его статус на международной арене, особенно среди стран третьего мира, которые искали альтернативу влиянию США.

Интернационализация космоса: запуск спутника стал отправной точкой для глобального интереса к космосу, что в итоге привело к международному сотрудничеству, например, к созданию Международной космической станции.

Ускорение технологической революции: запуск стимулировал развитие технологий, которые впоследствии нашли применение в других отраслях – от телекоммуникаций до навигации.

Уже есть прямые аналогии с тем, что происходит и будет происходить в AI-гонке:
* в США выделяют $500B на проект StarGate для работы над ИИ следующего поколения, а Китай объявил об инвестициях в развитие ИИ в размере $150B;
* мир ИИ перестал был униполярным. К слову, DeepSeek, несмотря на то, что стал самым популярным, далеко не единственный из игроков на китайском рынке, да и кроме LLM там есть и другие довольно интересные ИИ-продукты;
* неизбежно усиление конкуренция за лучшие кадры и умы в индустрии;
* уже слышны призывы к подвижкам в системе образования, а успех Китая объясняют в том числе отличиями в подходах к образованию, об этом даже Дуров написал :)
* в публичном дискурсе нередко стали появляться обсуждения регуляций ИИ и того, что нужны международные взаимные ограничения.

Что всё это значит для обычных людей? Будущее не определено, но я оптимист :)
* здоровая конкуренция - хорошо, потребители от этого как правило только выигрывают, и у нас появился выбор между разными крупными игроками на глобальном рынке;
* установлена новая планка соотношения качества/стоимости ИИ-решений, и можно ожидать снижения цен;
* у нас есть пример топовой LLM, которую можно скачать и использовать без региональных ограничений, и это либерализирует рынок ИИ;
* можно ожидать ускорения инноваций в сфере ИИ и повсеместный буст технологического прогресса.

В интересное время живём!

#ai #news

👍10🔥6❤1

371 viewsedited 20:06

Этихлид

OpenAI o3-mini

Анонс, System card

Это продолжение линейки рассуждающих моделей (ризонеров) от OpenAI (предыдущими были модели o1 и o1-mini).

Вышла в 3 вариантах: o3-mini-low, o3-mini-medium и o3-mini-high.
По сути, это одна и та же модель, которая работает с разными уровнями "усердия" при рассуждениях - чем выше уровень, тем больше времени и токенов модель тратит на "обдумывание" ответа.
Разница в способностях между уровнями очень заметная - чем больше модели давать рассуждать, тем лучше она решает задачи.

В чем она лучше предшественников?
* большой прирост в производительности в задачах, связанных с наукой, математикой, программированием (STEM-like);
* существенное снижение стоимости при схожей с o1 производительности (API дешевле в 10+ раз);
* увеличенная скорость ответов - как времени до первого токена, так и последующей генерации.

Модель уже доступна в API (для Tier 3+), на сайте ChatGPT, а также в Cursor (+ Agent!).

Пройдёмся по скриншотам

1 - твит Cursor о том, что o3-mini можно пока что использовать бесплатно, но при этом их собственные разработчики всё ещё предпочитают Sonnet :)
(хехе, и я тоже, об этом ниже)

2 - бенчмарк Aider Polyglot - видно, что o3-mini-high забралась довольно высоко, но при этом стоит обратить внимание на столбец "Percent using correct edit format" - процент задач, в которых модель следовала заданному формату редактирования - по этому параметру модель выглядит не так хорошо.

3 - результаты тестирования на автономность при симуляции работы инженера-исследователя OpenAI: в этом случае модель показывает нулевые результаты - предположительно из-за того, что она плохо следовала инструкциям и путала инструменты.
Можно надеяться на то, что это будет исправлено в будущем и результаты будут намного лучше.

4 - результаты решения задач Codeforces - видно, что производительность сильно выросла, даже опережает "взрослую" o1.

5 - задачи из LiveBench на олимпиадное программирование "с нуля" и на продолжение кода частичного решения олимпиадной задачи.
Тут можно отметить 2 вещи: high-модель лучше всех и там, и там, а low-модель сильно проваливается на частичных решениях.

Личные впечатления (предварительные)
Я пока что провел с ней всего несколько часов, но позже докину новых впечатлений, если что-то поменяется.
Плюс, при работе с существующей кодовой базой я использовал модель в Cursor, и там неизвестно, какой именно её вариант подключен, а это сильно влияет на результаты.

Итак, с т.з. разработки - это модель-олимпиадник :)

Отлично решает задачи на логику, математику, алгоритмы, и если у вас в коде есть что-то, что требует работы "вглубь" и на узком участке кода - однозначно стоит её использовать, это практически лучшая модель сейчас для таких задач (именно high-версия).

А вот с задачами "вширь" справляется не так успешно:
* когда в рамках задачи нужно поправить код сразу в нескольких местах - вносит ограниченное количество изменений, ломая проект;
* не очень хорошо учитывает мелкие детали, разбросанные в разных местах кодовой базы;
* удаляет код, который не нужно удалять, в процессе внесения своих изменений;
* в Cursor Agent упорно не использует инструменты, которые легко использует тот же Sonnet;
* на архитектурных задачах тоже не так хороша, как, к примеру, R1.

Очень странно, что она фейлится на задачах, связанных со structured outputs и function calling (SO/FC) - её специально на это затачивали, судя по анонсу, но что-то пошло не так.

Так что предварительно, для повседневного кода все ещё рулит Sonnet 3.5, а o3-mini достаётся роль отличного ризонера для небольших и глубоких задач.

Что дальше?
* ждём следующей модели от Claude - мне нравится Sonnet, но сколько уже можно-то;
* ждём большой o3;
* кажется, что проблема c SO/FC - низко висящий фрукт, и её могут пофиксить довольно быстро;
* хочется выбор high/medium/low-версии в Cursor (на их форуме народ уже просит такую фичу);
* надо потратить 100 баксов в API OpenAI, чтобы добраться до Tier 3, на котором станет можно использовать o3-mini - тогда можно будет опробовать модель по API в Cline/Aider :)

#ai #news #development #model

👍6🔥5❤1

472 views06:12

Этихлид

при работе с существующей кодовой базой я использовал модель в Cursor, и там неизвестно, какой именно её вариант подключен

Cursor переключили с версии o3-mini-medium на o3-mini-high.

Модель явно стала умнее в подходящих для неё задачах.

Но, увы, все остальные проблемы, перечисленные в прошлом посте, остались на месте.
Больше всего неприятностей доставляет то, что она плохо работает в режиме агента и приходится многое делать (о ужас!) своими руками, за неё, включая даже проверку ошибок линтером.

Команда Cursor обещается попробовать поправить то, как они промптят модель, так что ещё посмотрим, как будет дальше.

В общем, бенчмарки-бенчмарками, но всё нужно проверять на своих рабочих задачах :)

#ai #news #development

❤6👍3🔥3

479 viewsedited 02:06

Этихлид

Cursor Linter

Cursor в целом неплохой продукт, но вот с работой с сообществом и маркетингом у них прям какая-то засада.

Вот на протяжении последних нескольких релизов добавляют фичи, но при этом по-тихому, даже не всегда на своём же форуме об этом пишут.

Штош, буду иногда рассказывать о самых, на мой взгляд, полезных.

Вот, к примеру, одна из штук, которая сильно влияет на качество работы Composer Agent - это поддержка линтера.
Линтер - это либо официальная, либо сторонняя либа для разных проверок написанного кода в конкретном языке программирования.
В интересующем нас случае - для статического анализа, т.е. проверки корректности кода без его запуска.

Как работает линтер в связке с Composer Agent?
1. LLM пишет код и отдаёт Cursor'у;
2. Cursor запускает линтер локально;
3. если линтер нашел ошибки, то они передаются Cursor'ом в LLM;
4. LLM фиксит ошибки и отдаёт правки Cursor'у;
5. пункты 2-4 повторяются до тех пор, пока ошибки не будут исправлены.

В сложных случаях, бывает, участники процесса возятся довольно долго, и несколько раз я даже ловил лимит в 25 запусков тулов на один запрос в агент (это всё ещё тарифицируется как один запрос с т.з. Cursor).
За ними стоит следить - бывает, заносит с количеством правок :)

Правила для линтеров, которые использует Cursor, судя по всему, не конфигурируются, и он отлавливает только самые грубые ошибки, но даже это может уменьшить количество потенциально сломанного кода, который иногда генерит LLM.
Особенно помогает в случае статически типизированных языков (TypeScript, C#, Java, etc).

Линтеры есть практически для всех популярных языков, так что советую включить эту фичу, если по какой-то причине у вас она отключена.

#development #cursortips

👍8✍3🔥3

434 views03:40

Этихлид

Астероид 2024 YR4

Есть такой чувак, Рэндалл Манро - бывший робототехник NASA, который стал автором культового веб-комикса xkcd.
Кроме этого, пишет книги вроде "What If?" с серьёзными ответами на абсурдные вопросы и изрядной долей сарказма и "Thing Explainer", где объясняет разные вещи минимальным набором слов.
В широком смысле можно считать его популяризатором инженерного подхода к мышлению.

Насчёт столкновений разных по величине и скорости объектов он уже много написал в "What If?", но про недавно нашумевший в новостях астероид 2024 YR4 отделался только комиксом.

Закроем же этот пробел при помощи DeepSeek R1:

Что, если астероид 2024 YR4 врежется в Землю?
(В стиле Рэндалла Манро, с научными фактами и долей абсурда)

1. Встреча с космическим "камушком"
Представьте, что 22 декабря 2032 года астероид размером с 10-этажный дом (40–90 метров в диаметре) решит проверить, как Земля переносит нежданные визиты. Его скорость при входе в атмосферу составит около 17 км/с — в 50 раз быстрее пули. Если он выберет путь через атмосферу, то взорвется с энергией 7.6 мегатонн в тротиловом эквиваленте — это в 500 раз мощнее бомбы, сброшенной на Хиросиму, но в 6 раз слабее Тунгусского метеорита.

Сценарий А: Удар по океану
Если астероид упадет в Тихий океан (а вероятность этого высока — 70% Земли покрыто водой), он создаст цунами высотой до 30 метров . Волна накроет прибрежные города, но уже через 100 км от берега уменьшится до размеров обычного шторма. Хорошая новость: рыбы даже не успеют понять, что произошло. Плохая: серферы на Гавайях получат незапланированный «аттракцион».

Сценарий Б: Удар по суше
Если цель астероида — город, то в радиусе 50 км все превратится в пыль. Возникнет кратер диаметром 1–2 км (как Аризонский метеоритный кратер), а ударная волна выбьет окна на расстоянии до 200 км. Для сравнения: это как если бы все жители Москвы одновременно хлопнули дверьми.

2. Почему это (скорее всего) не случится?
- Шансы 1 к 45 (2.2%) — это примерно как вероятность встретить в лесу медведя, который умеет жонглировать сосновыми шишками.
- В 2028 году астероид снова пролетит мимо Земли (на расстоянии 7.9 млн км), и астрономы уточнят его орбиту. Скорее всего, он окажется просто «троллем», который пугает нас ради хайпа.
- Даже если траектория опасна, у человечества есть план: NASA и ЕКА уже обсуждают миссии по отклонению астероида. Варианты включают ядерный взрыв (как в «Армагеддоне») или кинетический удар (как миссия DART).

3. Исторические параллели
- Тунгусский метеорит (1908 г.): взорвался в атмосфере над Сибирью, повалив 80 млн деревьев. 2024 YR4 может повторить этот сценарий, но с поправкой на то, что сегодня в тайге больше медведей, чем людей.
- Челябинский метеорит (2013 г.): его диаметр был 19 метров — в 4 раза меньше 2024 YR4. Тем не менее, ударная волна выбила окна у 1,600 человек. Если бы 2024 YR4 был из железа (как Челябинский), последствия были бы серьезнее, но спектральный анализ показывает, что он каменистый — скорее всего, развалится в атмосфере.

4. Что делают ученые прямо сейчас?
- Телескоп Джеймс Уэбб в марте 2025 года сделает инфракрасные снимки астероида, чтобы измерить его точный размер. Пока оценки колеблются между «автобус» и «футбольное поле».
- Радарные наблюдения в 2028 году позволят определить орбиту с точностью до 500 км — этого хватит, чтобы понять, стоит ли нам начинать паниковать или можно продолжать смотреть Netflix.

5. Итог
Если 2024 YR4 все-таки ударит, это станет самым зрелищным событием декабря 2032 года. Но не апокалипсисом: человечество выживет, а YouTube наводнят ролики с хэштегом #AsteroidChallenge. А пока астрономы советуют не волноваться — они уже дежурят у телескопов, пока мы спим. В конце концов, у Вселенной есть чувство юмора, но она редко выбирает сценарии с плохим концом.

P.S. Если вдруг астероид передумает, он может стать отличным поводом для нового блокбастера. Сценаристы, вам слово!

В целом такие вот разборы от моделей-ризонеров в стиле "А что если..." - неплохая познавательная развлекуха :)

#news

👍6🔥3😁1

470 viewsedited 20:43

Этихлид

Cursor - Open search results in Composer

Бывает, что нужно какое-то изменение глобально в проекте сделать или просто в контекст закинуть все те места, где какая-то строка встречается, а по собственному RAG-индексу Cursor ищет не то, что надо.

Тогда есть вот такая штука:
1. пользуемся обычным, родным для VS Code, файловым поиском;
2. жмём на "Open search results in Composer";
3. результаты поиска в виде найденных строк и файлов, в которых они нашлись, попадают в Cursor Composer, и, соответственно, в контекст.

На скриншоте показан пример: я заранее сделал компонент для отображения статуса выполнения долгой операции, а похожий (и не всегда в точности такой же) код уже встречался в нескольких местах в проекте (результат эволюции, ну вы понимаете).

Я сделал поиск по CSS-классу, который во всех этих местах используется, передал результаты поиска в Composer и попросил заменить повторяющийся код на использование компонента.

Причем вообще не заморачивался насчет того, чтобы отфильтровать файлы по типу, убрать из результатов поиска сам компонент и т.п. - LLM достаточно умна, чтобы не творить дичь в таком простом случае.
А я ленивый :)

P.S. да, всё получилось, результат в комменте :)

#development #cursortips

👍8🔥6

556 viewsedited 16:59

Этихлид

Уровни внедрения ИИ в разработку

Сейчас очень интересно наблюдать за тем, как разработка при помощи ИИ проникает в индустрию.

При этом на рынке умудряются одновременно существовать как инструменты, на добрый порядок различающиеся по своему качеству и степени автоматизации, так и разработчики, использующие эти инструменты так же на порядок (не)эффективнее.

Выделил такие уровни и практики внедрения:

0. Изоляция
Оказывается, всё ещё есть программисты, которые ничего не слышали про использование ИИ в разработке.

По этому поводу в наше время я испытываю невыразимое сочетание эмоций - это какой-то азарт антрополога, встретившего йети: хочется изучать это явление, пытаться понять, какими путями шла эволюция, как у них получается не контактировать с остальным миром... :)

1. Набегами
Использование веб-интерфейсов LLM-ок для написания небольших скриптов/функций - ну т.е. прям на сайте ChatGPT/Claude что-то конкретное просим сделать, получаем ответ, на этом общение заканчивается.

Сюда же можно отнести использование Claude Artifacts / ChatGPT Canvas для небольших прототипов.

2. Копипастинг
Разработка при помощи ИИ через копипастинг кода между каким-то UI к LLM и своей IDE.

Как по мне, это страшно неудобно, времязатратно, чревато ошибками и ускоренным износом клавиш Ctrl/C/V (ну или Ctrl/Shift/Insert, у членов древнего секретного ордена).

Однако примечательно, что тут прям целая культурно-техническая тусовка есть, которая даже придумывает штуки навроде RepoPrompt - склеивает файлы проекта в один мегафайл, чтобы было проще его копипастить туда-сюда 🤯

3. Автодополнение
Использование ИИ-автодополнения в процессе написания кода руками в своей IDE - собственно с этого всё и началось, когда вышел GitHub Copilot аж 300 лет тому назад (ну, ~3 года, если быть точнее, ~~я был там, Гендальф~~).

Пользуясь случаем, ещё раз скажу, что в Cursor лучшее автодополнение кода среди всех ИИ-инструментов.

4. IDE с LLM-чатом
LLM-чат непосредственно в самой IDE - можно легко передать файлы в LLM, получить тут же ответ и применить diff к своему коду - это сейчас практически любой ИИ-плагин к IDE умеет, что делает копипастинг особенно необычной практикой.

5. IDE с LLM-агентом
Использование IDE с поддержкой агентского режима работы: Cursor / Windsurf / GitHub Copilot / (Roo)Cline.

В них можно ставить полноценные задачи, и они уже сами найдут нужный код в проекте, сами его поправят, сами выловят ошибки. Тут много нюансов и своих практик, часть которых описана мною ранее в гайде, а часть я как-нить соберусь и опишу :)

6. Агенты полного цикла
Тут у нас Devin / OpenHands - это штуки, которые способны в общем чатике типа Slack принять от вас задачу, а дальше сами зададут вопросы, сходят в Git, залезут в базу знаний проекта, напишут код, потестят его, запушат и передадут на ревью, ~~получат зарплату~~.

Пока что они не готовы к реальному использованию, но это в основном проблема существующих LLM, нежели обвязки вокруг них (чем, собственно, все ИИ-инструменты для разработки и являются).

С выходом следующего поколения моделей, которое должно состояться в ближайшие несколько месяцев, тут могут быть существенные изменения.
Да и в целом, я думаю, за подобными системами будущее разработки.

7. (Secret Level)
Встречаются специальные маньяки, которые пишут свои агентские системы под задачи массовой генерации / анализа / модификации кода.
Задачи у них тоже довольно специальные, но, как правило, интересные и весьма нетривиальные.

Скорее всего позже отсюда появится свой набор инструментария для высокоуровневой работы с большими кодовыми базами.

У меня сейчас примерно такое распределение получается в задачах разработки:
* 80% - №5, Cursor Composer Agent
* 10% - №4, Cursor Chat + Cursor Composer
* 5% - №3, ручной код с автодополнением, так же в Cursor
* 5% - №1, генерация каких-то мелких скриптов через ChatGPT/DeepSeek

А как у вас обстоят дела?
Или, может, есть что-то необычное, чем можете поделиться? :)

#ai #development

🔥12❤6👍4👏3

767 viewsedited 18:48

Этихлид

Claude 3.7 Sonnet

Дождались! :)

❗️Новый релиз от Anthropic - Claude 3.7 Sonnet.

🟢 модель стала гибридной - теперь это универсальная модель с чертами ризонера, и можно будет контролировать, сколько ей можно думать над ответом (выражается это в бюджете токенов, которые можно потратить на размышления)

🟢 стала еще лучше в кодинге в целом и фронтенд-разработке в частности

🟢 улучшенные агентские возможности, с большим упором на решение реальных бизнес-задач, чем на оптимизации под математику и соревновательное программирование

🟢 цепочку рассуждений сделали открытой

🔵 цена осталась такой же, как и у Claude 3.6 Sonnet ($3/M input, 15$/M output)

🔵 длина контекста осталась такой же, как и у Claude 3.6 Sonnet (200k)

📈 Изменения на интересных бенчмарках по сравнению с Sonnet 3.6:
* (кодинг) SWE-bench verified: 49% -> 62.3% (70.3%, с минимальным набором инструментов)
* (агенты) TAU-bench: 71.5% -> 81.2%, 48.8% -> 58.4%

P.S.
Забавно, что версией 3.6 сообщество в свое время окрестило официальную версию 3.5 (New), так что официально следующей версией стала 3.7 :)

#ai #news

🔥8👏3

476 views19:26

About

Blog

Apps

Platform