Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.2K subscribers
604 photos
34 videos
29 files
3.5K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Cursor 2.1: новый релиз, который упрощает жизнь разработчикам 💻

Вышел новый релиз Cursor 2.1. В этот раз обновлений сразу несколько, и все они значительно улучшают работу с кодом. Давайте рассмотрим нововведения.

Теперь в Cursor есть суперудобная функция «Find Issues», которая позволяет находить и исправлять баги буквально одной кнопкой. Агент проводит ревью вашего кода и моментально показывает все найденные проблемы в боковой панели. Не надо больше искать по строкам и угадать, где что-то пошло не так. Бонус: в течение этой недели вы можете потестировать эту фичу бесплатно!

Греет сердце старый добрый grep, но с улучшениями 🍌
Не знаю, как вы, а я обожаю старый добрый grep, который позволяет быстро найти нужный фрагмент в коде. Так вот, теперь в Cursor это ещё и векторный поиск. А если вы всё-таки за традиции, то grep вынесли отдельно. Работает почти мгновенно и ищет по всей кодовой базе, включая точные совпадения и регулярки. Для тех, кто привык к скорости и точности — просто мастхэв.

Режим планирования тоже не остался без внимания. Теперь, когда вы утверждаете план действий, агент будет задавать уточняющие вопросы. Простой и удобный интерактивный режим позволяет отвечать прямо на месте.


Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥2🐳1
Интегрировать AI в аналитику. Мигрировать данные без потерь. Масштабировать на тысячи пользователей 💻

Три задачи, с которыми сталкивается каждая команда. Yandex DataLens Festival — про то, как их решать. Неделя глубокого погружения в аналитику — с 8 по 16 декабря, онлайн и бесплатно.

Разберут то, что реально пригодится в работе: от AI-инструментов DataLens до современных подходов к аналитике. Формат без воды: практические гайды и прямой эфир с командой продукта. Плюс конкурсные задания с призами.


Бонус: офлайн-афтепати в Москве для тех, кто хочет отвлечься от экрана и пообщаться вживую. Пройти регистрацию можно по ссылке 🤔

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Forwarded from DS (Content)
Как ИИ-джуниор пишет научные статьи по машинному обучению 🗒

Задумывались ли вы когда-нибудь, что было бы, если бы ИИ мог не только генерировать идеи и код, но и писать научные статьи? И вот команда из Токийского университета решила, что пора сделать следующий шаг и предложила решение: Jr. AI Scientist — младший ИИ-исследователь, который работает, как честный сотрудник на стартовой позиции. Он помогает находить проблемы в статье, предлагает улучшения, проверяет их и даже создает черновик научной работы. Так давайте разберемся, как это работает.

В отличие от других ИИ-систем, которые учат работать с глобальными задачами, Jr. AI Scientist ограничен одной статьей, её кодом и данными. Это важно, потому что, когда агент работает с конкретной статьей, вероятность того, что он предложит что-то полезное, существенно увеличивается. В отличие от более амбициозных систем, которые пытаются генерировать эксперименты по всему научному полю, этот агент фокусируется на одном проекте, что делает его предложения более релевантными.

Как это работает под капотом? 😮‍💨

Итак, процесс начинается с того, что агент получает статью и её LaTeX-исходники. Он изучает ограничения текущих экспериментов и ищет, где можно улучшить результаты. Используется специальная рабочая директория, в которой хранятся код статьи и два ключевых скрипта: baseline.py и plot.py. Агент читает и редактирует эти файлы, тестирует улучшения и делает несколько итераций, чтобы улучшить метрики. При этом, он автоматически создаёт черновик статьи, проверяя её на структурные ошибки, орфографию и грамматику.

Что показывает практика? 😐

Jr. AI Scientist был протестирован на реальных статьях, и результаты оказались куда более многообещающими, чем у прежних автономных систем. Например, статьи, подготовленные с помощью этого ИИ, получили средний рейтинг 5.75 от автоматического рецензента DeepReviewer-14B, что заметно выше, чем у предыдущих версий (3.30). Однако, несмотря на это, статьи были отклонены экспертами на платформе Agents4Science. Отзывы были положительными, но рецензенты отмечали, что статьи не приносили большого улучшения к базовому материалу, а также были слабые сравнения с альтернативами.

Что не так? 😺

Несмотря на успехи, агент всё ещё не идеален. Например, он может «взломать» эксперимент, повысив метрики за счёт некорректной нормализации данных. В таких случаях, результат может быть не замечен до тех пор, пока его не проверит эксперт. Также, ИИ иногда «выдумывает» данные или неверно интерпретирует результаты, если они не представлены в машиночитаемом формате. Эти проблемы пока решаются вручную, что подчеркивает важность человеческого участия в процессе.


Однако, с каждым шагом этот ИИ становится всё более полезным. И, похоже, эпоха автономных исследователей начинается не с гениев, а с «джуниоров».

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥32
Claude Opus 4.5 от Anthropic: новый рекорд и улучшенная экономия токенов 💳

Anthropic снова на высоте! Недавно они представили обновление своей модели Claude Opus 4.5, и это — настоящий прорыв. Эта версия стала первой, которая пробила планку в 80 на SWE bench verified, показав 80,9%. Это значит, что теперь у нас есть новая SOTA (State Of The Art) по кодированию, и она побила все рекорды! Но не только результаты впечатляют. Модель уже доступна через API, и, что важно, цена на нее ощутимо снизилась по сравнению с предыдущей версией. Было $15/75$, а стало всего $5/25$.

Одним из самых интересных улучшений является экономия токенов. Теперь Claude Opus 4.5 на среднем уровне риска использует на 76% меньше токенов по сравнению с Sonnet 4.5. А если выкрутить все на максимум, то новая модель даже обходит Sonnet на 4,3% на SWE bench, при этом потребляя на 48% меньше токенов.

Claude Opus 4.5 прошел внутренний экзамен, который Anthropic дает своим кандидатам на работу. И, внимание, он справился с этим экзаменом за 2 часа лучше, чем любой человек в истории компании.

Что нового в продукте?

— В Claude App теперь есть функция сжатия контекста, как в новом Codex. Когда контекст достигает лимита, старый суммируется и передается в новое окно. Это позволяет не упираться в конец диалога и работать без перерывов.

— Добавили Claude Code в десктопное приложение, что позволяет параллельно работать над несколькими задачами. Очень удобно для тех, кто любит multitasking.

— Claude для Chrome и Excel вышли из беты. Приятно видеть, что эти инструменты становятся доступными для всех.

— И, наконец, появилась возможность контролировать время размышлений. Теперь можно выбрать режимы: low, medium и high. Это даёт возможность настроить модель под ваши задачи и предпочтения.


Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Пузырь или суперцикл? Почему ИИ-ралли напоминает кризис 2000-х 😢

Что-то в воздухе начинает настораживать. Недавний скачок волатильности на американском рынке заставил инвесторов снова говорить об ИИ-пузыре. Даже рекордный отчёт Nvidia, который был опубликован 20 ноября и показал отличные результаты по спросу на чипы для дата-центров, не смог поддержать акции компании, которые все равно ушли в минус. Оказавшись в связке с падением индексов S&P 500 и Nasdaq, эти события вызывают все больше сомнений: что, если мы действительно находимся на грани нового пузыря, как был на рынке доткомов в 2000-х?

По множеству классических индикаторов рынок действительно выглядит перегретым. Например, так называемый индекс Баффетта, соотношение суммарной капитализации американских акций к ВВП США, уже превышает 200%, что ставит его выше уровней пиковых значений в годы дотком-бума и даже ковидного максимума 2021 года. Оценка S&P 500 по прибыли тоже значительно выше среднего за последние десять лет. Аналитики из Reuters называют это «зоной повышенного риска». Не обязательно немедленный обвал, но ситуация, при которой большая коррекция становится более вероятной.

Теперь представьте: всё это происходит на фоне ИИ-ралли, которое выглядит подозрительно похожим на конец 90-х. Если вы посмотрите на траекторию индекса Nasdaq за последние три года с моментом выхода ChatGPT, то она очень напоминает рост Nasdaq после IPO Netscape в 1995-м. Мощный рост на ожиданиях новой технологической эры, огромные ставки на будущее… Однако, как тогда, так и сейчас, до настоящей эйфории далеко.

Где тут пузырь?


Пока он ещё не достиг своей кульминации. Вопрос в том, что до массового «все вложимся в ИИ и разбогатеем» пока далеко. Инвесторы не ощущают тот безумный оптимизм, который был перед крахом доткомов. Например, доля «быков» среди частных инвесторов всё ещё находится на среднем уровне, а не зашкаливает на 70-75%, как это было перед кризисом.

Но при этом тревогу вызывает то, как финансируется нынешняя гонка ИИ. Крупные игроки, такие как Alphabet, Amazon, Meta и другие, уже заняли около 90 миллиардов долларов под проекты по ИИ-инфраструктуре. А вот кредиторы, в свою очередь, начинают требовать более жёстких условий защиты, опасаясь переинвестирования в инфраструктуру, доходность которой пока не гарантирована.


Впрочем, взгляд с противоположной стороны тоже не заставляет себя ждать: например, глава Google Сундар Пичаи прямо признаёт «иррациональность» в гонке за ИИ. По его мнению, если пузырь всё-таки лопнет, «ни одна компания не останется в стороне». А вот Дженсен Хуанг, глава Nvidia, уверенно утверждает, что никакого пузыря нет — это просто волна новой индустриальной трансформации. Скорее, мы сейчас наблюдаем фазу, когда реальный технологический суперцикл (огромный спрос на ИИ-чипы и сервисы) переплетается с финансовой спекуляцией.

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
10 декабря — код, архитектура, AI в деле

Сбер открывает двери в мир AI: 10 декабря — в Москве и онлайн.

Что вас ждет?
⬩На сцене — доклады о развитии нейросетевых моделей GigaChat и Kandinsky, о ключевых этапах их разработки, практических достижениях и дальнейших перспективах развития;
⬩Гига Город — демо-стенды, постеры, инженерные споры, вопросы и тестирование архитектур;
⬩Воркшопы — повторяем решения инженеров, разбираем пайплайны и инструменты;
⬩Карьерный блок — разговоры с командами и открытые роли в AI-направлениях Сбера.

Зачем идти?
Чтобы увидеть, как строят AI-системы, задать вопросы инженерам и понять, куда движется AI в Сбере — и найти свое место в этом движении.

Регистрируйтесь и проверьте AI-технологии в деле.

Реклама. ПАО Сбербанк. ИНН 7707083893
4
Илья Суцкевер о будущем ИИ 💃

Если вы интересуетесь тем, как развивается искусственный интеллект и куда мы движемся в контексте AGI, то недавно вышедшее интервью с Ильёй Суцкевером (сооснователем OpenAI) точно стоит вашего внимания.

Суцкевер поделился множеством инсайтов на тему стратегии SSI, проблем с предобучением и способов улучшения обобщающих способностей ИИ-моделей. Также он затронул важные вопросы касаемо того, как обеспечить позитивное будущее для AGI.


Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
3🐳1
Как Эндрю Ын помогает учёным с ИИ-ревью 💃

Если вы рисерчер или студент, который пишет научные работы, то наверняка знаете, что процесс ревью — это не просто долго, а прямо-таки мучительно долго. Подготовить статью, отправить в журнал, ждать рецензий месяцами, а иногда и дольше... И вот, наконец, вы получаете обратную связь, но она не всегда полезная. Что если бы существовал инструмент, который помог бы вам заранее понять, что может не понравиться ревьюерам?

Эндрю Ын и его команда разработали ИИ-ревьюера, который помогает исследователям и студентам улучшить свои работы перед отправкой в журнал. Такой инструмент может сэкономить вам не только время, но и нервы. Ведь если обычное ревью может занимать недели или даже месяцы, то ИИ оценит вашу работу за несколько минут.

Как это работает? 😮‍💨

Система была обучена на реальных ревью с конференции ICLR 2025, что гарантирует её практическую ценность. Оценки качества происходили с использованием корреляции Спирмена, где чем выше значение, тем ближе результаты ИИ к человеческим оценкам. В итоге, корреляция между ИИ и реальным рецензентом составила 0.42, что, как ни странно, не так уж и плохо. Для сравнения, корреляция между двумя людьми-ревьюерами в среднем тоже около 0.41. Так что, да, ИИ может дать вам весьма точный прогноз, чем ревьюеры могут быть недовольны.

Особенность системы в том, что она использует atXiv для ревью, а значит, она особенно полезна для статей в области ИТ и ИИ, которые часто публикуются на этой платформе.

Цикл обратной связи в научных кругах порой затягивается на полгода, и это, согласитесь, слишком долго. В таких условиях скорость и качество обратной связи — это то, что нужно каждому исследователю. А ИИ-ревьюер как раз и может помочь вам избежать затянутых циклов и получить полезные замечания ещё до того, как ваша работа попадёт в руки журнала.


Теперь можно не просто перепроверять свою статью, но и нацелиться на тот результат, который понравится рецензентам, ещё на этапе подготовки. Это бесплатно, и вы можете начать использовать инструмент прямо сейчас — PaperReview.

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
41
США запускает проект Genesis 🗒

В то время как мир сотрясают очередные достижения в области ИИ, США решили сыграть на опережение. И не просто запустили очередной стартап, а задумали проект, масштабы которого могут соперничать с Манхэттенским проектом или программой Apollo. Genesis Mission — грандиозной инициативой, которая обещает ускорить научный прогресс с помощью искусственного интеллекта. Пока бюджет остаётся под завесой тайны, но то, что планируется, уже звучит амбициозно. Итак, что же стоит за этим проектом?

Главная задача Genesis Mission — ускорить научные открытия с помощью ИИ. Всё это должно быть сделано с использованием передовых технологий и самой современной инфраструктуры. Цель амбициозная: создание платформы, которая объединит в себе всё необходимое для развития научных агентов: данные, инструменты, вычислительные мощности и среды для их обучения.

Вот как всё будет происходить поэтапно:

• Создание American Science and Security Platform
Это не просто место для хранения данных, а настоящая инфраструктура для развития научного ИИ. В её рамках министерство энергетики США в течение трёх месяцев будет собирать вычислительные ресурсы. Но не только у себя в стране: сотрудничество с частным сектором и другими странами — неотъемлемая часть плана. После этого, ещё четыре месяца уйдут на подготовку данных и их обработку по специальным протоколам безопасности. Ведь помимо научных задач важно не забывать о безопасности — особенно когда речь заходит о такой мощной платформе.

• Дообучение моделей с использованием роботизированных лабораторий

Интересный момент: в отличие от традиционных подходов, валидация и обучение будут происходить с помощью роботизированных лабораторий. Это значит, что ИИ будет генерировать гипотезы, робот их тестирует в реальных условиях, а ИИ уже на основе полученных данных делает выводы и улучшает гипотезу. Такой цикл не только автоматизирует процесс, но и значительно ускоряет его.

Когда ждать результатов 👉

Первые реальные результаты планируют получить к 2027 году. Если всё пойдёт по плану, в этот момент мы сможем увидеть не просто новые научные достижения, а совершенно новый подход к исследованию и экспериментам с помощью ИИ.

Кто участвует в проекте?

Здесь уже яснее: OpenAI и Anthropic точно будут участвовать в проекте. Возможно, к ним присоединятся и другие лаборатории. Но вот с xAI (компанией Илона Маска) пока всё не так очевидно. Тема его участия ещё остаётся под вопросом, особенно на фоне недавних политических разногласий.


Но, как и в любом масштабном проекте, остаётся один важный вопрос: может ли такой подход изменить весь научный ландшафт?

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🐳2👀211
Датасеты есть, а качественных данных нет 🚶‍♂️

ML-команды хорошо знают, как сложно работать, когда обучающие данные разбросаны по разным источникам и хранятся в противоречивых форматах. Пока одни пытаются собрать рабочий датасет, другие тратят дни на исправление артефактов в фичах.

Для таких ситуаций создали бот-генератор оправданий. Откройте бота, когда в следующий раз пайплайн feature engineering выдаст необъяснимые результаты — сгенерируйте креативное оправдание и сразу отправьте коллегам в чат. Это поможет взглянуть на проблему под новым углом и может стать началом продуктивного обсуждения.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁94🐳2
Gemini 3 Pro: новый лидер в решении сложных математических задач

Не так давно Gemini 3 Pro стал настоящим фаворитом среди ИИ в области сложной математики. Система удивила даже самых требовательных специалистов. На бенчмарке FrontierMath, который включает в себя задачи самой высокой сложности, эта модель показала феноменальные результаты 😐

Для начала, давайте разберёмся, что такое FrontierMath. Это набор задач, подготовленных профессиональными математиками, охватывающий широкий спектр тем — от теории чисел до алгебраической геометрии. Некоторые из этих задач могут занять у человека недели работы, а уровень сложности варьируется от бакалавриата до уровня исследовательской работы.

Gemini 3 Pro, к слову, набрал 37,6% по общим результатам, значительно обогнав остальных соперников: Gemini 2.5 Deep Think с 29% и GPT-5 Thinking с 26,6%. На самом сложном уровне Tier 4, где ставятся задачи из мира научных исследований, Gemini 3 Pro также оказался вне конкуренции, решив девять задач. Для сравнения, GPT-5.1 Thinking и GPT-5 Pro справились только с шестью.

Что это значит?

Мы привыкли к тому, что ИИ пока уступает человеку в таких областях, как математика, но, похоже, это скоро изменится. Например, люди в среднем показывают около 30% правильных решений в таких задачах, а при совместной работе и нескольких попытках результат может подниматься до 50%. Если учесть, что ИИ сейчас добился 19% на самых сложных задачах (это ещё без дополнительных попыток), можно говорить о серьёзном прогрессе.


На фоне того, что эти технологии становятся доступными для широких масс, можно ожидать настоящую революцию в области научных исследований и образования. Переплюнет ли ИИ человека в математике?

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3🔥31
Нейросети идут в науку

Мы уже писали о том, что ИИ всё чаще становится рабочим инструментом для исследователей. В этом контексте начинают появляться отдельные образовательные направления. Так, например, в Школе анализа данных Яндекса началось обучение по применению ИИ в естественных науках. Отобрали 50 молодых учёных — физиков, биоинформатиков, медиков, химиков и других.

Обучение построено вокруг реальных исследовательских задач. Спланировать эксперимент каждой команде помогает эксперт ШАДа, а если проекту нужны серьёзные расчёты — подключают вычислительные мощности Яндекса.

По задумке, ИИ должен стать для учёных ассистентом или партнером в исследованиях. И это, пожалуй, один из самых здравых сценариев применения технологии в науке.
82🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Документалка DeepMind теперь доступна бесплатно 🍴

Если вы хоть немного интересуетесь искусственным интеллектом и его развитием, то наверняка слышали про AlphaFold — модель, которая потрясла научный мир. В честь пятилетия этой системы Google выложил на YouTube документальный фильм про DeepMind.

Картина называется «The Thinking Game» и, возможно, кто-то из вас уже успел ее посмотреть — она была доступна на платных платформах с лета 2024 года. Но вот теперь, Google решился подарить этот фильм всем желающим.

Документалка, которая снималась с 2019 года, рассказывает не только о Демисе Хассабисе, основателе и CEO DeepMind, но и о всей команде, которая стоит за разработкой таких проектов, как AlphaGo, AlphaZero и, конечно, AlphaFold. Это своего рода экскурс в культуру и философию DeepMind, где на фоне ключевых научных достижений проходит рассказ о людях, которые все это создавали.

Если вы когда-то задавались вопросом, как вообще можно вывести ИИ на такой уровень, чтобы он начал решать задачи, стоящие перед самыми опытными учеными, то этот фильм даст ответы на многие вопросы.

Система AlphaFold не просто решает задачи в области биоинформатики, она буквально перевернула способ, которым ученые изучают структуру белков. Это достижение стало возможным благодаря огромной работе, проделанной командой DeepMind, и сейчас мы стоим на пороге того, чтобы с помощью ИИ разгадывать тайны жизни на уровне, который раньше был невозможен.


Те, кто еще не видел этот фильм, могут наверстать упущенное. Это отличная возможность не только узнать о технологических достижениях, но и вдохновиться на новые идеи.

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍8🐳2🔥1
Как эксперты видят будущее ИИ 😐

В последние годы темы искусственного интеллекта и AGI поляризовали общественное мнение. Кто-то уверяет, что мы на пороге суперинтеллекта, а другие кричат, что весь этот хайп — всего лишь пыль в глаза. Но вот интересный факт: если вы уберете громкие заголовки и взглянете на мнения реальных экспертов, картинка будет совершенно другой. Вот что сказал Ноам Браун, ведущий исследователь в OpenAI:

«Соцсети часто сводят дискуссию об ИИ к двум крайностям. С одной стороны, у нас есть скептики, которые уверены, что ИИ — это просто модное явление и ничего больше. С другой — фанатики, которые считают, что суперумные машины вот-вот станут реальностью.»

Но если взглянуть на мнение настоящих специалистов, то увидим нечто более сбалансированное и менее драматичное. Что говорят ученые?

— Текущие технологии уже могут произвести огромный эффект. Даже без сверхреволюционных открытий, современные модели ИИ способны изменить экономику и общество.

— Для достижения AGI (и тем более ASI, искусственного суперинтеллекта) нужны дополнительные исследования. К примеру, многие исследователи упоминают такие проблемы, как постоянное обучение и эффективность выборки. Эти прорывы могут быть ключевыми для следующего шага.

— 10-20 лет на пути к AGI. Средний срок, который называют ученые, — 10 лет. Но в целом, консенсус таков: да, мы точно придем к этому, и вполне возможно, что это случится в ближайшие десятилетия.


Если убрать все шумиху и хайп, оказывается, что мнение ученых гораздо более зрелое и оптимистичное, чем мы привыкли думать, глядя на громкие заголовки. Конечно, для того чтобы достичь того самого суперинтеллекта, предстоит пройти еще долгий путь, но так ли уж фантастичен этот путь? Да, нужно больше исследований, но идея о том, что AGI будет создано в ближайшие 10-20 лет, в целом вполне реалистична.

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2🐳2👍1
Математический предел креативности нейросетей 💀

Математика не шутит, особенно когда дело касается творчества ИИ. Недавняя работа австралийского исследователя Дэвида Кропли из Университета Южной Австралии утверждает, что у генеративных ИИ-систем вроде ChatGPT есть жесткий математический потолок креативности. Речь о том, что даже самые «креативные» ИИ-системы, по мнению Кропли, могут быть креативными только до определенного предела. Давайте разбираться, в чем же тут подвох?

Дэвид Кропли использует классическое определение творчества из психологии, где продукт признается креативным только тогда, когда он одновременно новый и уместный. Он формулирует это так: C = N × E
где C — это креативность, N — новизна, а E — эффективность.

А как это соотносится с языковыми моделями вроде ChatGPT? Кропли вводит понятие вероятности того, какое слово модель выберет на данном шаге. И оказывается, что креативность на одном шаге можно описать как: C = p × (1 − p) = p − p²
где p — это вероятность выбранного слова. Математика подсказывает, что максимальная креативность может быть достигнута, когда вероятность равна 0.5 (средний выбор). Когда слово слишком вероятно, оно становится банальным, а когда слишком редким — уместность теряется.

Пример с котом 😺

Чтобы понять, как это работает, Кропли приводит пример: «The cat sat on the ...». Для ИИ слово mat будет очень вероятным, но оно настолько банально, что новизны почти не добавляет. Более редкие варианты, вроде moon или chair, с одной стороны, новее, но рискуют быть неуместными.

Так вот, каждый шаг в процессе генерации у ИИ балансирует между «банально, но правильно» и «оригинально, но рискованно». И как бы ни старались модели, они не могут быть одновременно очень новыми и очень уместными. То есть, как бы ни учились на данных, ИИ всё равно окажется где-то в середине, между слишком банальным и слишком странным.

Кропли делает вывод, что текущие языковые модели могут лишь имитировать творчество на среднем уровне. В реальности они, по его мнению, никогда не выйдут на уровень профессионалов или гениев. Их «творческий потолок» — это как раз 25% шкалы творческих способностей человека. Выходит, ИИ может быть хорош в создании посредственных идей, но сложно ждать от него настоящего прорыва.


Однако Кропли не говорит, что ИИ всегда будет таким. Он утверждает, что для достижения «экспертного» уровня потребуется новая архитектура, которая будет генерировать идеи, не привязанные к уже существующим данным. То есть, новые технологии, которые смогут выходить за рамки привычных статистических паттернов. Фуух, будущее есть!

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥7🐳1
Как это — работать в Т-Банке?

Загляните в канал T-Crew, где увидите:

— жизнь и будни команды;
— ИТ-хабы компании по всей России;
— анонсы мероприятий;
— кейсы, статьи и советы для карьерного роста.

Еще здесь можно раньше других найти вакансии в ИТ и диджитале. За полезным — сюда.
2😁2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Все крупные игроки борются за решение одной проблемы 🤔

Если вы интересуетесь развитием ИИ-агентов, то наверняка заметили, как все ведущие технологические компании стремятся решить одну и ту же задачу: как эффективно работать с графами знаний в реальном времени для больших языковых моделей? Microsoft, Google, AWS — все ищут решения, но FalkorDB предлагает интересный подход. Давайте разберемся, в чем его уникальность.

Для начала, давайте немного углубимся в обычные графовые базы данных. Традиционные графовые базы хранят связи между узлами, а когда вы делаете запрос, система проходит от узла к узлу, шаг за шагом, как бы следуя по карте. Это нормально, но вот проблема: при работе с огромными графами знаний, как в случае с ИИ-агентами, это становится серьезным узким местом.

А что если представить граф как математическую структуру?

FalkorDB решает эту проблему с помощью разреженных матриц. В отличие от традиционных графов, где хранятся все связи, разреженная матрица хранит только существующие, действительные связи. Это позволяет значительно экономить место и ресурсы. Но это еще не все.

Ключевое преимущество: когда граф представлен как разреженная матрица, вы можете делать запросы с помощью линейной алгебры, а не пошагового обхода. А линейная алгебра работает намного быстрее, чем традиционное путешествие по графу. Плюс, разреженные матрицы используют память с максимальной эффективностью — вы храните только то, что действительно нужно.

Почему не использовать просто векторный поиск 😂

Векторный поиск, конечно, быстрый, но он ограничен поиском только по схожести, не учитывая тонкие связи и структуру данных. Графы же позволяют уловить тонкие взаимосвязи между объектами. Это важно, потому что контекст, который вы подаете агенту, должен быть не просто похожим, а точным и релевантным.

Что предлагает FalkorDB?

• Ультра-быстрая многозадачная графовая база данных.
• Эффективное хранение с использованием разреженных матриц.
• Совместимость с OpenCypher — тем же языком запросов, что и в Neo4j.
• Оптимизирована для приложений на базе LLM и памяти агентов.
• Работает поверх Redis для простоты развертывания.


Если вы строите ИИ-агентов, которым нужно работать с подключенными данными в реальном времени, FalkorDB — это инструмент, который стоит попробовать.

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95👀1
Forwarded from xCode Journal
🤣 Гениальный план, как избавиться от бесящих коллег

💥 xCode Journal
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32👍6🔥6
Ozon Profit наращивает мощности для обучения и валидации ML-моделей👨‍💻

Краудсорсинговая платформа Ozon Profit, которую многие используют для разметки, серьезно расширила функционал. Теперь это инструмент не только для сбора и обработки данных, но и для их верификации в реальном мире.

Появились «полевые задания»: если ваша модель, к примеру, анализирует вывески или определяет акции в магазинах, то можно проверить ее предсказания в офлайне, отправив исполнителя по конкретному адресу для фотофиксации или проверки.

Сервис сообщает о пятикратном росте онлайн-задач — исполнители занимаются разметкой текстов, изображений и видео, а также тонким анализом эмоций и намерений в пользовательских обращениях. Именно на таких данных учатся и дообучаются LLM и модели классификации.

Для проектов любого масштаба доступны API-интеграции, позволяющие автоматически отправлять данные от вашей модели на проверку и разметку людям.

Data Science
🔥42😁1🐳1
Релиз DeepSeek-Math-V2 😮

Математика — это не просто наука, это настоящее искусство, и вот, похоже, на горизонте появился новый мастер. DeepSeek-Math-V2 — долгожданный релиз, который, казалось бы, никто уже не ждал. Но, как это часто бывает с технологическими прорывами, он пришел неожиданно и с мощным заявлением. Примерно два года назад был выпущен первый DeepSeek, и вот теперь, спустя столько времени, на свет вышел его преемник.

Модель сдает задачи на уровне золотой медали на IMO (Международной математической олимпиаде) 2025 и CMO (Chinese Mathematical Olympiad) 2024. Но это еще не все: на сверхсложной олимпиаде для студентов Putnam 2024 модель получила 118 из 120 возможных баллов. Это действительно впечатляющий результат 🤔

Теперь, конечно, вы спросите, а где же бенчмарки? Да, тут есть некоторая странность. Пока нет результатов по таким известным тестам, как MATH, GSM8K или AIME, и в целом на данный момент их не так уж много. Но вот что стоит отметить: на IMO-ProofBench DeepSeek уверенно обходит GPT-5 и сравнивается с Gemini 2.5 Pro на самых сложных задачах.

Что касается того, что происходит с Gemini 3, Grok 4 и GPT-5.1, это вопрос открытый. Но с учетом того, как модель показывает себя на реальных задачах, можно не сомневаться, что она в будущем будет конкурировать с самыми лучшими из них.

Под капотом у DeepSeek-Math-V2 лежит DeepSeek-V3.2-Exp-Base — мощная система, основанная на пайплайне из генератора и верификатора. Модель не генерирует решение за один проход, а делает это постепенно, улучшая каждое доказательство по нескольку раз. Идея проста, но гениальна: большой генератор создает решение, потом оно проверяется моделью-верификатором, и в случае ошибок модель возвращает обратную связь для улучшений. Процесс повторяется до 16 раз, а за каждую итерацию проверяется сразу до 64 гипотез! Это позволяет добиться максимальной точности и убедиться, что каждое решение отточено до мелочей.


Да, бенчмарков пока не так много, но то, что DeepSeek-Math-V2 реально решает задачи на уровне лучших математических умов — это уже факт. И пусть стоимость такого решения скрыта, очевидно, что за ней стоят серьезные инвестиции.

Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3🐳1