Техножрица 👩‍💻👩‍🏫👩‍🔧 – Telegram
Техножрица 👩‍💻👩‍🏫👩‍🔧
13.9K subscribers
1.42K photos
64 videos
28 files
756 links
Люблю высокие технологии и кушать.

Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.
Download Telegram
Уникальные эксклюзивные лайфхаки для любимых подписчиков в честь вечера пятницы. Берите на заметку! 🧠

#генерация
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
66😁32126🔥5💩55🌚31👍1
Forwarded from Kali Novskaya
🌸Чтение AGI 2025🌸
#nlp #про_nlp #nlp_papers #agi_russia

Поездка в Исландию была супер!

Завершился AGI-25, и мне впервые выпало открывать keynote'ом такую большую и близкую моим стремлениям конференцию.

Мой доклад вы можете посмотреть вот тут: я рассказываю про методологию науки и зрелость ИИ-агентов для акселерации науки в 2025. (В комментариях к посту даже запилили нейроперевод на русский)

Прелесть AGI-conf — в мультидисциплинарности: тут и символьные методы, и графовые нейронки, и вычисления на живых клетках, RL и робототехника, и всегда — философские вопросы  самосознания и ИИ.

Поэтому, если вам надоело читать про один только скейлинг трансформеров, то вот список работ, которые интересно почитать, чтобы расширить свой кругозор:

🟣Статья Stop treating ‘AGI’ as the north-star goal of AI research — отличный методологический обзор текущих проблем в индустриальном стремлении поскорее достичь сильного ИИ: хакинг метрик, однообразие подходов и т.д.

🟣Вычисления на реальных клетках нейронов — гораздо ближе к пределу Ландауера, чем чипы. Две работы ниже — основополагающие принципы для таких вычислений и общий обзор МЛ-моделей, вдохновленных принципами из нейронауки.
Mortal Computation: A Foundation for Biomimetic Intelligence
A Review of Neuroscience-Inspired Machine Learning

🟣Последний вижн Ричарда Саттона, отца RL, — The Oak Architecture: A Vision of SuperIntelligence. Общей статьи еще нет, нужно смотреть лекцию.

🟣How to build conscious machines — диссертация с очень неплохим обзором проблем вокруг определения сознания и его переносимости в computer science, theory of mind, и ML-экспериментов вокруг них.

🟣Последние работы Бена Герцеля — или что сейчас происходит в символьных методах. PLN and NARS Often Yield Similar strength  confidence Given Highly Uncertain Term Probabilities — работа про Probabilistic Logic Networks (PLN) and the Non-Axiomatic Reasoning System (NARS) (и собственно их сравнение). Сюда же фреймворк OpenCog Hyperon
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3416👍5💩22🥰11
ИИКС НИЯУ МИФИ
Когда не стоит доверять ML-моделям? Актуальный разбор от автора научных статей в области интерпретируемости LLM, старшего академического консультанта Huawei Лаиды Кушнаревой, автора канала @tech_priestess 🪐 16 августа 14:30-15:30, Студенческий офис НИЯУ…
Ссылка на трансляцию, начало через 8 минут:

https://vk.com/video-54277047_456239311

UPD: https://docs.google.com/presentation/d/1GCVu5p8m1gdW1ye2iKUOBTggA9uhzMUNXUbUw5a8ZfQ/edit?usp=sharing - презентация с кликабельными ссылками для тех, кто хочет лучше разобраться в источниках, которые я использовала для своего доклада.
UPD 2: Запись доклада можно посмотреть по той же ссылке, по которой шла трансляция. К сожалению, в самом начале записи звук пропадает, но затем успешно возвращается где-то на третьей минуте.
147🍌16👍83🤡111
Давно собирались, но как то не собрались обсудить, как дорожную карту регенеративной медицины, так и дорожные карты по борьбе со старением в принципе. Я даже презентацию подготовил. Но народу записалось мало, а дел было много и как-то отложилось.

А здесь Техножрица увидел в карте компромат, да, вообще, увидела много компромата.

Со своей стороны я уверен, что ей кажется и она неправильно интерпретирует, как саму карту, так и мое взаимодействие с одним из её авторов — Паоло Маккиарини. Мне удалось уговорить Техножрицу прийти в воскресенье в 20:00 по Мск в наш добрый зум и задать «острые» вопросы. Вообще, считаю, если кого то в чем то обвиняешь, сначала его выслушать. Может ты сам что-то не знаешь или чего то не понимаешь.

Короче зум. 17 августа.

Дорожная карта регенеративной медицины

☎️ Ссылка в Zoom

+ Google Calendar
👍33😁211364
Пока мы ждем записи зума (возможно, с суммаризацией обсуждения) от Михаила, предлагаю обсудить научный уровень статьи Паоло Маккиарини 2011 года про пересадку искусственного каркаса трахеи, заселённого клетками пациента: https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(11)61715-7/fulltext .
UmKa пишет, что низкий научный уровень работы очевиден для специалистов с биологическим образованием. Однако, поскольку у меня такого образования нет, я сама могу разбираться только в уже опубликованной критике статей на Retraction Watch, когда уже разобраны конкретные ошибки или показано где конкретно был подлог. Самостоятельно понять, насколько работа правдоподобна или насколько заметны проблемы в ней специалистам без дополнительных комментариев и указаний, мне тяжело.
Однако, в связи с разгоревшимся обсуждением, в канал пришли новые люди, в том числе и как раз с нужным бэкграундом и образованием. Поэтому было бы услышать мнение насчет научного уровня этой статьи медиков и биологов, особенно работавших с клеточными культурами.

В комментариях просьба указать:
а) ваше образование и над чем работали/работаете из связанных областей;
б) развернутое мнение о статье, анализ правдоподобности результатов и то, насколько хорошо они подтверждаются теми графиками и картинками, которые привели авторы.

Просьба разбирать именно саму статью, а не сторонние ресурсы, где она обсуждается.

#наука #научная_поллюция #срач
👍212197🤡7👎3💩1🥴11
#дед_инсайд #ля_ты_крыса

Привет, коллега!

Вот уже две недели с интересом наблюдаю за дискуссией между Техножрицей (она же Лаида Кушнарева) и Михаилом Батиным. Началось всё с longevity, а закончилось обсуждением хирурга Паоло Маккиарини, которого мы уже вспоминали на этом канале.

Основные ссылки для ознакомления с лором здесь:
https://news.1rj.ru/str/tech_priestess/2258
https://news.1rj.ru/str/tech_priestess/2259
https://news.1rj.ru/str/tech_priestess/2261
https://news.1rj.ru/str/tech_priestess/2262
https://news.1rj.ru/str/transposables/1419

Если кратко, то суть дискуссии в том, что благодаря Михаилу Батину в 2010 году Паоло Маккиарини оказался в России и даже провёл несколько операций по пересадке искусственно выращенной трахеи. В то время ещё не было известно о фабрикации данных и гибели пациентов в Швеции, поэтому обвинять Михаила в самых страшных грехах я бы не стала. Но если незнание закона не освобождает от ответственности, можно ли считать, что незнание о подделке данных освобождает? Например, если мои студенты тайком сфальсифицировали результат, и я написала бы и опубликовала нашу общую работу первым или последним автором, то отвечала бы я своей репутацией за это? В научном мире вообще-то да.

Но ладно, кто я такая чтобы задавать нормы морали, пост вообще не об этом. Вчера Техножрица предложила интересную задачку: посмотреть на известную статью Маккиарини в The Lancet и оставить своё мнение о её научном уровне. Последние 7,5 лет я работала в области регенеративной медицины и занималась восстановлением суставного хряща, в том числе растила в пробирке тканеинженерные конструкты, так что попробую справиться с трахеей.

Сразу дисклеймер: я бы хотела полностью абстрагироваться от того, что знаю про эту работу, но надпись RETRACTED на фоне не сильно этому способствует, поэтому полностью непредвзятого мнения не получится. На первый взгляд я не нашла явных фотожаб на картинках или каких-то признаков их фальсификации (что в целом не мешает, например, графикам быть полностью выдуманными), поэтому разбирая статью, я подразумеваю, что верю всем данным и придираюсь исключительно к дизайну и интерпретации.

Также я не претендую на роль эксперта, в отличие от тех, кто разбирал работы Маккиарини прежде чем допускать его к пациентам в России (разбирал же, да? *Падме*), просто пишу свои соображения на основании опыта и весьма поверхностного гуглежа отдельных фактов. Кстати, привожу статьи не моложе 2010 года, а то не честно получилось бы, но и про современное состояние проблемы тоже иногда с оговорочкой пишу.

Пост получился большой, так что прочитать его можно в телеграф по ссылке.
511410👍5😁4🔥3🥰21
АДовый рисёрч
#дед_инсайд #ля_ты_крыса Привет, коллега! Вот уже две недели с интересом наблюдаю за дискуссией между Техножрицей (она же Лаида Кушнарева) и Михаилом Батиным. Началось всё с longevity, а закончилось обсуждением хирурга Паоло Маккиарини, которого мы уже…
Добавлю сюда замечание: самую первую пациентку в России всё-таки прооперировали до того, как вышла эта статья, и использовав каркас донорской трахеи, а не искусственный, как в этой статье. Для справки. #срач
23🥰87👍43
Forwarded from quant barbie
86😁4214💯10🤡4💩321
Forwarded from optorepost
Видео про AlphaGeometry (модель, решающая олимпиадные задачи по геометрии). Упор делается на историческое развитие подходов к автоматическому решению геометрических задач с помощью компьютера. Как эти подходы развивались, и как они достигли вершин с приходом DeepMind и LLM.

https://youtu.be/4NlrfOl0l8U
32🔥211
Интересная критика SWE-bench Verified и результатов, полученных на нем, в трёх частях:

https://news.1rj.ru/str/gkorc/439
https://news.1rj.ru/str/gkorc/440
https://news.1rj.ru/str/gkorc/441

Для затравки процитирую первый пост из серии, чтобы стало понятно, о чем речь:

...есть такой бенчмарк — SWE-bench-verified (https://openai.com/index/introducing-swe-bench-verified/), который проверяет, как модели в агентном режиме способны фиксить баги в реальных больших open-source репозиториях. Разумеется, и Google, и Anthropic, и OpenAI публикуют скоры своих моделей на SWE-bench. На данный момент фигурируют такие числа:
OpenAI GPT-5: 74.9%
Anthropic Opus 4.1: 74.5% 📊

Казалось бы, всё очевидно и понятно — кто лучше, кто хуже. Но твиттер кипит: OpenAI проверяют свою модель не на всех 500 задачах, а на 477! И значит, «реальный» результат GPT-5 — 71%!
Это отчасти правда: OpenAI действительно не проверяли модель на всём наборе. И это действительно обесценивает сравнение, потому что мы сопоставляем тёплое с мягким, ведь мы не знаем, как GPT-5 повела бы себя на 23 непокрытых задачах.

Я решил разобраться в вопросе и копнуть глубже, чтобы понять, какие метрики были бы «справедливыми». К счастью, мне не пришлось прогонять бенчмарк руками: есть компания Epoch.AI, которая независимо прогоняет SWE-bench-verified на всех 500 задачах и публикует скоры для каждой модели. По её замерам GPT-5 набирает 59%, а Opus 4.1 — 63%. Помимо итоговых метрик Epoch.AI выложила логи запусков каждой модели на каждой задаче, и можно глазами отследить, что происходило. Разница с официальными числами некислая, к тому же Opus вырвался вперед. Тут явно что-то нечисто, поэтому я спарсил данные с их сайта и сделал небольшой анализ...


Продолжение, как говорится, читать в источнике 😈

#хозяйке_на_заметку #бенчмарки
Please open Telegram to view this post
VIEW IN TELEGRAM
359🔥8👍5👎21
Прошло уже пять дней с зума с Батиным, но обещанную запись до сих пор никто так и не выложил. Поэтому я позволю себе самостоятельно прорезюмировать два самых важных пункта дискуссии своими словами.

1. Насчет карты регенеративной медицины была получена противоречивая информация: с одной стороны, Михаил утверждает, что она сделана с целью рекламы для инвесторов, и рассматривать ее следует именно в таком контексте. С другой стороны, по его мнению, карта все равно обладает предсказательной силой, потому что некоторые направления, которые на ней описаны, существенно развились и достигли успехов где-то между 2010 и 2025. Я с такой логикой, конечно, не согласна: если написать на бумаге кучу разных научных направлений в рамках одной области, то что-то из них в любом случае да разовьется за следующие 15 лет. Предсказательная сила тут примерно как у алгоритма бинарной классификации, который на все примеры предсказывает метку True: если хоть какое-то количество примеров с такой меткой попадется в датасете, accuracy будет больше нуля. Ну да ладно, судя по словам самого Михаила, подобными дорожными картами все равно никто не пользуется - в начале зума была как раз маленькая историческая справка про "дорожные карты" научных областей в целом, на тридцать секунд или одну минуту (по моим воспоминаниям, где-то на час), в которой, в числе прочего, об этом рассказывалось.

Далее обсуждалось что делать с этой картой. Мне понравились два высказанных предложения:
а) для ленивых: сделать сноску на сайте, что карта является историческим документом, и фонд с такого-то года больше не сотрудничает с Маккиарини и осуждает его деятельность (дальше можно дать ссылку на разоблачение, например);
б) для трудолюбивых: переделать всю карту с новыми авторами. Правда, цель такого труда опять же не очень понятна, если картами никто не пользуется.

#срач
😁3115115👍411