Техножрица 👩‍💻👩‍🏫👩‍🔧 – Telegram
Техножрица 👩‍💻👩‍🏫👩‍🔧
13.9K subscribers
1.41K photos
64 videos
28 files
755 links
Люблю высокие технологии и кушать.

Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.
Download Telegram
Прошло уже пять дней с зума с Батиным, но обещанную запись до сих пор никто так и не выложил. Поэтому я позволю себе самостоятельно прорезюмировать два самых важных пункта дискуссии своими словами.

1. Насчет карты регенеративной медицины была получена противоречивая информация: с одной стороны, Михаил утверждает, что она сделана с целью рекламы для инвесторов, и рассматривать ее следует именно в таком контексте. С другой стороны, по его мнению, карта все равно обладает предсказательной силой, потому что некоторые направления, которые на ней описаны, существенно развились и достигли успехов где-то между 2010 и 2025. Я с такой логикой, конечно, не согласна: если написать на бумаге кучу разных научных направлений в рамках одной области, то что-то из них в любом случае да разовьется за следующие 15 лет. Предсказательная сила тут примерно как у алгоритма бинарной классификации, который на все примеры предсказывает метку True: если хоть какое-то количество примеров с такой меткой попадется в датасете, accuracy будет больше нуля. Ну да ладно, судя по словам самого Михаила, подобными дорожными картами все равно никто не пользуется - в начале зума была как раз маленькая историческая справка про "дорожные карты" научных областей в целом, на тридцать секунд или одну минуту (по моим воспоминаниям, где-то на час), в которой, в числе прочего, об этом рассказывалось.

Далее обсуждалось что делать с этой картой. Мне понравились два высказанных предложения:
а) для ленивых: сделать сноску на сайте, что карта является историческим документом, и фонд с такого-то года больше не сотрудничает с Маккиарини и осуждает его деятельность (дальше можно дать ссылку на разоблачение, например);
б) для трудолюбивых: переделать всю карту с новыми авторами. Правда, цель такого труда опять же не очень понятна, если картами никто не пользуется.

#срач
😁3115115👍411
2. Насчет сотрудничества фонда Батина "Наука за продление жизни" и Паоло Маккиарини: Михаил утверждает, что вскоре после того, как они с Еленой Кокуриной выбили Маккиарини первый мегагрант в 2011 году, он сам перестал принимать какое-либо участие в последующих событиях и улетел в США, а Елена перестала работать в фонде и стала сотрудницей центра регенеративной медицины (если я правильно поняла). После этого фонд уже не мог контролировать расходование средств и участвовать в планировании исследований. Также Батин сказал, что был против экспериментов с пластиковой трахеей на людях до клинических испытаний на животных, и грант, собственно, тоже выбивал исключительно с целью экспериментов на животных.

После уезда в США, Михаилу, по его же словам, было настолько неприятно и неинтересно все, что происходило дальше, что он не читал книгу Елены "Мегагрант" (в которой он сам упоминается много раз!) и не интересовался, сколько именно пациентов погибло от рук Маккиарини в РФ в итоге. Впрочем, мы можем посчитать нижнюю границу сами.
В данном отчете: https://www.clinicaltrials.gov/study/NCT01997437?tab=results говорится, что на базе международного центра регенеративной медицины при КубГМУ (основанного на мегагрант) искусственная трахея была вставлена 6 пациентам. Если прибавить сюда самую первую пациентку в РФ, которая была прооперирована вне этого центра и получила не пластиковую трахею, а обесклеченный каркас донорской трахеи, засеянный собственными стволовыми клетками, то получается, что всего в РФ Маккиарини было прооперировано 7 человек (см. также https://web.archive.org/web/20170808235310/http://alla-astakhova.ru/tot-kto-zadal-vopros/ ). Имена пяти из этих семи человек даже известны нам из книги Кокуриной "Мегагрант": Жадыра Игликова, Юлия Туулик, Александр Зозуля, Садик Канаан (мертвы), Дмитрий Оногда (выжил после удаления искусственного органа). Таким образом, четверо пациентов точно погибли. Больше официальных документов по экспериментам Маккиарини в РФ для дополнительной информации можно почитать здесь: https://www.circare.org/info/pm/macchindex.htm#krasnodar .

Действительно ли Елена Кокурина перестала работать в фонде Батина после получения мегагранта, разобраться сложно, так как она сама ничего про это не говорила, и на различных сайтах ее продолжали представлять то как "эксперта", то как "вице-президента" фонда даже через годы после описанных событий. Тем не менее, зная, что журналисты часто путаются в регалиях, я приму утверждение Батина как рабочую гипотезу и добавлю в предыдущие посты соответствующие поправки и ссылку на этот пост.

Какие из этого всего можно сделать выводы?

1. Мои утверждения о том, что сам Батин или его фонд продолжали поддерживать Маккиарини вплоть до 2014 года, не подтвердились; я добавлю соответствующее пояснение к своим старым постам с обвинениями.
2. Слова Михаила о том, что он вообще не интересовался тем, что случилось после того, как он помог данной личности обосноваться в РФ, получить мегагрант на 150 млн рублей и знать не хотел, каковы были последствия всего этого, меня сильно удивили. В это не очень легко поверить, но других данных по этому поводу у меня нет, поэтому придется принять его версию как рабочую. Жаль, конечно что когда Батин понял, что методика Маккиарини с пластиковыми трахеями не работает, он не стал пользоваться своей медийностью и публично его разоблачать, чтобы предостеречь других людей от сотрудничества с ним, а вместо этого просто отгородился от ситуации и стал игнорировать все дальнейшие события, но сделанного не вернешь.

#срач
29189👍8🤡4😢2
Так что в следующих постах я хочу отойти от обсуждения Батина и описать, какие в целом размышления на тему Scientific Integrity у меня вызвал этот срач, а также поделиться полезными ресурсами на эту тему, которые помогут читателям следить не только за научными "открытиями", но и за научными "закрытиями", что, как мы видим, не менее важно. И напоследок напомню, что среди так называемых "научных звезд" с любым опытом работы и любым размером Хирша встречаются любители строить карьеру на обмане в научных статьях (см. https://news.1rj.ru/str/tech_priestess/1795 ). Поэтому экстраординарные инновационные методики лечения чего угодно требуют экстраординарных доказательств, не важно, кто их предлагает. А если уж ошибся, по незнанию поддержав мошенника, то лучше признавать ошибку и публично высказывать свою изменившуюся позицию по вопросу как можно раньше.

#срач
48👀83💯2😱1
https://youtu.be/pQqTQx9QhAo?si=5dKAOZGj6_mQ-CiD - наконец-то выложен тот самый четырёхчасовой зум Михаила Батина с хейтерами (то есть со мной, а также немного с Пензаром, Умкой и другими).
Все, кому не жалко укоротить свою жизнь на четыре часа, могут ознакомиться.

#срач
😁3514👀976💩2🤡2👍1🔥1
Обдумывая будущий пост про scientific integrity, я хотела начать его с того, что одной из главных целей своей жизни я полагаю стремление к познанию объективной реальности и её закономерностей - в первую очередь, средствами, которая дает нам для этого наука. Но запнулась на мысли о том, что эта фраза опять вызовет жуткий вой и, возможно, даже обвинения меня в тупости и невежестве 🤦‍♀️🤦‍♀️🤦‍♀️ (как уже бывало раньше). И мне стало интересно: а что именно в таком целеполагании вызывает у вас бугурт, господа хейтеры? То, что я верю в то, что объективная реальность существует и познаваема (или, по крайней мере, принимаю это в качестве рабочей гипотезы)? Но ведь эта позиция является классической и исторически преобладающей в философии науки. Что в этом "тупого" и что конкретно вызывает такую агрессию?

#о_себе
6518👍6👌6🔥5💩3😁2🎄11
Итак, небольшой ликбез по "научным закрытиям" - то есть, опровержениям и "отмене" научных исследований, которые на поверку оказались ошибочными или содержали подтасовки, а также список ресурсов, из которых можно об этих "закрытиях" узнавать.



В идеале заведомо ошибочные или недобросовестные научные статьи должны отсекаться ещё на этапе рецензирования, но из-за несовершенства системы это удаётся сделать далеко не всегда. Бывает и так, что серьёзные ошибки или фальсификации выявляются уже после публикации, и тогда уважающий себя научный журнал отзывает такой материал (это называется "ретракция", фактически "отмена" статьи). После этого публикация больше не считается действительной и не учитывается в наукометрии. Сам текст статьи, как правило, остаётся доступен на сайте, но сверху на него добавляют большой штамп со словами "RETRACTED", "WITHDRAWN", "WRONG PROOF", "WRONG DATA" и т.п.

Также случается, что статьи отзывают не из-за фактических ошибок или подтасовок, а из-за нарушения других принципов scientific integrity (научной добросовестности), например, плагиата или отсутствия добровольного информированного согласия пациентов на эксперимент. К сожалению, редакция журнала не всегда дает подробное объяснение того, почему именно статью отозвали, а ведь знать причины может быть важно, чтобы сделать правильные выводы. Однако, существует ряд ресурсов, которые систематически разбирают причины ретракций, а также указывают на ошибки и подтасовки в ещё не отозванных статьях:

1️⃣ Retraction Watch ( https://retractionwatch.com/ ) - пожалуй, самый известный блог на тему научных скандалов и ретракций, основанный научными журналистами Ivan Oransky и Adam Marcus. Кроме блога, авторы создали некоммерческую организацию под названием Center for Scientific Integrity и базу данных отозванных статей. В этой базе описана информация о том, где, когда и кем была опубликована каждая статья + краткие причины её отзыва. Любители анализа данных могут скачать её здесь: https://gitlab.com/crossref/retraction-watch-data/-/blob/main/retraction_watch.csv и посчитать по ней какие-нибудь интересные статистики.
2️⃣ Data Colada ( https://datacolada.org/ ) - блог, занимающийся выявлением статистических аномалий в данных из научных экспериментов - в основном, по behavioural science, - с целью разоблачений подтасовок. Пример - их анализ экспериментов печально известной Франчески Джино: https://datacolada.org/118 . Также ребята занимаются обнаружением p-hacking и других методологических проблем в исследованиях.
3️⃣ For Better Science ( https://forbetterscience.com/ ) - блог научного журналиста Leonid Schneider. Публикует журналистские расследования, как правило, связанные с научными скандалами в области медицины и биологии.
4️⃣ Science Integrity Digest ( https://scienceintegritydigest.com/ ) - блог микробиолога Elisabeth Bik с выявлением подлога в научных статьях, в основном, снова по биологии и медицине. Тут надо пояснить, что в таких статьях фотографии - например, клеток под микроскопом или результатов спектроскопии - нередко используются в качестве важного подтверждения правильности выводов. Так вот, Элизабет специализируется на выявлении фальсификаций в подобных изображениях - например, копипасты или следов использования фотошопа.
5️⃣ PubPeer ( https://pubpeer.com/ ) - ресурс, на котором можно рецензировать научные статьи пост-фактум уже после публикации, находить и анонимно описывать найденные в них ошибки и махинации. В основном посвящен статьям по биологии, медицине, но также рассматриваются статьи и по другим естественным наукам.

Что же касается моей научной области ( AI / ML / DL ), тут с отслеживанием ретракций всё сложно: специальных блогов на эту тему я не находила, да и сами ретракции случаются редко и проходят почти незамеченными. Максимум - где-нибудь в Proceedings появится пометка "withdrawn", да на https://openreview.net/ повезет найти обсуждение, из которого понятно, что пошло не так. И то не всегда: часть таких дискуссий остаётся закрытой. Надеюсь, эта ситуация улучшится в будущем.

#академический_ликбез #наука
68👍2397👏1🎉1🤝11
Ключевые различия между мозгом и LLM

В последнее время я довольно часто вижу споры о сходстве ИИ с биологическим мозгом, порой подогреваемые научно-популярными пересказами статей про "удивительные параллели между мозгом и нейросетями". Однако, без понимания основ того, чем биологический мозг и искусственная нейросеть принципиально отличаются друг от друга, невозможно трезво судить и о том, в чём они действительно похожи. Конечно, для многих читателей эти основы хорошо известны, но, учитывая разнообразие аудитории, думаю, кому-то их разбор будет полезен.

1️⃣ Биологический нейрон - это полноценная живая клетка, которая обрабатывает и передаёт информацию с помощью сложных биохимических процессов. В отличие от нее, искусственный "нейрон" в LLM реализует простую математическую операцию: на вход он принимает набор чисел, затем умножает каждое на свой коэффициент, складывает результаты и пропускает полученное число через функцию активации f (три популярных варианта такой функции показаны на рис. 1). В итоге, искусственный нейрон считает значение f(a₁x₁ + a₂x₂ + ... + aₙxₙ + b), где x₁, x₂, ... , xₙ - числа, пришедшие на вход и a₁, a₂, ... , aₙ, b - веса, настроенные в процессе обучения, а затем передает это значение дальше, на вход другим нейронам (см. рис. 2). Таким образом, искусственный нейрон тоже принимает и передает информацию, но делает это по простому алгоритму.
2️⃣ Работа нейронов в биологическом мозге регулируется множеством нейромедиаторов (дофамин, серотонин и др.), которые меняют их режим работы - например, заставляют их легче возбуждаться или сильнее тормозиться в зависимости от ситуации. В LLM прямых аналогов нейромедиаторов нет, хотя есть механизмы вроде dropout и layer normalization, которые в некотором смысле управляют активностью нейронов.
3️⃣ Биологические нейроны получают и посылают импульсы асинхронно, в произвольные моменты времени. Искусственные нейроны в LLM организованы в группы - слои (матрицы Query, Key, Value в механизме внимания тоже можно условно назвать "слоями"). Все элементы каждого слоя активируются одновременно - именно поэтому при обсуждении современных нейросетей чаще говорят о слоях или матрицах весов, чем об отдельных нейронах. А еще эта синхронность позволяет свести вычисления активаций к операциям над матрицами, что позволяет делать быстрые расчеты на видеокартах и NPU.
4️⃣ Биологические нейроны функционируют непрерывно, даже когда человек или животное спит. Искусственные нейроны в LLM активируются дискретно - только тогда, когда нужно сгенерировать новый токен. Если в качестве мысленного эксперимента представить у LLM наличие какой-то формы "сознания", такое "сознание" существовало бы лишь в краткие мгновения генерации токенов, исчезая между ними - что принципиально отличается от "непрерывного" сознания, которым обладает человек.
5️⃣ Биологические нейроны в мозгу способны образовывать новые синаптические связи в течение всей жизни. В LLM же архитектура связей фиксирована: каждый нейрон может получать сигналы только от заранее заданного набора предыдущих нейронов. На этапе обучения веса существующих связей (числа a₁, a₂, ... , aₙ), конечно, меняются, но новые связи самопроизвольно появиться не могут.
6️⃣ Биологический мозг учится и перестраивается непрерывно. LLM же после обучения "замораживается" - все веса фиксируются. После этого "память" LLM об общении с каждым пользователем ограничивается контекстом текущего диалога. Что касается "постоянной памяти" в ChatGPT, которая сохраняется между диалогами - по всей видимости, она хранится во внешнем хранилище, содержимое которого просто заново подаётся модели на вход при новом разговоре. Реальная интеграция новых знаний в веса ChatGPT происходит только тогда, когда OpenAI собирают достаточно новых данных, обучают на них новую версию модели и заменяют ею предыдущую.

Возможно, будущие архитектуры ИИ смогут преодолеть какие-то из перечисленных ограничений, но пока что различия фундаментальны. Это не делает сравнения искусственных и биологических нейросетей бесполезными, но заставляет быть аккуратнее с аналогиями и антропоморфизацией. #ликбез
1011450🏆17👍15❤‍🔥9👎5🔥3💩2🥱222
Forwarded from Kedr to Earth | Земля, я Кедр ( Yuri Ammosov)
Сегодня все написали "Айтишники в Сан-Франциско устраивают оргии!" И только я, по жизни погруженный в жизнь и быт этой среды на уровень глубже, заподозрил линкбайт, а за линкбайтом - нечто уже не новое. Пошел на Business Insider. Внимательно прочел статью. И нашел именно то, что искал - и именно ту, кого искал!

"It's really freeing in some ways," Aella, a fetish researcher and sex worker in the San Francisco Bay Area with a cult following on X, tells me of her concerns about AI development. "I like throwing weird orgies, and I'm like — well, we're going to die. What's a weirder, more intense, crazier orgy we can do? Just do it now."


https://www.businessinsider.com/ai-apocalypse-super-preppers-smart-hot-drugs-bunkers-economic-crash-2025-8

А знаете, кто эта "Эллочка"-хайпоедка? Это та самая докладчица с конгресса "Рационалистов", о которой я писал тут - https://news.1rj.ru/str/kedr2earth/12061 - и которая для половины "Рационалистов" единственный сексуальный партнер по жизни раз в год.

И оргия та была у Эллочки на безник больше года назад. С тех пор она всюду бегает и ею хвастается.

https://aella.substack.com/p/my-birthday-gangbang

Конечно, день, когда США декриминализует секс-услуги на федеральном уровне, станет в Силиконовой долине профессиональным праздником.
😁3315💩542👍11
Давно хотела поделиться с подписчиками каким-нибудь прикольным курсом по критическому мышлению или методологии научных исследований, но долгое время не попадалось на глаза ничего годного. Пару недель назад я всё-таки натолкнулась на очень интересный, хоть и очень специфический курс от Йельского Университета - Understanding Medical Research: Your Facebook Friend is Wrong ( https://www.coursera.org/learn/medical-research/ ). Курс состоит из видеолекций, материалов для чтения и большого количества тестов для самопроверки, которые помогают не забыть, о чем была лекция, через пять минут после ее окончания. Доступ ко всем материалам бесплатный; платить надо только если вы (зачем-то) захотите сертификат об окончании. Лекции (без тестов и доп.материалов) также доступны в виде плейлиста на ютубе: https://www.youtube.com/playlist?list=PLh9mgdi4rNewVyTec_MVGxIbNSEeMhEsZ . Для полноценного понимания того, о чём говорит лектор, предварительное медицинское образование не требуется: всё рассчитано на достаточно широкую аудиторию.

Состоит курс из следующих частей:
➡️ The Basics: как делаются научные исследования в области медицины, что такое кризис воспроизводимости, как корректно ставить исследовательские вопросы чтобы избежать расплывчатых результатов и ненамеренной подгонки.
➡️ Medical Statistics Made Ridiculously Simple: основы математической статистики, объяснения того, что такое стат.значимость и как это все используется в мед.исследованиях.
➡️ Types of Medical Studies: какие виды мед.исследований существуют (спойлер: не только двойные слепые, case study и мета-анализ).
➡️ How Wrong Conclusions Are Reached: как понять, в каких случаях за корреляцией действительно скрывается причинно-следственная связь, а в каких - нет, как распознавать скрытые переменные, влияющие на исход эксперимента, что такое p-hacking.
➡️ Bias: разбираются систематические ошибки, связанные с перекосом составов участников экспериментов и ошибками измерения. Также в этой главе разбираются занимательные статистические парадоксы.
➡️ Fixing the Problems with Medical Studies: какими методами корректируют систематические ошибки в медицинских исследованиях.

Несмотря на то, что весь курс посвящен исследованиям в одной научной области (медицине), разобранные в нем примеры неплохо раскрывают основы научной методологии, общей для всех экспериментальных наук и учат тому, как применять критическое мышление при разборе научных статей в целом. Обаятельный профессор, излучающий Big Hirsch Energy в радиусе поражения атомной бомбы (только гляньте на его страницу в Google Scholar - https://scholar.google.com/citations?user=iB9er1AAAAAJ&hl=en !), подробно и строго объясняет, как отличать сигнал от шума в потоке "научных сенсаций" на практике, что лично мне кажется более полезным, чем абстрактные разговоры о критическом мышлении. Чел реально думает как ученый и учит этому нас своим вдохновляющим примером - при чем, как мы все любим, за ноль рублей. 😉😉😉

#учебные_материалы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9840🔥23127💩3❤‍🔥22
Повторила эксперимент двухгодичной давности ( https://news.1rj.ru/str/tech_priestess/979 ) по генерации мемов про разные разделы математики, но на этот раз c генератором картинок, вызываемым ChatGPT-5-Thinking. Промпты задавались как "Draw funny meme about ... (e.g. differential geometry)". Технически этот генератор картинок конечно, превосходит старенький DALLE-2, да и thinking модель, судя по всему, очень старательно подбирает для него промпты, но из-за этого некоторая часть всратого очарования былых нейромемов уходит в прошлое, и это немного грустно.

#генерации
👍30💩1699🔥53🤡22😁1
Так-то лучше! Достаточно было всего лишь выключить поле Геллера перед генерацией картинок 😈😈😈

#генерации
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5139🔥3929❤‍🔥15😁1082🤮2💩1🥴11