Sberloga – Telegram
Sberloga
2.49K subscribers
216 photos
34 videos
7 files
255 links
Data Сообщество
По всем вопросам обращаться @SberlogaHelperBot
Чат - @sberlogadataclub
Download Telegram
🚀 @SBERLOGA онлайн доклад по биоинформатике:
👨‍🔬 В. А. Шитов (СибГМУ): "Инструменты для понимания межклеточных взаимодействий по данным SC RNA-Seq"
⌚️ Четверг 2 сентября, 19.00 по Москве

Методы Single Cell RNA-Seq позволяют изучать ткани на масштабе отдельных клеток. Обычно, они используются для понимания клеточных типов и их путей дифференцировки. В последнее время появляются методы, которые позволяют извлечь ещё больше информации из данных транскриптомики единичных клеток. Например, понять как клетки взаимодействуют друг с другом. Я расскажу о существующих инструментах для понимания межклеточных взаимодействий, принципах их работы, сходствах и различиях. А также о своём небольшом проекте по созданию единого интерфейса для разных программ, решающих эту задачу.

Статьи:
CellPhoneDB: https://www.nature.com/articles/s41596-020-0292-x
CellChat: https://www.nature.com/articles/s41467-021-21246-9
CellCall: https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab638/6332819

Презентация: https://docs.google.com/presentation/d/1apcFiHPh4vlKiIO7RELs5XKh6q-uZaUhYj1X9sLOtj8/edit?usp=sharing

PS
Ссылка на зум будет доступна через тг чат https://news.1rj.ru/str/sberlogabio ближе к началу доклада.
Видео записи докладов доступны на ютуб канале SBERLOGA https://www.youtube.com/c/sberloga
git_hooks_is_all_you_need.pptx
3.7 MB
🚀 @SBERLOGA
👨‍🔬 Дани Эль-Айясс: «Git hooks is all you need»
⌚️ Четверг 9 сентября, 19.00 по Москве

Git Hooks — это полезный инструмент в арсенале каждого программиста, который помогает как в автоматизации рутинных вещей, так и решении определенных проблем, возникающих при разработке.

В рамках работы над проектом всегда хочется, чтобы код был читаемым, соответствовал определенным стандартам, работал корректно и не падал на тестах, и для достижения этого, большую роль играют такие вещи, как средства форматирования кода, статические анализаторы, линтеры, запуск тестов, и т.д.

Все это отнимает время, но не тогда, когда есть настроенные Git Hooks!

Ссылка на репозиторий:
https://github.com/dayyass/git_hooks_is_all_you_need

Ссылка на зум будет доступна через тг чат
https://news.1rj.ru/str/sberlogadataclub ближе к началу доклада.

Видео записи докладов доступны на ютуб канале SBERLOGA
https://www.youtube.com/c/sberloga
🚀 @SBERLOGA продолжает серию онлайн докладов посвященных АльфаФолд и темам вокруг него:
👨‍🔬 к.б.н А. Залевский (ИБХ РАН) и Д. Иванков (Сколково) расскажут о своих новых работах по АльфаФолду
⌚️ Пятница 8 октября, 19.00 по Москве

Дмитрий расскажет о том, что АльфаФолд не годится для предсказания изменения стабильности и изменения функциональности белка вследствие мутации.
https://www.biorxiv.org/content/10.1101/2021.09.19.460937v1

Артур расскажет дайджест обзора основных вопросов о АльфаФолде: полнота предсказаний, предсказания нативно неструктурированных регионов, предсказания димеров, пригодность для криоЭМ и множество других занятных наблюдений:
https://www.biorxiv.org/content/10.1101/2021.09.26.461876v1

PS
Ссылка на зум будет доступна через тг чат https://news.1rj.ru/str/sberlogabio ближе к началу доклада.
Видео записи докладов доступны на ютуб канале SBERLOGA https://www.youtube.com/c/sberloga
https://news.1rj.ru/str/AI_meetups/506
Вебинар по использованию ML Space в SberCloud
Сам им не пользовался, однако не так давно был на демо и был приятно удивлен. Ребята сделали крутой продукт и с точки зрения функционала и удобства. Так то всегда есть колаб или кагл чтобы позапускать свои мл модельки, но если речь касается командной работы или вывода модели в пром то я думаю много датасаентистов сталкивались с разными "сложностями" 🤪

В общем представляю:
Бесплатный Вебинар ML Space на базе инструментов Intel oneAPI для всех желающих.
На вебинаре вы узнаете:
— подробности об инструментах Intel® oneAPI;
— сценарии применения этих инструментов для построения ML-моделей;
— как получить бесплатный доступ к инструментам на платформе ML Space.
Вебинар будет полезен всем, кто интересуется data science.
Регистрируйтесь по ссылке.

Вебинар пройдёт — 14 октября 2021, четверг, 12:00
🚀 @SBERLOGA представляет онлайн доклад :
👨‍🔬 Антон Костин (МФТИ) "Биология на графах. Графы 'взаимодействия' генов на основе NLP анализа текстов."
⌚️ Пятница 15 октября, 18.00 по Москве

Рассмотрим корпус биологических текстов по определенной тематике - болезнь Альцгеймера , глиобластома и тд.
Обучим NLP модель (типа word2vec или более продвинутые) на выбранном корпусе.
Возьмем список интересующих нас терминов - например генов.
Рассмотрим эмбединги генов, которые получены данной моделью, построим по ним граф близости.
После этого мы можем анализировать данный граф и пытаться понять насколько он отражает биологическую информацию.
Насколько он зависит от корпуса текстов, насколько кластеры биологически осмысленны, и так далее.
Об этом и будет рассказано. Разобраны ноутбуки, которые делают данное построение.

Доклад является идейным продолжением предыдущего доклада - https://youtu.be/deFlfV3lB50 , https://news.1rj.ru/str/sberloga/66

Ссылка на зум будет доступна через тг чат https://news.1rj.ru/str/sberlogabio ближе к началу
🚀 @SBERLOGA онлайн доклад по биоинформатике :
👨‍🔬 Александр Ташкеев (University of Liege, Animal Genomics Lab) "Базовые аспекты производства и моделирования данных РНК-секвенирования одиночных клеток"
⌚️ Пятница 29 октября, 18.00 по Москве

Поговорим про РНК-секвенирование одиночных клеток на примере коммерческого протокола 10x Genomics, самого распространенного на сегодняшний день.
Сначала рассмотрим экспериментальную часть в объеме, нужном для статистического моделирования таких данных и понимания возможных артефактов.
Потом обсудим разные подходы к моделированию - более и менее knowledge-driven, их возможные плюсы и минусы.

Ссылка на зум будет доступна через тг чат https://news.1rj.ru/str/sberlogabio ближе к началу
🚀 @SBERLOGA онлайн доклад по граф-МЛ:
👨‍🔬 Фёдор Николаев ( Wayne State University, Epistemic AI) "Новые методы поиска сущностей в графах знаний" ("Methods for Ad hoc Entity Retrieval from Knowledge Graphs")
⌚️ Четверг 4 ноября, 19.00 по Москве

В последние годы наблюдается рост популярности графов знаний в различных приложениях, таких как системы извлечения и поиска информации и интеллектуальные помощники. Традиционно извлечение из графов знаний выполняется путем отправки запросов на SPARQL, жестком языке запросов, основанном на тройных шаблонах и логических операциях. В этой работе мы предлагаем несколько подходов к произвольному извлечению сущностей, которые выходят за рамки ограничений этого подхода, позволяя пользователю отправлять запросы с использованием естественного языка в настройках произвольного извлечения, которые стремятся найти конкретные интересующие сущности из графа знаний. Мы предлагаем два новых метода для эффективного ранжирования объектов в таком сценарии. Во-первых, мы предлагаем Parameterized Fielded Term Dependence Models, которые определяют намерение пользователя, стоящее за каждой отдельной концепцией запроса, динамически оценивая его проекцию на поля структурированных представлений сущностей на основе небольшого количества статистических и лингвистических функций. Во-вторых, мы предлагаем Knowledge graph Entity and Word Embedding for Retrieval (KEWER), основанную на случайном блуждании модель встраивания как слов, так и сущностей в одно и то же пространство встраивания, которая позволяет нам вычислять сходство между встраиванием запроса и сущности для сопоставления релевантности в низкоразмерное пространство.

Доклад основан на работах:
http://webpages.eng.wayne.edu/~fn6418/docs/nikolaev-sigir16.pdf, вторая про https://github.com/teanalab/kewer.

Ссылка на зум будет доступна через тг чат https://news.1rj.ru/str/sberlogawithgraphs ближе к началу
🚀 @SBERLOGA онлайн доклад по биоинформатике и анонс предложений о возможном сотрудничестве :
👨‍🔬 Ирина Починок, Jastyn Anne Pöpplau (University Medical Center Hamburg-Eppendorf) "Combining trannoscriptomics and electrophysiological recordings of L2/3 pyramidal neurons in the GE-Mouse-Model of schizophrenia."
⌚️ Понедельник 8 ноября, 18.00 по Москве

В наших предыдущих исследованиях мы показали что пирамидальные нейроны в слоях II/III префронтальной коры играют ключевую роль в формировании дисфункций в мышиной модели психических расстройств. В этом проекте мы зарегистрировали электрофизиологическую активность в слоях II/III префронтальной коры этой модели в неонатальном возрасте при одновременной оптогенетической стимуляции пирамидальных нейронов II/III слоя. После записи активности ткань головного мозга мышей препарировалась и ядра пирамидальных нейронов слоя II/III, экспрессирующие флуоресценцию, были отсортированы с помощью FACS с последующей очисткой РНК и секвенированием (20 mio reads, single end, unstrandet, 80 bp, illumina next gen).
Мы хотим идентифицировать (семейство) генов, которые коррелируют с электрофизиологическими особенностями популяции экспрессирующих флуоресценцию нейронов. Кроме того, мы хотим определить, изменяются ли профили экспрессии (семейства) генов (тех, которые коррелируют с электрофизиологическими особенностями) в мышиной модели психических расстройств.

Возможное сотрудничество:

Мы ищем человека для анализа результатов РНК секвенирования. Предлагаем сотрудничество/участие в публикации или можем оформить как фриланс/контракт.

Аффилиация:

University Medical Center Hamburg-Eppendorf, Center for Molecular Neurobiology, Institute of Developmental Neurophysiology (http://www.opatzlab.com/, https://twitter.com/HanganuOpatzLab).
Мы в Гамбурге, Германия.

Контакты:

Irina Pochinok (irina.pochinok@zmnh.uni-hamburg.de),
Jastyn Anne Pöpplau (jastyn.poepplau@zmnh.uni-hamburg.de)

Ссылка на зум будет доступна через тг чат https://news.1rj.ru/str/sberlogabio ближе к началу
🚀 @SBERLOGA онлайн доклад по граф-МЛ и хемоинформатике:
👨‍🔬 Руслан Лукин - Университет Иннополис "Графовые Нейросети с Передачей Информации для Поиска Гетерогенных Катализаторов"
⌚️ Пятница 12 ноября, 19.00 по Москве

Дизайн новых катализаторов активации малых молекул (СО2, СО, N2) - ключ к решению многих социальных и энергетических проблем, включая синтез топлива с применением энергии из возобновляемых источников, синтез мономеров и производство удобрений из атмосферного азота. В процессе cкрининга катализаторов главной проблемой является создание моделей, которые могут обобщать как элементные составы поверхностей, так и тип/конфигурации адсорбата. Данный подход позволит ускорить более чем 1000х раз квантовохимические расчеты каталитических реакций.
Для решения данной проблемы FAIR совместно с CMU опубликовали датасет OC20, состоящий из 1 281 040 DFT релаксаций (~ 264 890 000 интермедиатных структур) каталитических процессов. В нашей работы мы демонстрируем использование орбитальных дескрипторов и дескрипторов междуатомных взаимодействий с Message Passing GNNs для более эффективного предсказания энергии адсорбции малых молекул и интермедиатов в ходе каталитических процессов электрохимической конверсии малых молекул.

Вакансия в группе Руслана: https://news.1rj.ru/str/sberlogajobs/149

Ссылка на зум будет доступна через тг чаты @sberlogawithgraphs, https://news.1rj.ru/str/sberlogabio ближе к началу
Субботний #нетворкинг.

Если у вас есть интересный блог, канал, проект или вы хотите сделать доклад или поделиться чем-то интересным - не стесняйтесь напишите об этом в чатах или админам.

Ну, а пока, позвольте привлечь ваше внимание к каналам наших друзей, кто старается нести свет знаний в наши ряды.
Сегодня у нас #медтех, #нейросайнс, AI #ивенты:

🔬@OncologyFellow — лучший канал по Онкологии: медицинские аспекты и научные исследования.

🧠 @Blue_Arrakis — Нейросайнс, как же работает мозг? Об этом на этом канале.

🧬 @mayonnaisepet — Молекулярная визуализация, нейровизуализация, и ... шуточки)))

🗓 @AI_meetups — Митапы и прочие важные ивенты про AI, ML, DS, etc
Воскресный разговор. В дебрях наших чатов возник такой вопрос:

Народ, а подскажите, с чего стоит начать развивать личный бренд?

Какое ваше мнение - не стесняйтесь - комментируйте под этим постом. (Комменты к посту в канале видны в десктопной версии телеграмм, но могут быть не видны из других терминалов тг). По такому вопросу, конечно, первый, кого бы хотелось спросить - Андрей Лукьяненко (@Erlemar). И вот, что он написал:

Для начала ещё стоит решить - а точно ли тебе нужен этот самый личный бренд? Есть много людей, которые живут без него и вполне норм работают/зарабатывают. Если хочешь осознанно развивать свой бренд, вначале надо для себя решить, кем ты хочешь быть и в каком стиле. Необязательно прямо сразу планировать весь дальнейший путь, но стоит понимать какие варианты есть и выбирать один из них.

Некоторые варианты:
* инфлюенсер-гуру типа Бояна, Абхишека, linkedin-гуру и так далее. Мне такой вариант прям очень не нравится, но, очевидно, он работает
* блоггер, пишущий посты каждую неделю. Это пропагандируют, но, имхо, хрен ты сможешь выдавать качественный контент каждую неделю
* ютубер (или в других медиумах) по обзору статей, просто новостей и прочего
* создатель какой-то open-source библиотеки
* Kaggler (пояснять, думаю, не нужно)
* консалтер
* опытный в Big Data
* опытный в DL

И кучу других. И, конечно, можно комбинировать разные варианты. Если выбираешь вариант с несением буллшита в массы - просто генери тонны контента каждый день. Других советов нет)Если выбираешь вариант с чем-то более серьёзным, то первое, что стоит крепко запомнить: вначале надо делать, потом уже пиариться.

Советую почитать вот эту книжку в целом про идеи пиара: https://www.goodreads.com/book/show/12838919-rise
Goodreads (https://www.goodreads.com/book/show/12838919-rise)

Из пользы бренда для меня:
* было проще пройти на текущую работу
* предлагали пособеседоваться в интересные места
* было сотрудничество с южнокорейской компанией по созданию типа онлайн-курса, но это было заморожено, когда они занялись выходом на IPO. Но приятно подзаработал на этом
* несколько раз оказывал консультационные услуги по неплохой ставке
* в целом благодаря известности люди на работе могут больше прислушиваться к тебе
* это не полный список

Личный бренд как раз обычно даёт пользу вне твоей текущей работы. Но и на работе полезен.
🚀 @SBERLOGA online seminar on Machine Learning:
👨‍🔬 Алексей Зайцев (Skoltech): «Self-supervised обучение для последовательных данных»
⌚️ Четверг 18 Ноября, 19.00 (Moscow time)

Self-supervised обучение - мощная парадигма современного машинного обучения. Она дает возможность избегать дорогостоящей и субъективной разметки данных. В этом выступлении мы начнем с введения в self-supervised обучение. В конце мы рассматриваем приложения self-supervised обучения к последовательным данным и связанным с ними задачам и достижениям.

Вакансия в группе Алексея , связанная с темой доклада: https://news.1rj.ru/str/sberlogajobs/150

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogadataclub ближе к началу доклада.
🚀 @SBERLOGA онлайн семинар по биоинформатике:
👨‍🔬 Всеволод Макеев (ИОГен РАН): «Различные задачи геномики, решающиеся с помощью задачи разладки»
⌚️ Пятница 19 Ноября, 18.00 (Moscow time)

Множество задач современной функциональной геномики может подразумевают сегментацию генома на домены с характерными признаками – это могут быть сегменты постоянного нуклеотидного состава, участки доступности хроматина, или дупликации одной из хромосом генома. Рассматривается общий метод сегментации генома, при которых геном представляется как результат реализации случайного процесса, причем параметры этого процесса меняются скачкообразно на границах сегмента. Рассматривается использование динамического программирования для оптимальной расстановки границ, а также различные семейства статистических моделей, отвечающих различным биологическим постановкам.

О докладчике:
Всеволод Юрьевич Макеев - член-корреспондент РАН, заведующий отделом ИОГен РАН

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogabio ближе к началу доклада.
Субботний нетворкинг.
Если у вас есть канал, проект, нечто интересное - не стесняйтесь расскажите о нем в чатах или админам.
На наш прошлый призыв откликнулось несколько членов нашего сообщества и вот список их замечательных каналов - подписывайтесь не пожалеете !

@medicalksu — канал о цифровом здравоохранении и инновациях в медицине. Новости и ссылки на статьи о телемедицине, технологиях AI/ML, девайсах для врачей и пациентов и digital-проектах фармы.

@start_ds — канал с материалами для подготовки к собеседованиям в области Data Science и не только

@nn_for_science — канал о новинках из области машинного обучения, с прицелом на использовании в науке

@AI_meetups — митапы и прочие важные ивенты про AI, ML, DS, etc

@botka_chronics — интересная математика в машинном обучении и обработке изображений

@chemical_medicine — независимый канал о медицине, химии, фармакологии и мировом рынке биотехнологий от специалистов по медицинской химии.

@pcr_news — информационный портал о молекулярной диагностике и смежных областях науки и медицины

@smart_lab_news — новости нанобиотеха: различные научные события, конкурсы, конференции и др.

@biology_logic — качественные научно-популярные статьи о самом интересном в биологии

@neuronovosti — новости нейронаук и нейротехнологий. Самые свежие новости нейротематики в вашем телефоне
Воскресный треп.
Adversarial attacks - возникли около пяти лет назад, когда оказалось, что небольшое изменение картинки, которое даже и незаметно для человеческого глаза - приводят к тому, что нейронные сети ошибаются, и, например, вместо панды видят гиббона, да еще и уверены в этом почти на 100%. В последствии, конечно, появились методы борьбы с таким, разной степени успешности.
Но, стоит понимать, что и человек не лишен данной проблемы. Что вы видите на этой картинке ? Кто-то увидит кошку, кто-то мышку - хотя на самом деле на ней ничего нет - просто набор геометрических фигур. Вы можете убедится в этом просто увеличив картинку. Подобных примеров очень много - можно погуглить "Optical illusion" и/или посмотреть на википедии: https://en.wikipedia.org/wiki/Optical_illusion

Если ничего не видите - попробуйте отдалить экран.
👎1
Вижу на картинке
Anonymous Poll
84%
кошку
1%
мышку
14%
ничего
🚀 @SBERLOGA online seminar on Machine Learning:
👨‍🔬 Андрей Лукьяненко (МТС АИ): «Визуализация данных в Data Science»
⌚️ Четверг 25 Ноября, 19.00 (Moscow time)

Визуализация данных - это графическое представление данных, позволяющее быстрее и эффективнее изучать их. Базовые визуализации делать просто, но для создания эффективных и красивых графиков нужно приложить немало усилий.
В этом докладе я наглядно покажу, почему визуализация данных лучше сухой статистики, расскажу о типах графиков и о софте для их создания, поделюсь практическими советами по улучшению графиков и продемонстрирую примеры визуализаций, используемых в задачах машинного обучения.

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogadataclub ближе к началу доклада.
🚀 @SBERLOGA online seminar on bioinformatics:
👨‍🔬 Александр Ракитько (Genotek) "Генетический паспорт."
⌚️ Пятница 26 ноября, 18.00 по Москве

Мы обсудим, как устроены ДНК-тесты на происхождение и здоровье. Поговорим о том, как с помощью GWAS построить полигенный скор для оценки индивидуального риска заболевания. Рассмотрим, как HMM-модели могут быть полезны для оценки процента еврейской ДНК. Это будет обзорная лекция про методы, которые лежат в основе персональных генетических тестов.

Вакансии в группе Александра: https://news.1rj.ru/str/sberlogajobs/154

Лекции во ВШЭ от Александра (см. Лекции 6,7)

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogabio ближе к началу доклада.
👍1