Sberloga – Telegram
Sberloga
2.49K subscribers
219 photos
34 videos
7 files
255 links
Data Сообщество
По всем вопросам обращаться @SberlogaHelperBot
Чат - @sberlogadataclub
Download Telegram
Воскресный треп.
Adversarial attacks - возникли около пяти лет назад, когда оказалось, что небольшое изменение картинки, которое даже и незаметно для человеческого глаза - приводят к тому, что нейронные сети ошибаются, и, например, вместо панды видят гиббона, да еще и уверены в этом почти на 100%. В последствии, конечно, появились методы борьбы с таким, разной степени успешности.
Но, стоит понимать, что и человек не лишен данной проблемы. Что вы видите на этой картинке ? Кто-то увидит кошку, кто-то мышку - хотя на самом деле на ней ничего нет - просто набор геометрических фигур. Вы можете убедится в этом просто увеличив картинку. Подобных примеров очень много - можно погуглить "Optical illusion" и/или посмотреть на википедии: https://en.wikipedia.org/wiki/Optical_illusion

Если ничего не видите - попробуйте отдалить экран.
👎1
Вижу на картинке
Anonymous Poll
84%
кошку
1%
мышку
14%
ничего
🚀 @SBERLOGA online seminar on Machine Learning:
👨‍🔬 Андрей Лукьяненко (МТС АИ): «Визуализация данных в Data Science»
⌚️ Четверг 25 Ноября, 19.00 (Moscow time)

Визуализация данных - это графическое представление данных, позволяющее быстрее и эффективнее изучать их. Базовые визуализации делать просто, но для создания эффективных и красивых графиков нужно приложить немало усилий.
В этом докладе я наглядно покажу, почему визуализация данных лучше сухой статистики, расскажу о типах графиков и о софте для их создания, поделюсь практическими советами по улучшению графиков и продемонстрирую примеры визуализаций, используемых в задачах машинного обучения.

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogadataclub ближе к началу доклада.
🚀 @SBERLOGA online seminar on bioinformatics:
👨‍🔬 Александр Ракитько (Genotek) "Генетический паспорт."
⌚️ Пятница 26 ноября, 18.00 по Москве

Мы обсудим, как устроены ДНК-тесты на происхождение и здоровье. Поговорим о том, как с помощью GWAS построить полигенный скор для оценки индивидуального риска заболевания. Рассмотрим, как HMM-модели могут быть полезны для оценки процента еврейской ДНК. Это будет обзорная лекция про методы, которые лежат в основе персональных генетических тестов.

Вакансии в группе Александра: https://news.1rj.ru/str/sberlogajobs/154

Лекции во ВШЭ от Александра (см. Лекции 6,7)

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogabio ближе к началу доклада.
👍1
В Самаре 26-28 ноября пройдет хакатон по созданию системы принятия поддержки врачебных решений призовой фонд 400 тыс. рублей.
Ксения обращает внимание, что заявки до четверга собираются - поторопитесь.
https://news.1rj.ru/str/medicalksu/3378
Закрываю свои обширные долги по лекциям на ютубе 😅

Новые работы по АльфаФолду - к.б.н А. Залевский (ИБХ РАН) и Д. Иванков (Сколково)
https://youtu.be/hdtY4wJa92w

Новые методы поиска сущностей в графах знаний - Фёдор Николаев
https://youtu.be/XFfDcjSTr8M

Графовые Нейросети с Передачей Информации для Поиска Гетерогенных Катализаторов - Руслан Лукин
https://youtu.be/bfFK1K4ENDY

Биология на графах. Графы 'взаимодействия' генов на основе NLP анализа текстов - Антон Костин
https://youtu.be/vw10_9j3Lig

Аспекты производства и моделирования данных РНК-секвенирования одиночных клеток - Александр Ташкеев
https://youtu.be/aMY3jENGwSQ
This media is not supported in your browser
VIEW IN TELEGRAM
Это не амёба, это процесс построения Elastic Principal Graph, см. следующий пост.
Гиф выше - иллюстрация работы алгоритма Elastic Principal Graph разработанного Андреем Зиновьевым и его коллегами в институте Кюри.
Пакет доступен через pypi:
pip install elpigraph-python
Граф строится последовательно, начиная с двух вершин и постепенно на каждом шаге добавляется новая вершина. Граф строящийся на каждом шаге минимизирует функционал, который состоит из трех "пенальти" - за плохую аппроксимацию данных, за большую длину, и некоторое условие на вершины ветвления, о котором стоит думать как о штрафе за НЕгладкость. То есть, мы хотим получить - короткий, гладкий граф хорошо аппроксимирующий данные.

Одно из основных приложений - биология - анализ данных одноклеточного РНК секвенирования.
( Trajectory inference ).
В нашем организме постоянно бесчисленные клетки трансформируются из клеток "похожих на стволовые" в лейкоциты, эритроциты, и прочее.
(См. Гемопоэз - кроветворение - это процесс образования, развития и созревания клеток крови — лейкоцитов, эритроцитов, тромбоцитов у позвоночных).
Можно взять кучу таких клеток померить "экспрессии" генов для каждой из них в отдельности, и задача состоит в восстановлении в ветвящегося графа (точнее дерева), описывающего как клетки ОДНОГО типа ("похожие на стволовые" - корень дерева) постепенно трансформируются в клетки РАЗНЫХ типов (лейко,моно,эри ... циты). Аналогично изучаются и другие Cellular differentiation процессы (не только гемопоэз). Другое приложение - клеточный цикл, но об этом в другой раз.

pip install elpigraph-python
В продолжении предыдущего поста:
В ближайшую среду 1 Декабря 2021 года, начиная с 14 часов по европейскому времени (16 по Москве) состоится онлайн мини-воркшоп:
"Complex and Simple Models of Multidimensional Data :
From graphs to neural networks".

На котором Андрей Зиновьев расскажет о методе Elastic principal graph, его коллега - Luca Pinello (Harvard) расскажет о приложении к биологии (SIMBA: SIngle-cell eMBedding Along with features based on graph embedding), и ряд других интересных докладов.

Не пропустите:
https://www.ihes.fr/~zinovyev/CASMD2021/
Участие бесплатно, онлайн, нужно зарегистрироваться, но это очень просто
Коллеги, если вдруг кто-то не в курсе. Телеграм объявил курс на монетизацию. Телеграм сам без ведома админов канала будет размещать рекламные объявления в каналах, где больше чем 1000 подписчиков. Если вы видите подобные (обычно короткие посты с рекламой) - это посты от телеграм. Давайте относиться к этому спокойно.
ПС
Возможно, что посты НЕ видны в терминале "телеграм Х", по крайней мере в данный момент это так. Я пользуюсь им и рекламных постов пока не видел, также, на мой вкус, в нем цветовая гамма в ночном режиме более приятная.
🚀 @SBERLOGA online seminar on mathematics and machine learning:
👨‍🔬 Илья Павлюкевич (Prof. Dr. Universität Jena) : «О математике метода симулированного отжига»
⌚️ Четверг 2 декабря, 18.00 по Москве

Мы обсудим решение задачи оптимизации с помощью стохастических методов, а именно метода симулированного отжига (simulated annealing). Фокус будет сделан на интуитивном, но достаточно математическом объяснении того, почему и при каких условиях этот метод работает, а также на сравнении гауссовского и негауссовского поиска.

О докладчике:
Выпускник мехмата МГУ, ныне профессор в Йене. Автор работы "Lévy flights, non-local search and simulated annealing" 2007, ставшей классической в области (600+ цитирований) и применяемой в современных исследованиях по Machine Learning.

Подписывайтесь на каналы тг: @sberloga, Ютуб: SBERLOGA - топовые онлайн доклады каждую неделю! @sberlogajobs - вакансии.

Ссылка на зум будет доступна в тг чатах https://news.1rj.ru/str/sberlogasci ,
https://news.1rj.ru/str/sberlogadataclub перед докладом.
🔔 Не пропусти! 14 декабря пройдет бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям!

Узнайте о самых последних решениях в мире Data Science! Каждый день появляются новые способы применения технологий, поэтому необходимо постоянно следить за трендами, чтобы оставаться востребованным специалистом.

Программа конференции составлена для профессиональной аудитории: доклады и много практических кейсов. А также вы сможете задавать вопросы спикерам в прямом эфире.

- насыщенный день в кругу «своих» людей, которым не надо объяснять, что такое датасет и анализ данных
- кейсы, опыт и фишки от ведущих специалистов
- 2 потока, 16 часов докладов
- спикеры-практики поделятся информацией, которую не найти в сети

Трансляция будет бесплатной, но если вы хотите купить видеозаписи, то воспользуйтесь промокодом специально для наших подписчиков: Sberloga500

📌 Регистрация - https://clck.ru/Z7FQX
https://youtu.be/EzcEmor-6gY

"Генетический паспорт" (Genotek) - Александр Ракитько

На докладе обсудили, как устроены ДНК-тесты на происхождение и здоровье. Поговорили о том, как с помощью GWAS построить полигенный скор для оценки индивидуального риска заболевания. Рассмотрели, как HMM-модели могут быть полезны для оценки процента еврейской ДНК. Это обзорная лекция про методы, которые лежат в основе персональных генетических тестов.

Вакансии в группе Александра: https://news.1rj.ru/str/sberlogajobs/154

Лекции во ВШЭ ссылка
(см. Лекции 6,7)

🗨 Обсудить доклады можно в нашем чатике
https://news.1rj.ru/str/sberlogabio
https://youtu.be/sbrAY1TObmc

Визуализация данных в Data Science - Андрей Лукьяненко (МТС AI)


Визуализация данных - это графическое представление данных, позволяющее быстрее и эффективнее изучать их. Базовые визуализации делать просто, но для создания эффективных и красивых графиков нужно приложить немало усилий.В этом докладе я наглядно покажу, почему визуализация данных лучше сухой статистики, расскажу о типах графиков и о софте для их создания, поделюсь практическими советами по улучшению графиков и продемонстрирую примеры визуализаций, используемых в задачах машинного обучения.

📈Слайды
https://slides.com/andreylukyanenko/data_vis_in_ds

📢 Подписывайся на наше сообщество в telegram, чтобы быть в курсе мероприятий
https://news.1rj.ru/str/sberloga

🗨 Обсудить доклады можно в нашем чатике
https://news.1rj.ru/str/sberlogadataclub
🚀 @SBERLOGA online seminar on bioinformatics:
👨‍🔬 Котлов Никита (BostonGene) “Подтипы микроокружения DLBCL”
⌚️ Пятница 3 декабря, 18.00 по Москве

Мы обсудим происхождение и развитие Б-клеток и лимфомы, которые из них происходят. Затронем строение нормального лимфоузла и функции разных видов нормальных клеток в нем. Научимся оценивать количество этих клеток и выраженность тех или иных функций на основе данных экспрессии генов. И в итоге углубимся в подтипы Диффузной Крупноклеточной Лимфомы (DLBCL), обсудим их клиническую значимость.
Разбор статьи https://cancerdiscovery.aacrjournals.org/content/11/6/1468

Вакансии в BostonGene: https://news.1rj.ru/str/sberlogajobs/158

Ссылка на зум будет доступна в чате: https://news.1rj.ru/str/sberlogabio ближе к началу доклада.
https://youtu.be/x2wVsrmP85Q

Различные задачи геномики, решающиеся с помощью задачи разладки - Всеволод Макеев (ИОГен РАН)

Множество задач современной функциональной геномики подразумевают сегментацию генома на домены с характерными признаками – это могут быть сегменты постоянного нуклеотидного состава, участки доступности хроматина, или дупликации одной из хромосом генома. Рассматривается общий метод сегментации генома, при которых геном представляется как результат реализации случайного процесса, причем параметры этого процесса меняются скачкообразно на границах сегмента. Рассматривается использование динамического программирования для оптимальной расстановки границ, а также различные семейства статистических моделей, отвечающих различным биологическим постановкам.

📈Слайды
https://drive.google.com/file/d/1ap-ySAFDJWxEtqcQ1a6vONo7NMhmITe-/view?usp=sharing
https://drive.google.com/file/d/1F-UzX_ltqz-3MEDjiQoeqvYNG5ck9LvU/view?usp=sharing


📢 Подписывайся на наше сообщество в telegram, чтобы быть в курсе мероприятий
https://news.1rj.ru/str/sberloga

🗨 Обсудить доклады можно в нашем чатике
https://news.1rj.ru/str/sberlogadataclub
Forwarded from mathimages // let there be art (Stranger in the Q)
Какое-то время назад уже, сделал я себе веб сэндбокс для комплексных фрактклов

Балуюсь им периодически, теперь буду тут иногда выкладывать находки...

https://news.1rj.ru/str/complex_fractals