BIG BAD DATA – Telegram
BIG BAD DATA
140 subscribers
69 photos
1 video
9 files
31 links
Сложно о простом и просто о сложном 😎🥸
👀Меня можно найти тут: @Areson251
Download Telegram
11👍3
Поздравляю всех с наступившим Новым годом!!!🥳🥳🥳

Новый год - новые проекты, исследования, статьи…
Всегда есть необходимость работать быстро и эффективно. Такая продуктивность напрямую зависит от инструментов, которыми мы пользуемся.

Я бы хотела поделиться с Вами, товарищи, маленькой подборочкой тулсов, которыми я пользовалась пока писала обзоры литературы в прошлом семестре)

🔹Открывает подборку explainpaper. Здесь можно подгрузить статью, выделить интересующий Вас фрагмент текста, и с помощью chatGPT будет сформулированно объяснение более простым языком (на английском). Уровень объяснения также можно настроить как для пятилетки до эксперта))). Еще есть функция реферирования по всему тексту (выдает основную идею буквально на абзац текста). Кроме того, можно задавать вопросы к статье. Мне понравилось то, что можно загружать ссылки на pdf. Есть платная версия с использованием chatGPT-4. Авторизоваться можно через любую почту и гитхаб.
🔹Следующим инструментом я пользовалась больше всего. Это tldrthis. Аналогично предыдущему, сюда можно подгружать статьи и получать sumerise. Помимо этого, Вам будут предложены 3 примерных вопроса, которые можно задать для уточнения материала. Также, можно спросить свои вопросы. Лучше работает с pdf, хотя ссылки тоже поддерживает. Мне этот инструмент понравился больше, потому что выдает больше осмысленного текста и как-то его структурирует (больше похоже на чатгпт🙃). Однако, здесь есть ограниченное количество запросов на один аккаунт, поэтому мне приходилось регаться с кучи временных почт. Работало все шикарно))) Жалко было только то, что сбрасывались старые диалоги с другими статьями (да, в отличие от предыдущего инструмента, здесь можно создавать несколько диалогов с разными статьями и работать одновременно).
🔹Еще хочу рассказать про прикольную штуку на arxiv. На странице любой статьи в разделе related papers можно включить такую штуку как CORE Recommender. Эта приколюха подбирает топ-5 наиболее релевантных работ к расматриваемой статье. Удобно, когда делаешь обзор)

Вроде как эти инструменты (кроме core) работают с vpn, но можно попробовать и без))
Пользуйтесь на здоровье🤍

#diff
5
Поздравляю всех с Днем российской науки!!!🎉🎉🎉

#dvizh
7
Увидела в канале знакомого смешной скрин как работает copilot, посмеялась

Так же copilot у меня в тетрадках:

#diff
😁5
FlashAttention.pdf
651 KB
Всем всем доброе утро!☀️

Пока я думаю над контентом канала (да да, до сих пор🙃), хочу поделиться сотой, которую совсем недавно открыла для себя.

Предистория:
Меня с детства учили записывать все свои мысли, решения задач, конспекты на бумагу. Очень быстро оказалось, что держать все в голове не эффективно и вести конспекты крайне полезно (неочвеидно для меня). Все было прекрасно до того момента, пока я не начала перескакивать с одного компа на другой: с домашнего на ноут, с ноута на лабный, с лабного на домашний и так по кругу 😵‍💫 Таскать груду бумажных конспектов везде и всюду стало слишком неудобно, особенно учитывая то, что я везде ношу свой ноут😵

Рассказав об этой проблеме своим замечательным коллегам, они предложили мне попробовать Obsidian. Это десктопное приложение (хотя вроде есть и браузерная версия) для написания личных заметок📝
👍61
Его особенность заключается в том, что заметки пишутся на языке markdown. Лично для меня это очень и очень удобно. Также, у него приятный интерфейс, можно настроить под себя организацию папочек и файлов и вроде как даже синхронизировать с облаком. В общем, для меня обсидиан оказался максимально удобным: быстро конспектирую лекции, сразу же выделяя основные моменты курсивом или жирным шрифтом; легко разделять на подзаголовки разных уровней => легко ориентироваться в конспекте; ну и конечно же проще делать скриншоты рисунков, формул и таблиц - не нужно тратить 5 лет на их перерисовывание😄

Для примера поделюсь с Вами своим конспектом по FlashAttention, который удостоился быть первым в опыте составления конспектов в обсидиане)))

В целом сота, рекомендую💯

#diff
👍6
блин, файлик прикрепился к первому посту
ну ладно😕
Любитель конференций уже здесь😎

ML Party

#dvizh
🔥6
🚀 Увеличьте эффективность своих исследований с курсом «Статистика, R и анализ данных» от Blastim! 📊

На программе вы сможете приобрести флеш-рояль навыков для анализа данных: научитесь препроцессировать датасеты на языке R и освоите dplyr, tidyverse, ggplot2, познаете базовые понятия статистики, теории вероятности, выполните практические упражнения, включая работу с непараметрическими методами и линейными моделями 🎲

💯 Завершается курс презентацией проектов, где вы сможете поанализировать, не только учебные, но и собственные данные

Курс открыт для разнообразных специалистов:
🦊 Если вы занимаетесь исследованиями в области животного и растительного мира, работаете цитологом, бактериологом, микологом или вирусологом, этот курс для вас
🧬 Для биотехнологов, генетиков и биоинформатиков ребята подготовили специальные модули, которые помогут максимально эффективно использовать статистические методы в вашей работе
💊 Медики, ветеринары и специалисты фармы также найдут ценную информацию и любопытные клинические кейсы
📈 А также для всех, кто интересуется статистикой, желает начать свой путь в этой прикладной области и хочет понять логику, а не вызубрить скучные правила.

#advert
👍7
Media is too big
VIEW IN TELEGRAM
Что вы получите:
✔️ Глубокое понимание статистических тестов, необходимых для добросовестного анализа данных
✔️ Практические навыки применения статистических инструментов
✔️ Удостоверение о повышении квалификации, записи всех лекций, проекты в портфолио и новых друзей

Присоединяйтесь к программе от Blastim прямо сегодня и начните превращать данные в результаты💡

Ближайшие даты:
25 — 29 марта, 6 — 7, 13 — 14 апреля
Оффлайн в Москве или онлайн 📲

Фронтмен команды лекторов: Иван Поздняков, известный R-энтузиаст, преподаватель ВШЭ, нейропсихолог

👉 Получите доступ сейчас: u.to/Ea57IA

#advert
👍51
На прошлой неделе прошла ML Party от Яндекса🌟
Мне посчастливилось посетить данное мероприятие оффлайн👀

Всего было четыре доклада:
🔹"Как мы запускали автогенерацию рекламных баннеров на Яндекс Маркете" от Воронцова Александра, руководителя группы машинного обучения рекламной платформы. Первый же спич зацепил меня своей темой. Прикольно было послушать про путь, который прошла команда, к конечному существующему в проде продукту. Спикер рассказал про разные подходы, которые они пробовали, проблемы и недопонимания со стороны пользователя и многое другое. Я оценила👍
🔹"Нейросетевое ранжирование для рекомендательных систем" от Кирилла Хрыльченко, руководителя группы исследования перспективных рекомендательных технологий. Прикольно было послушать почему нейронки лучше градиентного бустинга.
🔹"Я вас (не) слышу!" от Никиты Рыжикова, руководителя службы технологий голосового ввода. На мой взгляд один из самых интересных докладов. Спикер рассказал о трудностях переезда голосового помощника Алисы с платформы телефона на колонку. Разъяснялись 2 основные решаемые задачи - эхоподавление и шумоподавление. Мне как любителю физики (на уровне любителя...) очень даже зашло))
🔹"Блендер — механизм оптимизации подмешивания дополнительных элементов в результаты WEB-поиска" от Алексея Голикова, руководителя команды качественных вызовов. Честно, на этом рассказе я немного уснула и ничего не поняла... Но вроде как доклад был связан с инструментом для рекомендательных систем.

#dvizh
❤‍🔥2🔥2
В целом клево было съездить вечерочком развеяться, посмотреть на офис Яндекса, пообщаться с опытными людьми. Словила немного вайб, поэтому поделюсь некоторыми фоточками))

#dvizh
👍4🤩21🔥1