NEW BOT Телеграм, страница - 535937672

Machine Learning Research

963 subscribers

61 photos

7 videos

2 files

1.05K links

Download Telegram

About

Blog

Apps

Platform

Machine Learning Research

963 subscribers

Machine Learning Research

Forwarded from Small Data Science for Russian Adventurers

#визуализация
Странно, что я ещё не упоминал здесь такой интересный ресурс. Можно использовать для освежения в памяти тем по ML. Полно интересных рисунков по каждой теме. Есть три блока: ML, ML-Engineering, проективная геометрия, по DL совсем чуть-чуть и ресурс не обновляется с начала года.
https://illustrated-machine-learning.github.io/

656 viewsНиколай, 11:31

Machine Learning Research

Forwarded from Kantor.AI (Victor Kantor)

Обучиться Data Science «самому», без вузовских курсов, можно, но сложно

Курсов «Стань Data Scientist’ом за три месяца» с заманчивыми обещаниями о трудоустройстве и большом заработке довольно много. Грешат этим все: от GeekBrains и Skillbox до Яндекс Практикума (хотя, по моему субъективному мнению, коллеги из Яндекса работают наиболее деликатно и им за это от меня респект).

Нет ничего зазорного в курсах хоть на три месяца, хоть на три занятия.

Любой формат позволяет донести определённые знания, однако важно сохранять трезвость в оценке ценности подобных курсов.

Человек с хорошим техническим образованием из МГУ, МФТИ, ВШЭ, СПбГУ, ИТМО и других топовых вузов вполне в состоянии устроиться стажёром в data science и после вводного курса. Вряд ли в топовую компанию, но начать нарабатывать опыт уже можно.

Более того, полноценно проходить даже короткий курс необязательно — это лишь способ ускорить процесс. Если человек умеет программировать, читать документацию и изучать библиотеки, можно обойтись и без курса:

— решайте Kaggle.com, начиная с учебных соревнований
— читайте форумы соревнований,
— практикуйтесь в применении DS библиотек (sklearn, lightgbm, catboost, xgboost, pandas, polars, seaborn, pytorch, ambrosia )
— изучайте их документацию

Находите открытые материалы курсов по data science и разбирайте их самостоятельно. Знаю примеры людей, бегло изучающих семестровый курс из Стэнфорда за ночь. Не всем обязательно демонстрировать такую суперпроизводительность, да и почти любой человек после подобной учёбы многое забудет через неделю. Но вместе с практикой этот подход совершенно нормальный.

Ещё полезно через какое-то время изучить ту же тему в новом источнике. Интересующихся людей в целом всегда выделяет то, что им недостаточно прочитать одну книгу, решить задачу один раз, один раз понять, как всё устроено. Им интересно изучать вопрос с разных сторон снова и снова.

Однако нужно помнить, что без сильной базы по программированию и математике путь в Data Science может быть долгим. Это нормально. Главное — не останавливаться в изучении фундаментальных направлений. Если понравится процесс — вы его пройдёте, сами или с чьей-то помощью.

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

🔥3

844 viewsНиколай, 16:57

Machine Learning Research

Forwarded from Small Data Science for Russian Adventurers

#книга
Simon J.D. Prince "Understanding Deep Learning"
Незаслуженно малоизвестная книга. Но это самое лучшее, что в последние годы писалось по глубокому обучению. Материал очень современный (GPT3, диффузионные модели, графовые сети есть). Повествование с основ и до этических проблем, очень широкий охват. Текст и рисунки авторские. Достаточно подробная библиография. Ну разве что примеров кода нет (книга теоретическая). Настоятельно рекомендую!
https://udlbook.github.io/udlbook/

👍6

825 viewsНиколай, 09:16

Machine Learning Research

The N Implementation Details of RLHF with PPO
https://huggingface.co/blog/the_n_implementation_details_of_rlhf_with_ppo

764 viewsНиколай, 12:01

Machine Learning Research

Классификация авторства текстов. Обзор Kaggle соревнования «H2O Predict the LLM»
https://habr.com/ru/articles/772364/

Классификация авторства текстов. Обзор Kaggle соревнования «H2O Predict the LLM»

В день, когда Сэм Альтман в темной одежде на темном фоне рассказывал миру о запуске GPT-4-Turbo, в те же самые минуты на Kaggle завершалось небольшое, но любопытное соревнование “Predict the LLM”....

❤5

700 viewsНиколай, 16:43

Machine Learning Research

Forwarded from 🏆 Data Feeling | AIeron (Aleron Milenkin)

This media is not supported in your browser

VIEW IN TELEGRAM

🔥

Библиотека RAPIDS от NVIDIA cделает Pandas в 150 раз быстрее без изменений кода.

Нужно прописать только это:

%load_ext cudf.pandas
import pandas as pd

🤖

Их библиотека RAPIDS cuDF сама определяет, доступна GPU или CPU, и ускоряет обработку.

💪

Колаб чтоб попробовать:

🥳

Репозиторий либы:

@datafeeling

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤1

611 viewsНиколай, 15:12

Machine Learning Research

«ИИ без границ»: как научить Transformer обрабатывать длинные тексты
https://habr.com/p/773312/

«ИИ без границ»: как научить Transformer обрабатывать длинные тексты

Дисклеймер Статья посвящёна проблеме обработки длинных входных последовательностей нейросетевыми моделями на основе архитектуры Transformer. От читателя требуется понимание общих принципов работы...

561 viewsНиколай, 12:18

Machine Learning Research

Forwarded from Generative Ai

X-LLM. Новая библиотека для обучения LLM в экосистеме Huggingface.

Она поддерживает все современные методы (QLoRA, Flash Attention 2, Gradient checkpointing, GPTQ квантизацию, W&B, обучение на нескольких GPU с помощью DeepSpeed, даже каждый чекпоинт сохраняет сразу в Huggingface Hub). Подходит как для быстрого прототипирования, так и для production-ready решений.

Репозиторий, внутри много примеров: https://github.com/BobaZooba/xllm

Colab с обучением 7B модели: ссылка

Open source модель: https://huggingface.co/BobaZooba/Shurale7B-v1

Интерактивная текстовая игра (с моделью выше) с динамическими персонажами и историями: @TaleQuestBot (да, бот в телеграм)

GitHub - bobazooba/xllm: 🦖 X—LLM: Cutting Edge & Easy LLM Finetuning

🦖 X—LLM: Cutting Edge & Easy LLM Finetuning. Contribute to bobazooba/xllm development by creating an account on GitHub.

🔥5

459 viewsНиколай, 04:37

Machine Learning Research

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

🔥EMU VIDEO:
Factorizing Text-to-Video Generation by Explicit Image Conditioning

Сегодня сразу два больших релиза от моих коллег из Meta GenAI! Один из них — опубликовали модель EMU-Video.

Новая модель строится на базе Text-2-image модели Emu, и теперь может генерить 4-секундные видео 512x512 в 16 fps.

Архитектура, грубо: мы берем pre-trained 2.7B Emu для генерации text-2-image, замораживаем Unet и добавляем в него дополнительные аттеншен слои, которые работают вдоль врменной оси. И тренируем только доп слои, на генерацию видео по тексту.

На вход даём либо картинку + текст, либо только текст (в этом случае картинку генерим с помощью Emu). На выходе — 65 фрейма 512x512.

Если погрузиться в детали, то сначала генерится 16 фреймов, а затем ещё одна модель с такой же архитектурой интерполирует видео до 65 фреймов.

Это теперь SOTA в text-2-video:
✔️ Emu-Video vs Gen-2: победа Emu-Video в 78.5% случаев
✔️Emu-Video vs Pika - победа в 98.5% случаев по оценке кожаных разметчиков.

Сайт проекта
Демо-результаты

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

536 viewsНиколай, 19:16

Machine Learning Research

Forwarded from Курсы Data Science

https://shad.yandex.ru/gptweek

GPT Week Школы анализа данных

Открытый онлайн-интенсив от ШАДа и экспертов Яндекса. Создатели YandexGPT поделятся опытом работы над большими языковыми моделями

572 viewsНиколай, 06:45

Machine Learning Research

Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

https://habr.com/ru/articles/774844/

Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

Всем доброго времени суток. Я давно обещала выложить сюда подробный гайд на тему того, как можно изучать Machine Learning самостоятельно, не тратя деньги на платные курсы , и, наконец, выполняю свое...

👍1

707 viewsНиколай, 16:58

Machine Learning Research

На kaggle есть курс по Computer Vision. Так вот теперь у него появился практический гайд
https://www.kaggle.com/code/ivanlydkin/computer-vision-course-practical-guide

🤖 Computer Vision course: Practical Guide

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

❤2

653 viewsНиколай, 09:50

Machine Learning Research

ChatGPT плохо отвечает на «простые вопросы». Как это починить?

https://habr.com/ru/companies/airi/articles/774934/

ChatGPT плохо отвечает на «простые вопросы». Как это починить?

Привет, Хабр! Меня зовут Антон Разжигаев, я аспирант в Сколтехе и участник научной группы Fusion Brain (AIRI). В этой статье я расскажу о нашей последней работе — Multilingual Triple Match — системе...

652 viewsНиколай, 11:19

Machine Learning Research

Kandinsky 3.0 — новая модель генерации изображений по тексту

https://habr.com/ru/companies/sberbank/articles/775590/

Kandinsky 3.0 — новая модель генерации изображений по тексту

«Без чувства современности художник останется непризнанным» , Михаил Пришвин, русский и советский писатель, прозаик и публицист В прошлом году на АI Journey мы представили модель Kandinsky 2.0 —...

🔥3

595 viewsНиколай, 09:26

Machine Learning Research

Новая лекция от Карпатого
https://youtu.be/zjkBMFhNj_g?si=gLNkXpNdTcs85Zzw

[1hr Talk] Intro to Large Language Models

This is a 1 hour general-audience introduction to Large Language Models: the core technical component behind systems like ChatGPT, Claude, and Bard. What they are, where they are headed, comparisons and analogies to present-day operating systems, and some…

🔥4

703 viewsНиколай, 17:47

Machine Learning Research

Большие языковые модели (LLM) в задачах

https://habr.com/ru/articles/775870/

Большие языковые модели (LLM) в задачах

В этой статье на практических примерах рассмотрим какие задачи из коробки могут решать современные большие языковые модели (large language models, LLM). Но сначала немного...

👍1

782 viewsНиколай, 07:08

Machine Learning Research

ОНЛАЙН-ИНТЕНСИВ

First Step in NLP 2.0

https://www.hse.ru/ma/mlds/nlpbootcamp/2023

Открытый онлайн-интенсив "First step in NLP 2.0 Bootcamp" — введение в обработку естественного языка

В интенсив входят 4 вебинара по Machine Learning, практические домашние задания и соревнование по классификации текстов на платформе Kaggle.

596 viewsНиколай, 17:52

Machine Learning Research

Forwarded from Dealer.AI

Взять LLM за RAGa в 60 минут

Вводный курс от deeplearning.ai
В мир прекрасного ранкинга и LMок

https://www.deeplearning.ai/short-courses/building-evaluating-advanced-rag/

DeepLearning.AI - Learning Platform

Building and Evaluating Advanced RAG

Learn advanced RAG retrieval methods like sentence-window and auto-merging that outperform baselines, and evaluate and iterate on your pipeline's performance.

472 viewsНиколай, 11:21

Machine Learning Research

Forwarded from Salute AI (Alexander Gavrilov)

Делимся уникальным курсом от команды SmartSpeech

Георгий Господинов, Александр Максименко, Павел Богомолов, Гриша Стерлинг — специалисты SberDevices, которые также примут участие в нашем митапе «Салют, GigaChat!», запустили третью итерацию своего знаменитого курса по голосовым технологиям для магистров МФТИ.

Курс охватывает широкий спектр тем:
▪️Детекция ключевых слов.
▪️Распознавание речи.
▪️Диаризация и верификация спикера.
▪️Синтез речи и многое другое.

🌐

GitHub репозиторий с открытыми материалами курса, включая записи лекций, слайды и домашние задания. Пригодится всем, кто стремится к глубокому пониманию речевых технологий и их применению в реальных проектах.

💡

Ждём вас на встрече с авторами курса и другими экспертами SberDevices на митапе

«Салют, GigaChat!»

о речевых технологиях и больших языковых моделях:

4 декабря

, Москва (офлайн + онлайн). Ваши коллеги и друзья также приветствуются!

✅

Регистрация на митап

обязательна

Подписывайтесь 👉 Salute AI

#SmartSpeech #митап_Салют_GigaChat #митап

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

484 viewsНиколай, 12:43

Machine Learning Research

Forwarded from Kantor.AI (Victor Kantor)

CoolGraph от Big Data МТС

Если вы немного в теме нейросетей, то знаете, что к данным с разной структурой применяются изначально разные архитектуры. В компьютерном зрении — на базе свёрток, в работе с текстами — вдохновлённые рекуррентными сетями и, конечно, трансформеры.

Резонный вопрос: а какие сети могли бы обобщить работу с произвольной структурой в данных? Ответ есть: графовые. Если вы можете по своим данным построить граф, отражающий взаимосвязь их отдельных частей (в компьютерном зрении пиксель связан с соседними пикселями, в тексте слово связано с другими словами), то дальше встаёт вопрос построения нейросети на основе этого графа.

Кроме того, бывают и совсем очевидные ситуации, когда граф возникает сам собой. Например, социальный граф — граф социальных взаимодействий между пользователями, или двудольный граф пользователи-товары в e-commerce и пользователи-фильмы в стриминговых сервисах.

Более того, часто компании, имеющие данные в виде графа, выжимают не всю пользу из этих данных. Просто потому, что придумывать табличные фичи по графу — это тоже отдельная объёмная работа. И здесь тоже помогают графовые нейросети: с ними можно построить граф-эмбеддинги, которые снимут вопрос построения hand-crafted графовых фичей. Именно с графовыми нейросетями и связана новая open source библиотека Big Data МТС.

Сегодня я представляю вам библиотеку CoolGraph, с помощью которой вы сможете построить первые графовые нейросети буквально в несколько строк кода. Задача библиотеки — популяризовать GNN и радикально снизить порог входа в них. Надеюсь, так же, как RecTools и Ambrosia, CoolGraph скоро прорастёт в код других компаний, начнёт попадать в описание стека в вакансиях и, вообще, всячески станет популярной и востребованной в DS-сообществе :)

GitHub - MobileTeleSystems/CoolGraph: Make GNN easy to start with

Make GNN easy to start with. Contribute to MobileTeleSystems/CoolGraph development by creating an account on GitHub.

✍1👍1

485 viewsНиколай, 17:26

Machine Learning Research

Introduction to AI

https://github.com/microsoft/AI-For-Beginners/blob/main/lessons/1-Intro/README.md

AI-For-Beginners/lessons/1-Intro/README.md at main · microsoft/AI-For-Beginners

12 Weeks, 24 Lessons, AI for All! Contribute to microsoft/AI-For-Beginners development by creating an account on GitHub.

👍1

543 viewsНиколай, 07:57