Data Portal | DS & ML – Telegram
Data Portal | DS & ML
8.83K subscribers
188 photos
74 videos
4 files
250 links
Всё самое интересное из мира Data Science и машинного обучения

Связь: @devmangx
Download Telegram
Этот YouTube-канал - настоящая сокровищница для понимания концепций машинного обучения.

Ссылка: https://www.youtube.com/@datamlistic/videos

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Деплойте AI-приложения, просто добавив Python-декоратор

Beam — опенсорс альтернатива Modal для деплоя серверлесс AI-нагрузок.

Просто выполните uv add beam-client, добавьте декоратор и превратите любой воркфлоу в серверлесс-эндпоинт

https://github.com/beam-cloud/beta9

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍2
Понимание LLM с нуля

Статья с нуля и на арифметике уровня средней школы объясняет, как работают LLM: от ручной «генеративки на бумаге» до современной архитектуры Transformer

Читаем здесь

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Мощный трюк с GitHub, о котором стоит знать

Если заменить в URL любого репозитория github.com на gitmcp.io, вы попадёте на страницу с MCP-сервером для этого репозитория и получите готовый сниппет конфигурации. Скопируйте его и добавьте в свою IDE или ИИ-инструмент (например, Cursor, Windsurf или VS Code с поддержкой MCP)

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
4 парадигмы обучения в машинном обучении наглядно:

- Трансферное обучение
- Дообучение
- Многозадачное обучение
- Федеративное обучение

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍3
Бесплатный плейлист из 23 практических туториалов по проектам на Python и Pandas, включая анализ e-commerce, датасеты по фильмам, медицинские данные и создание веб-приложений на Streamlit.

Идеально для формирования сильного портфолио по анализу данных на реальных кейсах.

Плейлист на YouTube

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍139
This media is not supported in your browser
VIEW IN TELEGRAM
Дообучайте 100+ LLM прямо из UI

LLaMA-Factory позволяет обучать и дообучать опенсорс LLM и VLM без написания кода.

Поддерживает 100+ моделей, мультимодальное дообучение, PPO, DPO, отслеживание экспериментов и многое другое

Ссылка на GitHub

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Крутейший интерактивный учебник по теории вероятностей и статистике

Внутри наглядные визуализации, интерактивчики и минимум сухой теории. Можно покрутить распределения, посэмплить выборки, поиграться с доверительными интервалами и наглядно увидеть, как это всё работает

Забираем тут, советую открывать с десктопа

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Интеллект уровня GPT-4o прямо на вашем телефоне!

MiniCPM-V 4.5 обеспечивает производительность ИИ корпоративного уровня при всего 8B параметров, превосходя модели вроде GPT-4o, Gemini-2.0 Pro на визуальных и языковых задачах.

Поддержка 30+ языков

Плавно работает на iPhone/iPad

Полностью опенсорс: GitHub

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на мощную подборку реальных кейсов применения ML-систем. Более 500 примеров из компаний вроде Spotify, Netflix, Discord и других.

Ссылки ведут прямиком на инженерные блоги, где разложено по полочкам, что и как они делали

Зацените здесь

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Теорема Байеса: наглядное объяснение

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
21👍11🔥2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Кладезь машинного обучения: репозиторий Machine-Learning-Projects

Здесь собрано более 20 проектов, охватывающих темы от компьютерного зрения до обработки естественного языка

Вот парочка крутых проектов из коллекции:
🔸Gender and Age Detection — Определение пола и возраста человека по изображению лица с использованием глубокого обучения и OpenCV.
🔸Medical Chatbot — Медицинский чат-бот, использующий обработку естественного языка для предоставления вероятных диагнозов на основе симптомов.
🔸Driver Drowsiness Detection — Реальное время обнаружения сонливости водителя с помощью OpenCV и CNN, чтобы обеспечить безопасность на дороге.


Каждый проект снабжён подробными описаниями и кодом, так что можно не только посмотреть, но и пощупать самому

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Роадмап по AI Engineering, которому реально могут следовать новички. Всё построено на 100% бесплатных, опенсорс и комьюнити-ресурсах

Все ресурсы можно найти здесь: GitHub

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥84
8 архитектур RAG для AI-инженеров

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Это лучший способ понять, как на самом деле работают ML-модели

Используйте Drawdata, чтобы нарисовать 2D-датасет прямо в Jupyter. С его помощью можно интерактивно выбирать данные через виджет и обновлять модель по мере того, как данные добавляются

Полностью интерактивно, в реальном времени и с открытым исходным кодом

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍4
Open-source RAG-стек (2025)

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍2
Обучайте модели ИИ на данных, которых даже не существует

SDV — это open-source фреймворк, который с помощью ML изучает паттерны ваших реальных данных и генерирует синтетические табличные данные в больших масштабах.

Поддерживает встроенную анонимизацию, валидацию и многое другое.

GitHub: SDV

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍6👎1
Бесплатный курс, чтобы научиться строить LLM с нуля, используя только чистый PyTorch

Этот курс проведёт вас через весь жизненный цикл: от базовых концептов до продвинутых техник алайнмента

К концу у вас будет глубокий практический опыт, достаточный, чтобы собирать и кастомизировать собственные LLM

https://www.youtube.com/watch?v=p3sij8QzONQ

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍105