Data Portal | DS & ML – Telegram
Data Portal | DS & ML
8.83K subscribers
189 photos
75 videos
4 files
251 links
Всё самое интересное из мира Data Science и машинного обучения

Связь: @devmangx
Download Telegram
Фреймворк для создания мультиагентных AI-систем в Telegram, готовый к запуску с минимальными настройками

evi-run подходит для создания AI-ассистентов, виртуальных персонажей, автоматизированной службы поддержки, аналитиков данных, торговых агентов на DEX и других кастомных мультиагентных систем

Архитектура построена на Python, OpenAI Agents SDK, Telegram Bot API, PostgreSQL и Redis. Deploy через Docker за 5 минут

GitHub репозиторий → https://github.com/pipedude/evi-run

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍32
This media is not supported in your browser
VIEW IN TELEGRAM
Google выложили в опенсорс Python-библиотеку LangExtract!

Она использует LLM для извлечения сущностей, атрибутов и связей, с точной привязкой к источнику, из неструктурированных документов.

Поддержка любых LLM (Gemini, OpenAI, Ollama).

https://github.com/google/langextract

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Иллюстрированное руководство об AI-агентах в одном PDF

В нём:

🔸Основы работы агентов
🔸LLM vs RAG vs агенты
🔸Паттерны проектирования агентов
🔸Базовые компоненты агентов
🔸Создание кастомных инструментов через MCP
🔸12 практических проектов для AI-инженеров

https://drive.google.com/file/d/1Th8mN_IF7Ttc8bI_OLtUuQ7Mjx3aJ6Hi/view

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👍1
Это один из самых впечатляющих технических блогпостов, которые я читал в последнее время: построение веб-поисковика с нуля за два месяца с 3 миллиардами нейронных эмбеддингов

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2👀2🏆1
Создай свою собственную модель ИИ

Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch

Недавно там появился новый раздел: Gemma 3 с нуля

Является официальным репозиторием к книге Build a Large Language Model (From Scratch).

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍3
Forwarded from IT Portal
Media is too big
VIEW IN TELEGRAM
Нашёл крутейшую платформу для подготовки к DS-собесам

Внутри: 1000+ реальных интервью-вопросов от Facebook, Google, Amazon, Microsoft и других топовых компаний. Практика по SQL, Python, R, статистике, алгоритмам, product sense и даже system design

Есть встроенный IDE с датасетами, где можно сразу писать и валидировать код. База регулярно обновляется

Бесплатно доступно 75 кодинг-задач, 600 вопросов и 50 тестовых заданий. Забираем здесь 🍯

@IT_Portal
🔥53👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Рецептивное поле в CNN, или как нейросети «видят»

В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.

Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Все недооценивают эту новую OCR-модель

dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов

- Поддержка 100+ языков

- Работает как с изображениями, так и с PDF

- Без проблем обрабатывает текст, таблицы и формулы

Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Создавайте схемы архитектур нейросетей на основе параметров

Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.

Что он предлагает:

- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения

Поддерживаются три типа диаграмм:

🔹 Полносвязные сети (FCNN)
🔹 Сверточные сети (по примеру LeNet)
🔹 Глубокие нейросети (по примеру AlexNet)

Ссылка на репо: https://github.com/alexlenail/NN-SVG

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥97
This media is not supported in your browser
VIEW IN TELEGRAM
Вышло годное видео «Adventures in State Space» на YouTube-канале 2swap. Очень качественный ролик в открытом доступе, рекомендую к просмотру

Кстати, другие видео там не менее достойные 🤓

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Получайте RAG-ready данные из любого неструктурированного файла

Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.

Работает с любым сложным layout, рукописными документами и многоязычными данными

https://github.com/tensorlakeai/tensorlake

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍3🔥1
Этот YouTube-канал - настоящая сокровищница для понимания концепций машинного обучения.

Ссылка: https://www.youtube.com/@datamlistic/videos

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Деплойте AI-приложения, просто добавив Python-декоратор

Beam — опенсорс альтернатива Modal для деплоя серверлесс AI-нагрузок.

Просто выполните uv add beam-client, добавьте декоратор и превратите любой воркфлоу в серверлесс-эндпоинт

https://github.com/beam-cloud/beta9

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍2
Понимание LLM с нуля

Статья с нуля и на арифметике уровня средней школы объясняет, как работают LLM: от ручной «генеративки на бумаге» до современной архитектуры Transformer

Читаем здесь

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Мощный трюк с GitHub, о котором стоит знать

Если заменить в URL любого репозитория github.com на gitmcp.io, вы попадёте на страницу с MCP-сервером для этого репозитория и получите готовый сниппет конфигурации. Скопируйте его и добавьте в свою IDE или ИИ-инструмент (например, Cursor, Windsurf или VS Code с поддержкой MCP)

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
4 парадигмы обучения в машинном обучении наглядно:

- Трансферное обучение
- Дообучение
- Многозадачное обучение
- Федеративное обучение

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍3
Бесплатный плейлист из 23 практических туториалов по проектам на Python и Pandas, включая анализ e-commerce, датасеты по фильмам, медицинские данные и создание веб-приложений на Streamlit.

Идеально для формирования сильного портфолио по анализу данных на реальных кейсах.

Плейлист на YouTube

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍139