Создай свою собственную модель ИИ
Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch
Недавно там появился новый раздел: Gemma 3 с нуля
Является официальным репозиторием к книге Build a Large Language Model (From Scratch).
👉 @DataSciencegx
Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch
Недавно там появился новый раздел: Gemma 3 с нуля
Является официальным репозиторием к книге Build a Large Language Model (From Scratch).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍3
Forwarded from IT Portal
Media is too big
VIEW IN TELEGRAM
Нашёл крутейшую платформу для подготовки к DS-собесам
Внутри: 1000+ реальных интервью-вопросов от Facebook, Google, Amazon, Microsoft и других топовых компаний. Практика по SQL, Python, R, статистике, алгоритмам, product sense и даже system design
Есть встроенный IDE с датасетами, где можно сразу писать и валидировать код. База регулярно обновляется
Бесплатно доступно 75 кодинг-задач, 600 вопросов и 50 тестовых заданий. Забираем здесь 🍯
@IT_Portal
Внутри: 1000+ реальных интервью-вопросов от Facebook, Google, Amazon, Microsoft и других топовых компаний. Практика по SQL, Python, R, статистике, алгоритмам, product sense и даже system design
Есть встроенный IDE с датасетами, где можно сразу писать и валидировать код. База регулярно обновляется
Бесплатно доступно 75 кодинг-задач, 600 вопросов и 50 тестовых заданий. Забираем здесь 🍯
@IT_Portal
🔥5❤3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Рецептивное поле в CNN, или как нейросети «видят»
В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.
Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.
👉 @DataSciencegx
В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.
Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Все недооценивают эту новую OCR-модель
dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов
- Поддержка 100+ языков
- Работает как с изображениями, так и с PDF
- Без проблем обрабатывает текст, таблицы и формулы
Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr
👉 @DataSciencegx
dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов
- Поддержка 100+ языков
- Работает как с изображениями, так и с PDF
- Без проблем обрабатывает текст, таблицы и формулы
Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Создавайте схемы архитектур нейросетей на основе параметров
Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.
Что он предлагает:
- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения
Поддерживаются три типа диаграмм:
🔹 Полносвязные сети (FCNN)
🔹 Сверточные сети (по примеру LeNet)
🔹 Глубокие нейросети (по примеру AlexNet)
Ссылка на репо: https://github.com/alexlenail/NN-SVG
👉 @DataSciencegx
Знакомьтесь: NN-SVG — бесплатный опенсорс инструмент, который делает создание диаграмм архитектур нейросетей быстрым и удобным.
Что он предлагает:
- Генерация диаграмм архитектур нейросетей по параметрам
- Экспорт в SVG для простой интеграции в статьи и презентации
- Настройка внешнего вида: цвета, размеры и схемы расположения
Поддерживаются три типа диаграмм:
Ссылка на репо: https://github.com/alexlenail/NN-SVG
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤7
This media is not supported in your browser
VIEW IN TELEGRAM
Вышло годное видео «Adventures in State Space» на YouTube-канале 2swap. Очень качественный ролик в открытом доступе, рекомендую к просмотру
Кстати, другие видео там не менее достойные🤓
👉 @DataSciencegx
Кстати, другие видео там не менее достойные
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Получайте RAG-ready данные из любого неструктурированного файла
Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.
Работает с любым сложным layout, рукописными документами и многоязычными данными
https://github.com/tensorlakeai/tensorlake
👉 @DataSciencegx
Tensorlake преобразует неструктурированные документы в RAG-ready данные в несколько строк кода. Возвращает layout документа, структурированное извлечение, bounding boxes и т. д.
Работает с любым сложным layout, рукописными документами и многоязычными данными
https://github.com/tensorlakeai/tensorlake
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍3🔥1
Этот YouTube-канал - настоящая сокровищница для понимания концепций машинного обучения.
Ссылка: https://www.youtube.com/@datamlistic/videos
👉 @DataSciencegx
Ссылка: https://www.youtube.com/@datamlistic/videos
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Деплойте AI-приложения, просто добавив Python-декоратор
Beam — опенсорс альтернатива Modal для деплоя серверлесс AI-нагрузок.
Просто выполните
https://github.com/beam-cloud/beta9
👉 @DataSciencegx
Beam — опенсорс альтернатива Modal для деплоя серверлесс AI-нагрузок.
Просто выполните
uv add beam-client, добавьте декоратор и превратите любой воркфлоу в серверлесс-эндпоинтhttps://github.com/beam-cloud/beta9
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍2
Понимание LLM с нуля
Статья с нуля и на арифметике уровня средней школы объясняет, как работают LLM: от ручной «генеративки на бумаге» до современной архитектуры Transformer
Читаем здесь
👉 @DataSciencegx
Статья с нуля и на арифметике уровня средней школы объясняет, как работают LLM: от ручной «генеративки на бумаге» до современной архитектуры Transformer
Читаем здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Мощный трюк с GitHub, о котором стоит знать
Если заменить в URL любого репозитория
👉 @DataSciencegx
Если заменить в URL любого репозитория
github.com на gitmcp.io, вы попадёте на страницу с MCP-сервером для этого репозитория и получите готовый сниппет конфигурации. Скопируйте его и добавьте в свою IDE или ИИ-инструмент (например, Cursor, Windsurf или VS Code с поддержкой MCP)Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
4 парадигмы обучения в машинном обучении наглядно:
- Трансферное обучение
- Дообучение
- Многозадачное обучение
- Федеративное обучение
👉 @DataSciencegx
- Трансферное обучение
- Дообучение
- Многозадачное обучение
- Федеративное обучение
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14👍3
Бесплатный плейлист из 23 практических туториалов по проектам на Python и Pandas, включая анализ e-commerce, датасеты по фильмам, медицинские данные и создание веб-приложений на Streamlit.
Идеально для формирования сильного портфолио по анализу данных на реальных кейсах.
Плейлист на YouTube
👉 @DataSciencegx
Идеально для формирования сильного портфолио по анализу данных на реальных кейсах.
Плейлист на YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤9
This media is not supported in your browser
VIEW IN TELEGRAM
Дообучайте 100+ LLM прямо из UI
LLaMA-Factory позволяет обучать и дообучать опенсорс LLM и VLM без написания кода.
Поддерживает 100+ моделей, мультимодальное дообучение, PPO, DPO, отслеживание экспериментов и многое другое
Ссылка на GitHub
👉 @DataSciencegx
LLaMA-Factory позволяет обучать и дообучать опенсорс LLM и VLM без написания кода.
Поддерживает 100+ моделей, мультимодальное дообучение, PPO, DPO, отслеживание экспериментов и многое другое
Ссылка на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Крутейший интерактивный учебник по теории вероятностей и статистике
Внутри наглядные визуализации, интерактивчики и минимум сухой теории. Можно покрутить распределения, посэмплить выборки, поиграться с доверительными интервалами и наглядно увидеть, как это всё работает
Забираем тут, советую открывать с десктопа
👉 @DataSciencegx
Внутри наглядные визуализации, интерактивчики и минимум сухой теории. Можно покрутить распределения, посэмплить выборки, поиграться с доверительными интервалами и наглядно увидеть, как это всё работает
Забираем тут, советую открывать с десктопа
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Интеллект уровня GPT-4o прямо на вашем телефоне!
MiniCPM-V 4.5 обеспечивает производительность ИИ корпоративного уровня при всего 8B параметров, превосходя модели вроде GPT-4o, Gemini-2.0 Pro на визуальных и языковых задачах.
Поддержка 30+ языков
Плавно работает на iPhone/iPad
Полностью опенсорс: GitHub
👉 @DataSciencegx
MiniCPM-V 4.5 обеспечивает производительность ИИ корпоративного уровня при всего 8B параметров, превосходя модели вроде GPT-4o, Gemini-2.0 Pro на визуальных и языковых задачах.
Поддержка 30+ языков
Плавно работает на iPhone/iPad
Полностью опенсорс: GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на мощную подборку реальных кейсов применения ML-систем. Более 500 примеров из компаний вроде Spotify, Netflix, Discord и других.
Ссылки ведут прямиком на инженерные блоги, где разложено по полочкам, что и как они делали
Зацените здесь
👉 @DataSciencegx
Ссылки ведут прямиком на инженерные блоги, где разложено по полочкам, что и как они делали
Зацените здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7