Машинное обучение RU – Telegram
Машинное обучение RU
17.8K subscribers
1.55K photos
205 videos
11 files
2.02K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🔬 Генерация белков с BoltzGen

BoltzGen — это инструмент для генерации и оптимизации дизайна белков, использующий передовые методы машинного обучения. Он позволяет создавать наборы ранжированных дизайнов на основе спецификаций в формате YAML, обеспечивая гибкость и высокую производительность.

🚀 Основные моменты:
- Генерация белков с использованием спецификаций YAML.
- Поддержка GPU для ускорения вычислений.
- Выходные данные включают промежуточные и финальные дизайны.
- Возможность анализа и фильтрации результатов.

📌 GitHub: https://github.com/HannesStark/boltzgen

#python
2👍1
Kimi K2 Thinking (32K) показал результат 4.2 балла на расширенном бенчмарке Extended NYT Connections.

Модель заметно ошибается в рассуждениях и нередко зацикливается при ответах. Тестирование проводилось через официальный API.

Подробнее: github.com/lechmazur/nyt-connections/
😱32👍1👎1🔥1
📊 Подробный практический гайд по статистике на Python

Этот практический гайд по статистике на Python - ваш надёжный проводник в мир анализа, визуализации и интерпретации данных.

От простых описательных показателей до регрессий и временных рядов — с примерами, кодом и реальными задачами. Всё, что нужно, чтобы уверенно применять статистику на практике.

🟠Гайд
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥1
Магистратура — это 2 года жизни и серьезные вложения. Как не ошибиться с выбором?

Приходите на день открытых дверей ИТ-магистратуры Центрального университета — разберем все важные вопросы, которые помогут принять правильное решение.

О чем будем говорить:
→ Как создаются программы магистратуры в ЦУ, что такое продуктовый подход в высшем образовании и как это делает выпускников реально востребованными на рынке
→ Как университет помогает студентам строить карьеру: от менторства до трудоустройства в топовые компании
→ Какие направления есть в ЦУ и как выбрать то, что приведет к вашим карьерным целям
→ Реальные истории студентов: как они поступали, учились и куда пошли работать

Спикеры — практики с опытом в Google, Яндексе, Т-Банке и Visa, которые сейчас отвечают за образовательный опыт студентов ЦУ.

Когда:
Очно 18 ноября с 19:30 до 21:00 (в Москве с экскурсией по кампусу ЦУ).

Регистрируйся по ссылке!

Реклама. АНО ВО "Центральный университет", ИНН 7743418023, erid: 2Ranym92vDp
👍1👎1
Быстрый совет для Cursor

Хочешь, чтобы Cursor писал точнее и в твоём стиле?

🧠 Просто создай файл `.cursorrules` в корне проекта и опиши в нём:
- правила кодстайла, которые ты используешь
- предпочтения по структуре, форматированию, именованию

Чем конкретнее, тем лучше работает автогенерация.

🔥 Это помогает избежать «галлюцинаций» и потери контекста при создании кода.
🔥92🥰2👍1🤔1
🚀 Релиз Qwen Code v0.2.1

Главные улучшения:
🌐 Бесплатный веб-поиск
Теперь поддерживаются разные поисковые провайдеры. Пользователи Qwen OAuth получают до 2000 бесплатных поисков в день.

🎯 Умное редактирование кода
Новая система нечёткого сопоставления лучше понимает правки, реже ошибается и экономит токены — меньше повторных попыток.

⚙️ Гибкая настройка модели
Можно управлять поведением ИИ через параметры temperature, top_p и max tokens.

💻 Лучшая работа в Zed IDE
Добавили поддержку задач, TODO и улучшили стабильность интеграции.

📝 Более простой вывод
Инструменты теперь отвечают обычным текстом, а не громоздким JSON — ИИ проще разбирать результаты.

🔍 Улучшенный поиск по проекту
Учёт .gitignore, умнее фильтры файлов, аккуратные названия инструментов.

Выше скорость
Новые этапы нормализации, корректная работа с Unicode, оптимизированные лимиты вывода.

🐛 Исправления
Правильные ограничения токенов для разных моделей, улучшена поддержка Windows и macOS, стабилизирована работа.

Qwen Code теперь работает быстрее, стабильнее и удобнее.

🔗 https://github.com/QwenLM/qwen-code
📝 https://github.com/QwenLM/qwen-code/releases
🔥42👍1
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javanoscript: t.me/javanoscriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://news.1rj.ru/str/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://news.1rj.ru/str/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://news.1rj.ru/str/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://news.1rj.ru/str/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://news.1rj.ru/str/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javanoscript: t.me/javanoscriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://news.1rj.ru/str/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://news.1rj.ru/str/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://news.1rj.ru/str/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://news.1rj.ru/str/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://news.1rj.ru/str/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
🔥31👎1
⚡️ Новый проект: DeepSeek OCR — React + FastAPI

Открыли репозиторий с современным веб-приложением OCR: фронтэнд на React, бэкенд на FastAPI.

Что умеет:
- Plain OCR — извлечение текста из изображения
- Describe — генерация описания изображения
- Find — поиск заданного термина с отображением рамки
- Freeform — задаёшь кастомный prompt и получаешь результат

Почему круто:
- Drag-and-drop загрузка изображений до 100 МБ, визуализация bounding boxes
- Конфигурация через .env (порт, размер файла, модель)
- Стек: React 18 + Vite + TailwindCSS + FramerMotion + FastAPI + PyTorch + Transformers
- Всё контейнеризовано через Docker + Docker Compose → можно быстро запустить

Как начать:
1. Клонируй репозиторий
2. Cкопируй .env.example в .env и настрой параметры
3. Запусти: docker compose up --build
4. Открой: фронтэнд (по умолчанию http://localhost:3000) & API (http://localhost:8000)

https://github.com/rdumasia303/deepseek_ocr_app/
🔥8👍31
📚 Читаем EPUB с LLM 🚀
Легкий самодостаточный EPUB-ридер, позволяющий читать книги по главам и легко копировать текст для работы с LLM. Проект создан для вдохновения и не требует поддержки. Просто загружайте EPUB и читайте вместе с ИИ.

🚀 Основные моменты:
- Чтение EPUB-файлов по главам
- Удобный интерфейс для работы с LLM
- Легкая настройка и использование
- Проект для вдохновения, без поддержки

📌 GitHub: https://github.com/karpathy/reader3

#python
3👍2🤔2
🧠 ChatTutor: Интерактивный ИИ-учитель

Это ИИ-репетитор, использующий электронную доску для обучения. Он предоставляет пользователям возможность взаимодействовать с различными учебными инструментами, что делает процесс обучения более наглядным и эффективным, особенно в STEM-дисциплинах.

🚀Основные моменты:
- Интерактивные математические и логические канвасы
- Поддержка создания ментальных карт
- Многоагентная архитектура для улучшенного взаимодействия
- Возможность решения задач с помощью ИИ

📌 GitHub: https://github.com/sheepbox8646/ChatTutor

#javanoscript
👍3
🚀 **LongCat-Flash-Omni - новая открытыая560B omni-modal модель от Meituan

Новая SOTA-модель LongCat-Flash-Omni (560B параметров) - универсальная омнимодальная система, которая работает с видео, аудио, текстом и действиями в реальном времени.

Что в ней важно:

- Mixture-of-Experts архитектура - даёт высокую скорость и низкие задержки, несмотря на масштаб 560B.
- Полноценное мультимодальное понимание: видео + аудио + текст, обработка движений и сцен в потоке.
- Modality-decoupled parallelism — модель тренировали так, чтобы эффективно комбинировать разные типы данных, не тормозя обучение.
- Заявлен SOTA-уровень качества среди открытых омнимодальных моделей.

Технический отчёт: https://huggingface.co/papers/2511.00279
Модель: https://huggingface.co/meituan-longcat/LongCat-Flash-Omni
Проект: https://longcat.ai
5
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Трансформеры стали стандартом в NLP, но многие специалисты используют их как «чёрный ящик», не до конца понимая работу внимания, эмбеддингов и нормализации.

📅 24 ноября в 20:00 МСК состоится открытый урок «Анатомия нейросетей: от трансформеров к современным архитектурам» в рамках курса «NLP / Natural Language Processing».

🔍 Мы разберём ключевые механизмы современных моделей, покажем эволюцию архитектур и объясним, почему именно эти идеи лежат в основе BERT, GPT и других систем.

🎯 Вы увидите, как компоненты собираются в единую структуру, научитесь понимать их сильные и слабые стороны и сможете осознанно выбирать подход под задачу — от генерации текста до классификации и анализа.

👉 Зарегистрируйтесь на открытый урок в преддверии старта курса «NLP / Natural Language Processing» и получите скидку на обучение: https://otus.pw/GRjh0/?erid=2W5zFG4WT6Y

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
👎1
💡 Он пересказал материал WSJ о том, как Уолл-стрит фактически перекачивает огромные заёмные деньги в строительство AI-дата-центров - и как финансовые риски постепенно уходят в фонды, пенсионные планы и долговые продукты, которые покупают обычные люди.

Сегодня частные кредитные структуры вроде Blue Owl работают по схеме: несколько миллиардов собственного капитала + более $20 млрд долга, а всё это закрепляется 10–15-летними арендами от Meta, Oracle или Microsoft.
Деньги идут на гигантские площадки мощностью близкой к 1 ГВт и сотни тысяч GPU, но весь риск висит не на Big Tech, а на проектных компаниях, перегруженных кредитами.

Аналитики ожидают, что лидеры ИИ потратят около $3 трлн до 2028 года, но смогут профинансировать из операционного потока лишь половину.
Значит, 1.2–1.5 трлн долларов придётся занимать — через облигации, кредиты и частный капитал.

Эти долги нарезаются на инструменты с доходностью 6–7% и оказываются в ETF, взаимных фондах, страховых компаниях и пенсионных программах.
По сути, рядовые вкладчики незаметно становятся спонсорами AI-инфраструктуры.

Некоторые инвесторы уже заработали: например, Pimco в сделке Meta Hyperion получили $1–2 млрд бумажной прибыли, потому что облигации быстро подросли — в том числе благодаря сильным защитным условиям, гарантирующим выплаты даже если арендатор уйдёт.

Но самые уязвимые — высоко закредитованные структуры.
Если спрос на ИИ замедлится или маржа сузится, Big Tech всё равно успеет воспользоваться дешёвыми мощностями, а вот убытки лягут на широкий круг инвесторов, которые рассчитывали на «надёжный доход».

Источник: wsj.com/finance/investing/wall-street-ai-spending-bubble-810d270e
3👍3
🧠 На AI Journey представили новое поколение открытых моделей распознавания речи — GigaAM-v3, ставшее самым крупным обновлением стека ASR от Сбера.

Главное изменение — масштаб предобучения. Вместо стандартных 50k часов корпус расширили до 700k часов, а все данные прошли нормализацию и восстановление пунктуации через GigaChat Max Audio. Это позволило значительно улучшить понимание сложной, живой, эмоциональной речи.

Линейка включает CTC- и RNNT-модели, а также e2e-версии, которые добавляют пунктуацию прямо на выходе, что делает текст читаемым без постобработки.

По ключевым датасетам (OpenSTT, Golos, CV) новый стек сохраняет паритет, но на сложных доменах улучшения достигают 30–40%. Модель уже доступна разработчикам — исходники опубликованы в полном объёме.
🔥41😁1
Иногда ML-модели ошибаются не из-за алгоритма, а потому что “данные не те”

Проблемы с качеством данных — головная боль для каждого ML-инженера. Пока одни команды настраивают мониторинг дрейфа данных, другие ищут причины расхождений между экспериментальным и продакшен-окружением.

⚙️В такие моменты может помочь бот-генератор оправданий. Он предлагает технически подкованные объяснения для ситуаций, когда:
- данные для инференса пришли с аномалиями
- мониторинг моделей обнаружил концептуальный дрейф

Загляните к боту, когда метрики моделей начнут вести себя непредсказуемо — сгенерируйте убедительное оправдание и сразу отправьте коллегам в рабочий чат. Это поможет начать обсуждение проблемы с нестандартного ракурса.
👍3
🎤 Быстрый текст-в-речь с Supertonic

Supertonic — это высокопроизводительная система текст-в-речь, работающая на вашем устройстве. Она обеспечивает молниеносное создание речи с минимальными затратами ресурсов и полным соблюдением конфиденциальности. Никаких облачных решений — всё происходит локально.

🚀Основные моменты:
- Генерация речи до 167× быстрее реального времени
- 🪶 Легковесная архитектура с 66M параметрами
- 📱 Полная обработка на устройстве без задержек
- 🎨 Обработка сложных текстов без предварительной подготовки
- ⚙️ Гибкая настройка параметров и развертывания

📌 GitHub: https://github.com/supertone-inc/supertonic

#python
4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 На международной конференции AI Journey Сбер представил первого российского человекоподобного робота Грина

Что важно знать:

- разработкой полностью занимался Сбер, от конструкции и электроники до наполнения. То есть это полностью российский проект
- в основе искусственного интеллекта нейросеть GigaChat
- разработка заняла 1 год: от сбора команды инженеров и первого прототипа до презентации
- робот умеет перемещаться пространстве и манипулировать реальными объектами
👍8😁4👎2🔥1
📢 Сбер выпустил полную линейку моделей Kandinsky 5.0 в open-source

В открытом доступе теперь доступна вся линейка моделей под лицензией MIT. Код и веса неограниченно доступны для модификации и интеграции.

🤖 Больше о моделях:
- 🖼 Image Lite — генерация и редактирование HD-изображений с фокусом на русский культурный контекст. Превосходит FLUX.1 по Text-to-Image, паритет с FLUX.1 Kontext по Image Editing. Обучена на 520 млн изображений и ~1 млн картинок национального культурного кода.
- 📹 Video Lite — компактная версия, оптимизированная для GPU от 12 ГБ VRAM. Обучалась на 520 млн изображениях и 120 млн видео. Значительно лучше по качеству в 7 раз большую Wan 2.1-14B как в Text-to-Video, так и Image-to-Video.
- 🎥 Video Pro — флагман для генерации HD-видео до 10 секунд с контролем движения камеры. Обучена на 520 млн изображениях и 250 млн видео. Модель превосходит Wan 2.2-A14B и сравнима по визуальному качеству с Veo 3. Лучшая открытая модель в мире.
- ⚙️ K-VAE 1.0 — вариационные автоэнкодеры для диффузионных моделей с улучшенной сжимаемостью. Модели показывают более высокое качество восстановления сигнала по сравнению с лучшими альтернативами на открытых датасетах.

📌 GitHub: https://github.com/kandinskylab/kandinsky-5
📌 Gitverse: https://gitverse.ru/kandinsky/Kandinsky-5
📌 HuggingFace: https://huggingface.co/kandinskylab/collections
📌 Технический отчет: https://huggingface.co/papers/2511.14993
9👍4👎1
Пятница — чёрная, цены в Сервер Молл — красные!

Уже купили холодильник на 11.11? Теперь настоящая распродажа: Чёрная Пятница с 24 по 30 ноября в Сервер Молл — неделя огромных скидок на серверы и СХД от Dell, HPE и Lenovo!

Оборудование в наличии и готово к отправке. Нужна кастомная конфигурация? Подберём под любой бюджет и задачу: от почтового сервера и 1С до виртуализации и HPC.

Самое время обновить IT-инфраструктуру и уложиться в годовой бюджет.

От нас:
▪️ Гарантия 3–5 лет с выездом инженера в любой город России.
▪️ Бесплатная доставка 1–4 дня до двери.
▪️Постпродажная поддержка.
▪️КП за 30-60 минут.

📌  Скидки действуют, пока оборудование есть на складах. Смотрите подборку и бронируйте свой сервер по ссылке.

Если появятся вопросы, то пишите в чат или звоните 📞  8 800 755-25-51 — отвечаем быстро!

erid: 2W5zFGRMKLk
🔥1