Машинное обучение RU – Telegram
Машинное обучение RU
17.7K subscribers
1.58K photos
208 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
⚡️ The RealHumanEval: Оценка возможностей больших языковых моделей для поддержки программистов

Новый веб-интерфейс для оценки способности Lms помогать программистам с помощью автозаполнения или поддержки в чате репозиторий: https://github.com/clinicalml/realhumaneval
abs: https://arxiv.org/abs/2404.02806

@machinelearning_ru
👍72🔥2
📌Stability AI представила обновление модели Stable Audio 2.0

Stability AI рассказала в блоге о релизе модели машинного обучения Stable Audio 2.0. После обновления нейросеть может генерировать музыкальные композиции длительностью до трёх минут в стерео и с частотой дискретизации 44,1 кГц. Кроме того, пользователи могут загружать свои треки и изменять их с помощью промптов.

📎 Подробнее

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72
18 апреля, 18:00
MLечный путь 2024


Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.

В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.

Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.

Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/fz2ym

Реклама ООО «Селектел» erid 2VtzqxQeAu4
1👍1
📌Nvidia и Indosat построят в Индонезии ИИ-центр стоимостью $200 млн

Nvidia и индонезийская телекоммуникационная компания Indosat Ooredoo Hutchison планируют построить ИИ-центр стоимостью $200 млн в Центральной Яве, провинции Индонезии, являющейся крупнейшей экономикой Юго-Восточной Азии. Об этом сообщило агентство Reuters со ссылкой на заявление министра связи страны Буди Арие Сетиади (Budi Arie Setiadi).

Согласно заявлению Министерства связи и информатики Индонезии, новый ИИ-центр будет построен в Суракарте в конце этого года. «Почему в Суракарте? Потому что они готовы, имеют хорошие человеческие ресурсы и инфраструктуру 5G», — отметил глава ведомства. По словам представителя Indosat Стива Саеранга (Steve Saerang), сотрудничество с Nvidia будет способствовать развитию технологической инфраструктуры в Индонезии. Indosat в настоящее время более глубоко углубляется в сферу цифровых сервисов, стремясь выйти за рамки телекоммуникаций и предлагать более широкий спектр услуг, пишет Nikkei Asia.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3🔥2👎1
Gemma от DeepMind теперь умеет генерировал качественный код! 🤯 🔔

Code Gemm - набор моделей с открытым кодом. Code Gemma доступен в двух разных размерах 2B и 7B.

🧮 2B и 7B с контекстом 8192 тыс.
🛫 инициализирован из базы Gemma
🔠 Обучен на 500 тыс. токенах (веб, код и математика)
🛠 Отлаженный инструктаж с помощью SFT и RLHF
2B достигает 27% при оценке пользователем, а 7B - 52%%
Разрешено коммерческое использование
Оптимизировано для генерации кода на любомустройстве
Доступно на huggingface

Blog: https://hf.co/blog/codegemma
Models: https://huggingface.co/models?library=transformers&sort=trending&search=google%2Fcodegemma
Report: https://goo.gle/codegemma
Google Blog: https://developers.googleblog.com/2024/04/gemma-family-expands.html

@machinelearning_ru
👍10🔥31
18 апреля, 18:00
MLечный путь 2024


Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.

В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.

Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.

Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/fz2ym

Реклама ООО «Селектел» erid 2VtzqxQeAu4
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
⭐️ DddCode released CVPR '24: "LEGaussians: Language Embedded 3D Gaussians for Open-Vocabulary Scene Understanding"

code: https://github.com/buaavrcg/LEGaussians
project: https://buaavrcg.github.io/LEGaussians/

@machinelearning_ru
3👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Генеративная модель Google Imagen 2 теперь может создавать короткие 4-секундные живые изображения в режиме реального времени с помощью промптов.

Доступен для использования в облачной платформе искусственного интеллекта Google Vertex. → https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-gemini-image-2-and-mlops-updates

#GoogleCloudNext в Google

@machinelearning_ru
👍82🥰1
📌 Yandex Cloud открыла для тестирования компаниями YandexART v2

Новая версия API стала доступна в составе нового сервиса облачной платформы Yandex Foundation Models, который объединяет несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска. О том, как команда отбирала данные для обучения YandexART, добивалась повышения эффективности работы и замеряла качество генерации, рассказали в статье.

📎 Подробнее

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥1
🎼 MuPT: Предварительно обученный генератор музыки

Предварительно обученные моделеи для генерации музыки, основанные на архитектуре Llama.

проект: https://map-mupt.github.io
abs: https://arxiv.org/abs/2404.06393

@machinelearning_ru
3👍1🔥1
Google представляет Leave No Context Behind: эффективные бесконечные преобразователи контекста с помощью Infini-attention

Модель 1B, которая была доработана до 5 тыс. последовательностей, решает проблему длины в 1 м

https://arxiv.org/abs/2404.07143

@machinelearning_ru
👍5🔥43
⭐️ Microsoft представили модель Rho-1: Not All Tokens Are What You Need

Главный тезис статьи - "не все токены одинаково важны для обучения языковой модели".

Microsoft выпустили новую языковую модель под названием Rho-1. В отличие от традиционных LMS, которые учатся предсказывать каждый следующий токен в корпусе, Rho-1 использует выборочное языковое моделирование (SLM), при котором используются только "полезные токены", соответствующим желаемому распределению.

Этот подход включает в себя оценку токенов предварительной подготовки с использованием эталонной модели, а затем обучение языковой модели с целенаправленными потерями на токенах с более высокими избыточными потерями.

При постоянном предварительном обучении на 15B OpenWebMath corpus Rho-1 обеспечивает абсолютное повышение точности до 30% при выполнении 9 математических заданий.

После файнтюнинга Rho-1-1B и 7B достигает SOTA результатов в 40,6% и 51,8% на датасете DeepSeekMath всего с 3% токенов предварительной подготовки.

Кроме того, при обучении с использованием 80B Rho-1 достигает среднего улучшения на 6,8% при выполнении 15 различных заданий.


Github: https://github.com/microsoft/rho
Paper: https://arxiv.org/abs/2404.07965

@machinelearning_ru
👍6🔥43😱2
🔥 Курс Геопространственный анализ данных (бета-версия)

Первый открытый русскоязычный курс по геоаналитике. Материалы курса будут полезны специалистам в области Data Scientist, поскольку позволят решать геопространственные задачи, а также проводить исследования в области Geospatial Data Science.

https://ods.ai/tracks/geoanalytics-course-spring24


@machinelearning_ru
👍8🔥41
📌Machine Learning в контекстной рекламе: как алгоритмы изменяют игру?

Machine Learning оказывает сильное влияние на рекламный рынок, в частности:
— Яндекс Директ теперь отслеживает конверсии с помощью машинного обучения
— Google Ads расширяет автоматизацию для различных видов рекламы
— Пользователям Яндекса предлагаются персонализированные советы по настройке рекламных кампаний
— Яндекс Аудитории обучается на поведении пользователей для улучшения таргетинга
— Умные кампании в Google Ads получили обновления, включая новый дизайн объявлений и улучшенные инструменты аналитики

Подробнее о том, что, зачем и как ML используется в контекстной рекламе — в статье.
Самое то, чтобы понять, чем вы скорее всего будете заниматься в компании после найма

📎 Статья

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👎2🔥2
🔥Подборка лучших обучающих каналов для программистов.

➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять

Машинное обучение

Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат

🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест

💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность

🚀 Data Science

Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data

🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных

#️⃣C#

С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа

🐍 Python

Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги

Java

Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги

💻 C++

C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии

⚡️ Frontend
Javanoscript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend

🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов

📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки

🇬🇧 Английский для программистов

🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence

🔥 DevOPs
Devops для программистов
Книги Devops

🌟 Docker/Kubernets
Docker
Kubernets

📓 Книги
Библиотеки Книг для программситов

💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
👍3😁2
💥 Google AI представляет CodecLM - платформу машинного обучения для генерации высококачественных синтетических данных для работы с LLM

CodecLM использует подход кодирования-декодирования, преобразуя исходные исходные инструкции в сжатые метаданные. Эти метаданные затем служат настройкой для создания синтетических данных, адаптированных к конкретным задачам пользователя. Эффективность CodecLM была подтверждена с помощью нескольких тестов, основанных на использовании инструкций в открытом доступе, которые демонстрируют значительные улучшения в согласовании LLM по сравнению с традиционными методами, не требующими подробного описания данных вручную.

Краткое содержание статьи : https://marktechpost.com/2024/04/13/google-ai-introduces-codeclm-a-machine-learning-framework-for-generating-high-quality-synthetic-data-for-llm-alignment/


@machinelearning_ru
🔥4👍3🥰1