18 апреля, 18:00
MLечный путь 2024
Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.
В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.
Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.
Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/fz2ym
Реклама ООО «Селектел» erid 2VtzqxQeAu4
MLечный путь 2024
Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.
В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.
Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.
Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/fz2ym
Реклама ООО «Селектел» erid 2VtzqxQeAu4
❤1👍1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3🔥2👎1
Gemma от DeepMind теперь умеет генерировал качественный код! 🤯 🔔
Code Gemm - набор моделей с открытым кодом. Code Gemma доступен в двух разных размерах 2B и 7B.
🧮 2B и 7B с контекстом 8192 тыс.
🛫 инициализирован из базы Gemma
🔠 Обучен на 500 тыс. токенах (веб, код и математика)
🛠 Отлаженный инструктаж с помощью SFT и RLHF
✅ 2B достигает 27% при оценке пользователем, а 7B - 52%%
✅ Разрешено коммерческое использование
✅ Оптимизировано для генерации кода на любомустройстве
✅ Доступно на huggingface
• Blog: https://hf.co/blog/codegemma
• Models: https://huggingface.co/models?library=transformers&sort=trending&search=google%2Fcodegemma
• Report: https://goo.gle/codegemma
• Google Blog: https://developers.googleblog.com/2024/04/gemma-family-expands.html
@machinelearning_ru
Code Gemm - набор моделей с открытым кодом. Code Gemma доступен в двух разных размерах 2B и 7B.
🧮 2B и 7B с контекстом 8192 тыс.
🛫 инициализирован из базы Gemma
🔠 Обучен на 500 тыс. токенах (веб, код и математика)
🛠 Отлаженный инструктаж с помощью SFT и RLHF
✅ 2B достигает 27% при оценке пользователем, а 7B - 52%%
✅ Разрешено коммерческое использование
✅ Оптимизировано для генерации кода на любомустройстве
✅ Доступно на huggingface
• Blog: https://hf.co/blog/codegemma
• Models: https://huggingface.co/models?library=transformers&sort=trending&search=google%2Fcodegemma
• Report: https://goo.gle/codegemma
• Google Blog: https://developers.googleblog.com/2024/04/gemma-family-expands.html
@machinelearning_ru
👍10🔥3❤1
18 апреля, 18:00
MLечный путь 2024
Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.
В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.
Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.
Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/fz2ym
Реклама ООО «Селектел» erid 2VtzqxQeAu4
MLечный путь 2024
Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.
В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.
Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.
Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/fz2ym
Реклама ООО «Селектел» erid 2VtzqxQeAu4
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
⭐️ DddCode released CVPR '24: "LEGaussians: Language Embedded 3D Gaussians for Open-Vocabulary Scene Understanding"
▪code: https://github.com/buaavrcg/LEGaussians
▪project: https://buaavrcg.github.io/LEGaussians/
@machinelearning_ru
▪code: https://github.com/buaavrcg/LEGaussians
▪project: https://buaavrcg.github.io/LEGaussians/
@machinelearning_ru
❤3👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Генеративная модель Google Imagen 2 теперь может создавать короткие 4-секундные живые изображения в режиме реального времени с помощью промптов.
Доступен для использования в облачной платформе искусственного интеллекта Google Vertex. → https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-gemini-image-2-and-mlops-updates
#GoogleCloudNext в Google
@machinelearning_ru
Доступен для использования в облачной платформе искусственного интеллекта Google Vertex. → https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-gemini-image-2-and-mlops-updates
#GoogleCloudNext в Google
@machinelearning_ru
👍8❤2🥰1
Новая версия API стала доступна в составе нового сервиса облачной платформы Yandex Foundation Models, который объединяет несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска. О том, как команда отбирала данные для обучения YandexART, добивалась повышения эффективности работы и замеряла качество генерации, рассказали в статье.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥1
🎼 MuPT: Предварительно обученный генератор музыки
Предварительно обученные моделеи для генерации музыки, основанные на архитектуре Llama.
проект: https://map-mupt.github.io
abs: https://arxiv.org/abs/2404.06393
@machinelearning_ru
Предварительно обученные моделеи для генерации музыки, основанные на архитектуре Llama.
проект: https://map-mupt.github.io
abs: https://arxiv.org/abs/2404.06393
@machinelearning_ru
❤3👍1🔥1
Google представляет Leave No Context Behind: эффективные бесконечные преобразователи контекста с помощью Infini-attention
Модель 1B, которая была доработана до 5 тыс. последовательностей, решает проблему длины в 1 м
https://arxiv.org/abs/2404.07143
@machinelearning_ru
Модель 1B, которая была доработана до 5 тыс. последовательностей, решает проблему длины в 1 м
https://arxiv.org/abs/2404.07143
@machinelearning_ru
👍5🔥4❤3
NVIDIA’s New Tech: Master of Illusions!
https://www.youtube.com/watch?v=AW7WhX92eWk
@machinelearning_ru
https://www.youtube.com/watch?v=AW7WhX92eWk
@machinelearning_ru
YouTube
NVIDIA’s New Tech: Master of Illusions!
❤️ Check out Microsoft Azure AI and try it out for free:
https://azure.microsoft.com/en-us/solutions/ai
📝 The paper "ViCMA: Visual Control of Multibody Animations" is available here:
https://research.nvidia.com/labs/prl/vicma/
📝 The paper "Inverse-Foley…
https://azure.microsoft.com/en-us/solutions/ai
📝 The paper "ViCMA: Visual Control of Multibody Animations" is available here:
https://research.nvidia.com/labs/prl/vicma/
📝 The paper "Inverse-Foley…
👍5🔥4❤2
⭐️ Microsoft представили модель Rho-1: Not All Tokens Are What You Need
Главный тезис статьи - "не все токены одинаково важны для обучения языковой модели".
Microsoft выпустили новую языковую модель под названием Rho-1. В отличие от традиционных LMS, которые учатся предсказывать каждый следующий токен в корпусе, Rho-1 использует выборочное языковое моделирование (SLM), при котором используются только "полезные токены", соответствующим желаемому распределению.
Этот подход включает в себя оценку токенов предварительной подготовки с использованием эталонной модели, а затем обучение языковой модели с целенаправленными потерями на токенах с более высокими избыточными потерями.
При постоянном предварительном обучении на 15B OpenWebMath corpus Rho-1 обеспечивает абсолютное повышение точности до 30% при выполнении 9 математических заданий.
После файнтюнинга Rho-1-1B и 7B достигает SOTA результатов в 40,6% и 51,8% на датасете DeepSeekMath всего с 3% токенов предварительной подготовки.
Кроме того, при обучении с использованием 80B Rho-1 достигает среднего улучшения на 6,8% при выполнении 15 различных заданий.
Github: https://github.com/microsoft/rho
Paper: https://arxiv.org/abs/2404.07965
@machinelearning_ru
Главный тезис статьи - "не все токены одинаково важны для обучения языковой модели".
Microsoft выпустили новую языковую модель под названием Rho-1. В отличие от традиционных LMS, которые учатся предсказывать каждый следующий токен в корпусе, Rho-1 использует выборочное языковое моделирование (SLM), при котором используются только "полезные токены", соответствующим желаемому распределению.
Этот подход включает в себя оценку токенов предварительной подготовки с использованием эталонной модели, а затем обучение языковой модели с целенаправленными потерями на токенах с более высокими избыточными потерями.
При постоянном предварительном обучении на 15B OpenWebMath corpus Rho-1 обеспечивает абсолютное повышение точности до 30% при выполнении 9 математических заданий.
После файнтюнинга Rho-1-1B и 7B достигает SOTA результатов в 40,6% и 51,8% на датасете DeepSeekMath всего с 3% токенов предварительной подготовки.
Кроме того, при обучении с использованием 80B Rho-1 достигает среднего улучшения на 6,8% при выполнении 15 различных заданий.
Github: https://github.com/microsoft/rho
Paper: https://arxiv.org/abs/2404.07965
@machinelearning_ru
👍6🔥4❤3😱2
🔥 Курс Геопространственный анализ данных (бета-версия)
Первый открытый русскоязычный курс по геоаналитике. Материалы курса будут полезны специалистам в области Data Scientist, поскольку позволят решать геопространственные задачи, а также проводить исследования в области Geospatial Data Science.
https://ods.ai/tracks/geoanalytics-course-spring24
@machinelearning_ru
Первый открытый русскоязычный курс по геоаналитике. Материалы курса будут полезны специалистам в области Data Scientist, поскольку позволят решать геопространственные задачи, а также проводить исследования в области Geospatial Data Science.
https://ods.ai/tracks/geoanalytics-course-spring24
@machinelearning_ru
👍8🔥4❤1
⚡️ DeepMind’s New AI Saw 15,000,000,000 Chess Boards!
https://www.youtube.com/watch?v=uz83G-2ny8Q
@machinelearning_ru
https://www.youtube.com/watch?v=uz83G-2ny8Q
@machinelearning_ru
YouTube
DeepMind’s New AI Saw 15,000,000,000 Chess Boards!
❤️ Check out Microsoft Azure AI and try it out for free:
https://azure.microsoft.com/en-us/solutions/ai
📝 The paper "Grandmaster-Level Chess Without Search" is available here:
https://arxiv.org/abs/2402.04494
+1:
https://www.anthropic.com/news/decomposing…
https://azure.microsoft.com/en-us/solutions/ai
📝 The paper "Grandmaster-Level Chess Without Search" is available here:
https://arxiv.org/abs/2402.04494
+1:
https://www.anthropic.com/news/decomposing…
👍4❤1
Machine Learning оказывает сильное влияние на рекламный рынок, в частности:
— Яндекс Директ теперь отслеживает конверсии с помощью машинного обучения
— Google Ads расширяет автоматизацию для различных видов рекламы
— Пользователям Яндекса предлагаются персонализированные советы по настройке рекламных кампаний
— Яндекс Аудитории обучается на поведении пользователей для улучшения таргетинга
— Умные кампании в Google Ads получили обновления, включая новый дизайн объявлений и улучшенные инструменты аналитики
Подробнее о том, что, зачем и как ML используется в контекстной рекламе — в статье.
Самое то, чтобы понять, чем вы скорее всего будете заниматься в компании после найма
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👎2🔥2
🔥Подборка лучших обучающих каналов для программистов.
➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять
⚡Машинное обучение
Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат
🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест
💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность
🚀 Data Science
Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data
🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных
#️⃣C#
С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа
🐍 Python
Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги
☕ Java
Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги
💻 C++
C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии
⚡️ Frontend
Javanoscript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend
🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов
📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки
🇬🇧 Английский для программистов
🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence
🔥 DevOPs
Devops для программистов
Книги Devops
🌟 Docker/Kubernets
Docker
Kubernets
📓 Книги
Библиотеки Книг для программситов
💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять
⚡Машинное обучение
Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат
🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест
💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность
🚀 Data Science
Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data
🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных
#️⃣C#
С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа
🐍 Python
Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги
☕ Java
Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги
💻 C++
C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии
⚡️ Frontend
Javanoscript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend
🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов
📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки
🇬🇧 Английский для программистов
🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence
🔥 DevOPs
Devops для программистов
Книги Devops
🌟 Docker/Kubernets
Docker
Kubernets
📓 Книги
Библиотеки Книг для программситов
💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
👍3😁2
💥 Google AI представляет CodecLM - платформу машинного обучения для генерации высококачественных синтетических данных для работы с LLM
CodecLM использует подход кодирования-декодирования, преобразуя исходные исходные инструкции в сжатые метаданные. Эти метаданные затем служат настройкой для создания синтетических данных, адаптированных к конкретным задачам пользователя. Эффективность CodecLM была подтверждена с помощью нескольких тестов, основанных на использовании инструкций в открытом доступе, которые демонстрируют значительные улучшения в согласовании LLM по сравнению с традиционными методами, не требующими подробного описания данных вручную.
Краткое содержание статьи : https://marktechpost.com/2024/04/13/google-ai-introduces-codeclm-a-machine-learning-framework-for-generating-high-quality-synthetic-data-for-llm-alignment/
@machinelearning_ru
CodecLM использует подход кодирования-декодирования, преобразуя исходные исходные инструкции в сжатые метаданные. Эти метаданные затем служат настройкой для создания синтетических данных, адаптированных к конкретным задачам пользователя. Эффективность CodecLM была подтверждена с помощью нескольких тестов, основанных на использовании инструкций в открытом доступе, которые демонстрируют значительные улучшения в согласовании LLM по сравнению с традиционными методами, не требующими подробного описания данных вручную.
Краткое содержание статьи : https://marktechpost.com/2024/04/13/google-ai-introduces-codeclm-a-machine-learning-framework-for-generating-high-quality-synthetic-data-for-llm-alignment/
@machinelearning_ru
MarkTechPost
Google AI Introduces CodecLM: A Machine Learning Framework for Generating High-Quality Synthetic Data for LLM Alignment
Large Language Models (LLMs) are pivotal in advancing natural language processing tasks due to their profound understanding and generation capabilities. These models are constantly refined to better comprehend and execute complex instructions across varied…
🔥4👍3🥰1
👉 Машинное обучение с помощью Ruby
Специально подобранный список включает в себя потрясающие библиотеки, источники данных, учебные пособия и презентации по машинному обучению с использованием языка программирования Ruby.
🔗 https://github.com/arbox/machine-learning-with-ruby
@machinelearning_ru
Специально подобранный список включает в себя потрясающие библиотеки, источники данных, учебные пособия и презентации по машинному обучению с использованием языка программирования Ruby.
🔗 https://github.com/arbox/machine-learning-with-ruby
@machinelearning_ru
👍5🤔3❤2🔥2