Машинное обучение RU – Telegram
Машинное обучение RU
17.7K subscribers
1.58K photos
208 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
⭐️ Microsoft представили модель Rho-1: Not All Tokens Are What You Need

Главный тезис статьи - "не все токены одинаково важны для обучения языковой модели".

Microsoft выпустили новую языковую модель под названием Rho-1. В отличие от традиционных LMS, которые учатся предсказывать каждый следующий токен в корпусе, Rho-1 использует выборочное языковое моделирование (SLM), при котором используются только "полезные токены", соответствующим желаемому распределению.

Этот подход включает в себя оценку токенов предварительной подготовки с использованием эталонной модели, а затем обучение языковой модели с целенаправленными потерями на токенах с более высокими избыточными потерями.

При постоянном предварительном обучении на 15B OpenWebMath corpus Rho-1 обеспечивает абсолютное повышение точности до 30% при выполнении 9 математических заданий.

После файнтюнинга Rho-1-1B и 7B достигает SOTA результатов в 40,6% и 51,8% на датасете DeepSeekMath всего с 3% токенов предварительной подготовки.

Кроме того, при обучении с использованием 80B Rho-1 достигает среднего улучшения на 6,8% при выполнении 15 различных заданий.


Github: https://github.com/microsoft/rho
Paper: https://arxiv.org/abs/2404.07965

@machinelearning_ru
👍6🔥43😱2
🔥 Курс Геопространственный анализ данных (бета-версия)

Первый открытый русскоязычный курс по геоаналитике. Материалы курса будут полезны специалистам в области Data Scientist, поскольку позволят решать геопространственные задачи, а также проводить исследования в области Geospatial Data Science.

https://ods.ai/tracks/geoanalytics-course-spring24


@machinelearning_ru
👍8🔥41
📌Machine Learning в контекстной рекламе: как алгоритмы изменяют игру?

Machine Learning оказывает сильное влияние на рекламный рынок, в частности:
— Яндекс Директ теперь отслеживает конверсии с помощью машинного обучения
— Google Ads расширяет автоматизацию для различных видов рекламы
— Пользователям Яндекса предлагаются персонализированные советы по настройке рекламных кампаний
— Яндекс Аудитории обучается на поведении пользователей для улучшения таргетинга
— Умные кампании в Google Ads получили обновления, включая новый дизайн объявлений и улучшенные инструменты аналитики

Подробнее о том, что, зачем и как ML используется в контекстной рекламе — в статье.
Самое то, чтобы понять, чем вы скорее всего будете заниматься в компании после найма

📎 Статья

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👎2🔥2
🔥Подборка лучших обучающих каналов для программистов.

➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять

Машинное обучение

Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат

🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест

💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность

🚀 Data Science

Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data

🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных

#️⃣C#

С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа

🐍 Python

Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги

Java

Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги

💻 C++

C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии

⚡️ Frontend
Javanoscript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend

🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов

📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки

🇬🇧 Английский для программистов

🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence

🔥 DevOPs
Devops для программистов
Книги Devops

🌟 Docker/Kubernets
Docker
Kubernets

📓 Книги
Библиотеки Книг для программситов

💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
👍3😁2
💥 Google AI представляет CodecLM - платформу машинного обучения для генерации высококачественных синтетических данных для работы с LLM

CodecLM использует подход кодирования-декодирования, преобразуя исходные исходные инструкции в сжатые метаданные. Эти метаданные затем служат настройкой для создания синтетических данных, адаптированных к конкретным задачам пользователя. Эффективность CodecLM была подтверждена с помощью нескольких тестов, основанных на использовании инструкций в открытом доступе, которые демонстрируют значительные улучшения в согласовании LLM по сравнению с традиционными методами, не требующими подробного описания данных вручную.

Краткое содержание статьи : https://marktechpost.com/2024/04/13/google-ai-introduces-codeclm-a-machine-learning-framework-for-generating-high-quality-synthetic-data-for-llm-alignment/


@machinelearning_ru
🔥4👍3🥰1
😁25👍6🤩2
👉 Машинное обучение с помощью Ruby

Специально подобранный список включает в себя потрясающие библиотеки, источники данных, учебные пособия и презентации по машинному обучению с использованием языка программирования Ruby.

🔗 https://github.com/arbox/machine-learning-with-ruby

@machinelearning_ru
👍5🤔32🔥2
ML-специалисты тут? Вас уже ждут в Тинькофф!

Вместе с результативной командой вы будете генерировать гипотезы, ставить на их основе эксперименты, улучшать качество моделей и ускорять их работу в различных сценариях, оформлять эксперименты в воспроизводимые пайплайны и создавать масштабные ИТ-продукты.

Откликайтесь на вакансию, а компания не только обеспечит комфортные условия для работы, но и возможность воплотить свои идеи в больших ИТ-проектах

АО «Тинькофф Банк», ИНН 7710140679
👎2👍1
🌟 Universal-1 от AssemblyAI превзошел* Whisper от OpenAI

Почти год Whisper от OpenAI удерживал лидерство среди открытых решений для распознавания речи, но теперь пальму первенства среди API сервисов перехватила новая модель Universal-1 от AssemblyAI. Обученная на более чем 12,5 миллионах часов многоязычных аудиоданных, Universal-1 превосходит предыдущего лидера - Whisper от OpenAI, а также другие коммерческие решения по ключевым параметрам.

Universal-1 отличается высоким качеством распознавания речи, обеспечивая на 10% и более точные результаты на английском, испанском и немецком языках по сравнению с лучшими протестированными аналогами. При этом модель генерирует на 30% меньше некорректных вставок слов на обычной речи и на 90% - на фоновых шумах.

*это зависит от конкретных задач, но в некоторых он реально лучше Whisper

📎 Подробнее

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥64👍1🥰1
👉 Deep Learning For Music

Это крутой список научных статей, гайдов и библиотек по работе с музыкой.

🔗 https://github.com/ybayle/awesome-deep-learning-music

@machinelearning_ru
👍8🔥3🥰2
Forwarded from Javanoscript
⚡️ Топ-4 инструмента JavaScript для разработки ИИ

🟡1. AI.JSX
AI.JSX, разработанный Fixie, — это динамический фреймворк, предназначенный для создания разговорных приложений на базе ИИ с использованием JavaScript и JSX, который специально адаптирован для проектов на базе React.
Он выделяется среди инструментов для разработки ИИ благодаря надежной поддержке инжиниринга подсказок и легкой интеграции с внешними API.

🟡2. TensorFlow.js
Являясь JavaScript-адаптацией известной библиотеки TensorFlow, созданной Google, TensorFlow.js предназначена специально для веб- и Node.js-сред, чтобы привнести возможности машинного обучения непосредственно в браузеры и приложения на стороне сервера.
Одним из ключевых преимуществ TensorFlow.js является возможность запуска моделей МО непосредственно в браузере.

🟡3. Brain.js
Brain.js предлагает простой и доступный способ реализации нейронных сетей на JavaScript, подходящий как для браузера, так и для среды Node.js. Ключевое потенциальное применение Brain.js — автоматизация таких процессов, как анализ текста, объединение PDF-документов, преобразование документов, анализ изображений и, в целом, решение любых задач, связанных с обработкой большого количества данных.

🟡4. Tabnine
Tabnine — это помощник по завершению кода на базе ИИ, который значительно улучшает опыт написания кода. В частности, он ускоряет процесс разработки, активно поддерживая целостность кода.
ИИ Tabnine изучает кодовую базу и предлагает соответствующие фрагменты кода, завершения функций и даже целые блоки кода на основе комментариев на естественном языке.

@javanoscriptv
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍2👎1
⚡️ Эксперты по ИИ Matt Turck, Aman Kabeer и FirstMark представили все нейросети мира на одной картинке

Они собрали 2011 ИИ-стартапа и сервиса, разделённых на сферы применения.

В отдельных разделах есть ИИ-ассистенты для кодинга, продаж, копирайтинга, генераторы картинок, аудио, анимаций и многое другое.

📎Полный ландшафт ИИ-мира доступен в PDF

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7👎5🔥4🥰1
Forwarded from Machinelearning
🦾 🦏 Power of matplotlib

Вот такую красоту можно сделать с помощью matplotlib. Это визуализация гравюры немецкого художника Альбрехта Дюрера, изображающая индийского носорога, каким его представлял художник по доступным ему описаниям и рисункам в 1515.

Хотите научиться та к же: вот крутая бесплатная книга: "Научная визуализация: Python + Matplotlib"

Исходники книги c примерами кода лежат здесь.

Постер
Книга
Код из книги

@ai_machinelearning_big_data
👍8🔥3