Машинное обучение RU – Telegram
Машинное обучение RU
17.7K subscribers
1.58K photos
208 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🔥Подборка лучших обучающих каналов для программистов.

➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять

Машинное обучение

Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат

🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест

💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность

🚀 Data Science

Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data

🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных

#️⃣C#

С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа

🐍 Python

Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги

Java

Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги

💻 C++

C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии

⚡️ Frontend
Javanoscript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend

🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов

📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки

🇬🇧 Английский для программистов

🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence

🔥 DevOPs
Devops для программистов
Книги Devops

🌟 Docker/Kubernets
Docker
Kubernets

📓 Книги
Библиотеки Книг для программситов

💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
👍3😁2
💥 Google AI представляет CodecLM - платформу машинного обучения для генерации высококачественных синтетических данных для работы с LLM

CodecLM использует подход кодирования-декодирования, преобразуя исходные исходные инструкции в сжатые метаданные. Эти метаданные затем служат настройкой для создания синтетических данных, адаптированных к конкретным задачам пользователя. Эффективность CodecLM была подтверждена с помощью нескольких тестов, основанных на использовании инструкций в открытом доступе, которые демонстрируют значительные улучшения в согласовании LLM по сравнению с традиционными методами, не требующими подробного описания данных вручную.

Краткое содержание статьи : https://marktechpost.com/2024/04/13/google-ai-introduces-codeclm-a-machine-learning-framework-for-generating-high-quality-synthetic-data-for-llm-alignment/


@machinelearning_ru
🔥4👍3🥰1
😁25👍6🤩2
👉 Машинное обучение с помощью Ruby

Специально подобранный список включает в себя потрясающие библиотеки, источники данных, учебные пособия и презентации по машинному обучению с использованием языка программирования Ruby.

🔗 https://github.com/arbox/machine-learning-with-ruby

@machinelearning_ru
👍5🤔32🔥2
ML-специалисты тут? Вас уже ждут в Тинькофф!

Вместе с результативной командой вы будете генерировать гипотезы, ставить на их основе эксперименты, улучшать качество моделей и ускорять их работу в различных сценариях, оформлять эксперименты в воспроизводимые пайплайны и создавать масштабные ИТ-продукты.

Откликайтесь на вакансию, а компания не только обеспечит комфортные условия для работы, но и возможность воплотить свои идеи в больших ИТ-проектах

АО «Тинькофф Банк», ИНН 7710140679
👎2👍1
🌟 Universal-1 от AssemblyAI превзошел* Whisper от OpenAI

Почти год Whisper от OpenAI удерживал лидерство среди открытых решений для распознавания речи, но теперь пальму первенства среди API сервисов перехватила новая модель Universal-1 от AssemblyAI. Обученная на более чем 12,5 миллионах часов многоязычных аудиоданных, Universal-1 превосходит предыдущего лидера - Whisper от OpenAI, а также другие коммерческие решения по ключевым параметрам.

Universal-1 отличается высоким качеством распознавания речи, обеспечивая на 10% и более точные результаты на английском, испанском и немецком языках по сравнению с лучшими протестированными аналогами. При этом модель генерирует на 30% меньше некорректных вставок слов на обычной речи и на 90% - на фоновых шумах.

*это зависит от конкретных задач, но в некоторых он реально лучше Whisper

📎 Подробнее

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥64👍1🥰1
👉 Deep Learning For Music

Это крутой список научных статей, гайдов и библиотек по работе с музыкой.

🔗 https://github.com/ybayle/awesome-deep-learning-music

@machinelearning_ru
👍8🔥3🥰2
Forwarded from Javanoscript
⚡️ Топ-4 инструмента JavaScript для разработки ИИ

🟡1. AI.JSX
AI.JSX, разработанный Fixie, — это динамический фреймворк, предназначенный для создания разговорных приложений на базе ИИ с использованием JavaScript и JSX, который специально адаптирован для проектов на базе React.
Он выделяется среди инструментов для разработки ИИ благодаря надежной поддержке инжиниринга подсказок и легкой интеграции с внешними API.

🟡2. TensorFlow.js
Являясь JavaScript-адаптацией известной библиотеки TensorFlow, созданной Google, TensorFlow.js предназначена специально для веб- и Node.js-сред, чтобы привнести возможности машинного обучения непосредственно в браузеры и приложения на стороне сервера.
Одним из ключевых преимуществ TensorFlow.js является возможность запуска моделей МО непосредственно в браузере.

🟡3. Brain.js
Brain.js предлагает простой и доступный способ реализации нейронных сетей на JavaScript, подходящий как для браузера, так и для среды Node.js. Ключевое потенциальное применение Brain.js — автоматизация таких процессов, как анализ текста, объединение PDF-документов, преобразование документов, анализ изображений и, в целом, решение любых задач, связанных с обработкой большого количества данных.

🟡4. Tabnine
Tabnine — это помощник по завершению кода на базе ИИ, который значительно улучшает опыт написания кода. В частности, он ускоряет процесс разработки, активно поддерживая целостность кода.
ИИ Tabnine изучает кодовую базу и предлагает соответствующие фрагменты кода, завершения функций и даже целые блоки кода на основе комментариев на естественном языке.

@javanoscriptv
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍2👎1
⚡️ Эксперты по ИИ Matt Turck, Aman Kabeer и FirstMark представили все нейросети мира на одной картинке

Они собрали 2011 ИИ-стартапа и сервиса, разделённых на сферы применения.

В отдельных разделах есть ИИ-ассистенты для кодинга, продаж, копирайтинга, генераторы картинок, аудио, анимаций и многое другое.

📎Полный ландшафт ИИ-мира доступен в PDF

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7👎5🔥4🥰1
Forwarded from Machinelearning
🦾 🦏 Power of matplotlib

Вот такую красоту можно сделать с помощью matplotlib. Это визуализация гравюры немецкого художника Альбрехта Дюрера, изображающая индийского носорога, каким его представлял художник по доступным ему описаниям и рисункам в 1515.

Хотите научиться та к же: вот крутая бесплатная книга: "Научная визуализация: Python + Matplotlib"

Исходники книги c примерами кода лежат здесь.

Постер
Книга
Код из книги

@ai_machinelearning_big_data
👍8🔥3
📉 Nvidia подешевела на 10% после выхода на рынок Llama-3.

Зачем покупать графические процессоры для обучения LLM, когда у нас уже есть несколько LLM мирового класса с открытым исходным кодом 🤷‍♀️ 🤷‍♀️

@machinelearning_ru
15👍9🔥1
🚀 Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения за неделю

🔎 Дайджест

@machinelearning_ru
👍61
📌CatBoost

CatBoost — это популярная open-source библиотека градиентного бустинга на решающих деревьях с поддержкой категориальных фичей из коробки, преемник алгоритма MatrixNet, разработанного Яндексом.
В плане простоты использования и легкости входа для новичков, пожалуй является топ-1 библиотекой для табличных данных и вот почему:

Принимает категориальные фичи сразу без всякой предварительной обработки.

Чтобы перенести обучение с CPU на GPU достаточно поменять значение 1 параметра, без установки доп.пакетов или специальных версий, как в других библиотеках

Даже с дефолтными параметрами выдает хорошую точность модели. Основные параметры не константные, а подбираются самой библиотекой, в зависимости от размера входных данных.

Может принимать текстовые признаки, эмбеддинги, временные признаки.

Без дополнительных манипуляций и оберток встраивается в стандартные пайплайны (например, sklearn).

Идет в комплекте с "батарейками": feature_selection, object_selection, cross_validation, grid_search и пр.

Если вы ещё не знакомы с CatBoost — самое время это исправить
📎 Вот полезный практический Google Colab с CatBoost

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍6🔥5
🦾 Dataset of 15 trillion tokens

Только что был опубликован датасет из 15 триллионов токенов (столько же, сколько было использовано для обучения Llama 3)!!!

Скачайте его, пока он не был удален из-за авторских прав.

https://huggingface.co/datasets/HuggingFaceFW/fineweb

@machinelearning_ru
👍10🔥42😁2🤯2