Vote If you want see ML stories
Проголосуйте за нас, если вы хотите увидеть ML сторисы от нашего канала/
Версия телеграм должна быть последней, работает только с премиум подписчиками. Для всех, кто проголосовал, будет доступен премиум контент в буст чате.
https://news.1rj.ru/str/ai_machinelearning_big_data?boost
Проголосуйте за нас, если вы хотите увидеть ML сторисы от нашего канала/
Версия телеграм должна быть последней, работает только с премиум подписчиками. Для всех, кто проголосовал, будет доступен премиум контент в буст чате.
https://news.1rj.ru/str/ai_machinelearning_big_data?boost
Telegram
Machinelearning
Проголосуйте за канал, чтобы он получил больше возможностей.
❤14👍1
🚀 Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism
Gold-YOLO, which boosts the multi-scale feature fusion capabilities and achieves an ideal balance between latency and accuracy across all model scales.
Модель Gold-YOLO-N достигает выдающегося результата в обнаружении объектов и превосходит предыдущую модель SOTA YOLOv6-3.0-N с аналогичным FPS.
🖥 Github: https://github.com/huawei-noah/Efficient-Computing/tree/master/Detection/Gold-YOLO
📕 Paper: https://arxiv.org/abs/2309.11331v2
⏩ Dataset: https://paperswithcode.com/dataset/coco
ai_machinelearning_big_data?boost - boost to see premium content
Gold-YOLO, which boosts the multi-scale feature fusion capabilities and achieves an ideal balance between latency and accuracy across all model scales.
Модель Gold-YOLO-N достигает выдающегося результата в обнаружении объектов и превосходит предыдущую модель SOTA YOLOv6-3.0-N с аналогичным FPS.
ai_machinelearning_big_data?boost - boost to see premium content
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥4🥰2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Framework that harnesses the power of a text-to-image diffusion model for the task of text-driven video editing.
TokenFlow - это фреймворк, позволяющий последовательно редактировать видео, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.
Нейросеть генерирует анимации высокого качества, сохраняя расположение и динамику из исходого ролика.
🤗HF: https://huggingface.co/spaces/weizmannscience/tokenflow
ai_machinelearning_big_data?boost - boost to see premium content
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥7❤4
🗣 Leveraging In-the-Wild Data for Effective Self-Supervised Pretraining in Speaker Recognition
Продвинутый инструментарий и набор данных для задач распознавания говорящего.
🖥 Github: https://github.com/wenet-e2e/wespeaker
📕 Paper: https://arxiv.org/abs/2309.11730v1
⏩ Demo: https://huggingface.co/spaces/wenet/wespeaker_demo
⭐️ Dataset: https://paperswithcode.com/dataset/wenetspeech
ai_machinelearning_big_data
Продвинутый инструментарий и набор данных для задач распознавания говорящего.
pip3 install wespeakerruntimeai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27👍7❤4🥰1
🔎Detect Every Thing with Few Examples
DE-ViT surpasses the few-shot SoTA by 15 mAP on 10-shot and 7.2 mAP on 30-shot and one-shot SoTA by 2.8 AP50.
Высокоточный детектор объектов, который в отличие от популярного подхода с открытым словарем, описывает каждую категорию объектов не языком, а несколькими опорными изображениями. DE-ViT демонстрирует новые достижения в области обнаружения объектов с открытым словарем, несколькими снимками и одним снимком в сравнении с COCO и LVIS .
🖥 Github: https://github.com/mlzxy/devit
📕 Paper: https://arxiv.org/abs/2309.12969v1
⭐️ Dataset: https://paperswithcode.com/dataset/mscoco
ai_machinelearning_big_data
DE-ViT surpasses the few-shot SoTA by 15 mAP on 10-shot and 7.2 mAP on 30-shot and one-shot SoTA by 2.8 AP50.
Высокоточный детектор объектов, который в отличие от популярного подхода с открытым словарем, описывает каждую категорию объектов не языком, а несколькими опорными изображениями. DE-ViT демонстрирует новые достижения в области обнаружения объектов с открытым словарем, несколькими снимками и одним снимком в сравнении с COCO и LVIS .
git clone https://github.com/mlzxy/devit.gitai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥4❤2😁1
🎓 BayesDLL: Bayesian Deep Learning Library
New Bayesian neural network library for PyTorch for large-scale deep network
Новая библиотека байесовских нейронных сетей для PyTorch, предназначенную для работы с крупномасштабными глубокими сетями.
В библиотеке реализованы основные алгоритмы приближенного байесовского вывода: вариационный вывод, MC-dropout, стохастически-градиентный MCMC и аппроксимация Лапласа.
Основные отличия от других существующих библиотек байесовских нейронных сетей заключаются в следующем:
1) библиотека может работать с очень крупными моделями, в том числе с Vision Transformers
2) Практически не требует от пользователей модификации кода .
3)Позволяет использовать предварительно обученные веса модели в качестве средних значений, что полезно для проведения байесовских вычислений в крупномасштабных моделях типа ViTs, которые трудно оптимизировать с нуля на основе одних только исходных данных.
🖥 Github: https://github.com/samsunglabs/bayesdll
📕 Paper: https://arxiv.org/abs/2309.12928v1
⭐️ Dataset: https://paperswithcode.com/dataset/oxford-102-flower
ai_machinelearning_big_data
New Bayesian neural network library for PyTorch for large-scale deep network
Новая библиотека байесовских нейронных сетей для PyTorch, предназначенную для работы с крупномасштабными глубокими сетями.
В библиотеке реализованы основные алгоритмы приближенного байесовского вывода: вариационный вывод, MC-dropout, стохастически-градиентный MCMC и аппроксимация Лапласа.
Основные отличия от других существующих библиотек байесовских нейронных сетей заключаются в следующем:
1) библиотека может работать с очень крупными моделями, в том числе с Vision Transformers
2) Практически не требует от пользователей модификации кода .
3)Позволяет использовать предварительно обученные веса модели в качестве средних значений, что полезно для проведения байесовских вычислений в крупномасштабных моделях типа ViTs, которые трудно оптимизировать с нуля на основе одних только исходных данных.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤11👍7
Advanced NLP from Carnegie Mellon University.
Advanced NLP from MIT.
The course covers current state-of-the-art NLP techniques & algorithms.
Курс: Продвинутый NLP от Университета Карнеги-Меллон.
Курс: Advanced Natural Language Processing от MIT.
Курсы охватывают современные техники и алгоритмы NLP.
Одни из лучших курсов по НЛП в Интернете!
• CMU:📌Лекции | Курс
• MIT: 📌Лекции | Курс
#бесплатныекурсы
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤7🔥3
Фреймворк для автоматической высококачественной генерации аниме-сцен из изображений реального мира.
git clone https://github.com/Yuxinn-J/Scenimefy.gitai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥36👍10🥱2❤1
Simplifying deep learning for medical imaging.
fastMONAI упрощает использование современных методов глубокого обучения в анализе трехмерных медицинских изображений для решения задач классификации, регрессии и сегментации. fastMONAI предоставляет пользователям функциональные возможности для поэтапной загрузки данных, предварительной обработки, обучения и интерпретации результатов.
git clone https://github.com/MMIV-ML/fastMONAIProject: https://fastmonai.no
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19👍8🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
AI model that has both audio perception and a reasoning ability.
LTU-AS - модель универсального восприятия звука , которая способна к рассуждению. В частности, благодаря интеграции Whisper в качестве модуля восприятия и LLaMA в качестве модуля рассуждений, LTU-AS может одновременно распознавать и совместно понимать устный текст, паралингвистику, практически все, что можно воспринять из аудиосигналов.
🤗 HH: https://huggingface.co/spaces/yuangongfdu/ltu-2
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥4🥰1🤬1
📚 С помощью Telegram-бота GigaChat можно искать IT-курсы
Сервис Сбера в ответ на запрос о курсах предлагает не только названия ресурсов, где их можно найти, но и ссылки. К примеру, на запрос о поиске курсов по kubernetes нейросеть предложила пять популярных сайтов.
@gigachat_bot также умеет писать тексты и генерировать картинки, создавать инструкции и отвечать на вопросы. Кроме того, бота можно добавлять в групповые чаты и пользоваться совместно.
Попробовать GigaChat можно, перейдя по ссылке.
ai_machinelearning_big_data
Сервис Сбера в ответ на запрос о курсах предлагает не только названия ресурсов, где их можно найти, но и ссылки. К примеру, на запрос о поиске курсов по kubernetes нейросеть предложила пять популярных сайтов.
@gigachat_bot также умеет писать тексты и генерировать картинки, создавать инструкции и отвечать на вопросы. Кроме того, бота можно добавлять в групповые чаты и пользоваться совместно.
Попробовать GigaChat можно, перейдя по ссылке.
ai_machinelearning_big_data
❤14🔥6🍌4🤣3👍1🥰1
Добро пожаловать в репозиторий учебников по машинному обучению. Примеры кода и поянения по:
1.
2.👁🗨 Computer Vision: Techniques, algorithms
3.🖋 NLP
4.
5.🔢 NumPy
6.
7.🎇 MLOps
8.
9.
git clone https://github.com/patchy631/machine-learning• Github
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥3❤1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Method can effectively capture the sparsity and unique structure of line drawings while preserving the details during inbetweening.
Создание промежуточных кадров между двумя рисунками - трудоемкий и дорогостоящий процесс, новый фреймворк AnimeInbet позволяет автоматизировать эту задачу.
AnimeInbet, геометризирует растровые линейные рисунки в графы конечных точек, решая задачу слияния графов с перестановкой вершин.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍15❤5🤔1
Новый подход к созданию высококачественных
3D-объектов - генерация текста в трехмерном пространстве на основе гауссова расслоения (GSGEN). 🎇 GSGEN: Text-to-3D using Gaussian Splatting
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍4❤2