Machinelearning – Telegram
383K subscribers
4.44K photos
856 videos
17 files
4.88K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
⭐️Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation

Фреймворк для автоматической высококачественной генерации аниме-сцен из изображений реального мира.

git clone https://github.com/Yuxinn-J/Scenimefy.git

🖥 Github: https://github.com/Yuxinn-J/Scenimefy/tree/main

☑️ Demo: https://huggingface.co/spaces/YuxinJ/Scenimefy

📕 Paper: https://arxiv.org/abs/2308.12968

Project: https://yuxinn-j.github.io/projects/Scenimefy.html

⭐️ Dataset: https://github.com/Yuxinn-J/Scenimefy/tree/main#open_file_folder-anime-scene-dataset

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥36👍10🥱21
fastMONAI: A low-code deep learning library for medical image analysis

Simplifying deep learning for medical imaging.

fastMONAI упрощает использование современных методов глубокого обучения в анализе трехмерных медицинских изображений для решения задач классификации, регрессии и сегментации. fastMONAI предоставляет пользователям функциональные возможности для поэтапной загрузки данных, предварительной обработки, обучения и интерпретации результатов.

git clone https://github.com/MMIV-ML/fastMONAI

🖥 Github: https://github.com/MMIV-ML/fastMONAI

Project: https://fastmonai.no

📕 Paper: https://www.sciencedirect.com/science/article/pii/S2665963823001203

🖥 Colab: https://colab.research.google.com/github/MMIV-ML/fastMONAI/blob/master/nbs/10a_tutorial_classification.ipynb

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍8🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🔊 Listen, Think, and Understand

AI model that has both audio perception and a reasoning ability.

LTU-AS - модель универсального восприятия звука , которая способна к рассуждению. В частности, благодаря интеграции Whisper в качестве модуля восприятия и LLaMA в качестве модуля рассуждений, LTU-AS может одновременно распознавать и совместно понимать устный текст, паралингвистику, практически все, что можно воспринять из аудиосигналов.

🖥 Github: https://github.com/YuanGongND/ltu

☑️ Demo: https://18c618fc8f07ec494e.gradio.live/

📕 Paper: https://arxiv.org/abs/2309.14405v1

🤗 HH: https://huggingface.co/spaces/yuangongfdu/ltu-2

⭐️ Dataset: https://paperswithcode.com/dataset/iemocap

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥4🥰1🤬1
📚 С помощью Telegram-бота GigaChat можно искать IT-курсы

Сервис Сбера в ответ на запрос о курсах предлагает не только названия ресурсов, где их можно найти, но и ссылки. К примеру, на запрос о поиске курсов по kubernetes нейросеть предложила пять популярных сайтов.

@gigachat_bot также умеет писать тексты и генерировать картинки, создавать инструкции и отвечать на вопросы. Кроме того, бота можно добавлять в групповые чаты и пользоваться совместно.

Попробовать GigaChat можно, перейдя по ссылке.

ai_machinelearning_big_data
14🔥6🍌4🤣3👍1🥰1
🤖 Machine Learning Tutorials Repository
Добро пожаловать в репозиторий учебников по машинному обучению. Примеры кода и поянения по:

1.🖥 Python
2.
👁‍🗨 Computer Vision: Techniques, algorithms
3.
🖋 NLP
4.
📊 Matplotlib
5.
🔢 NumPy
6.
🐼 Pandas
7.
🎇 MLOps
8.
🧠 LLMs
9.
🔥 PyTorch/TensorFlow

git clone https://github.com/patchy631/machine-learning

Github

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥31🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
✏️ Deep Geometrized Cartoon Line Inbetweening

Method can effectively capture the sparsity and unique structure of line drawings while preserving the details during inbetweening.

Создание промежуточных кадров между двумя рисунками - трудоемкий и дорогостоящий процесс, новый фреймворк AnimeInbet позволяет автоматизировать эту задачу.

AnimeInbet, геометризирует растровые линейные рисунки в графы конечных точек, решая задачу слияния графов с перестановкой вершин.

🖥 Github: https://github.com/lisiyao21/animeinbet

☑️ Demo: https://youtu.be/iUF-LsqFKpI?si=9FViAZUyFdSfZzS5

📕 Paper: https://arxiv.org/pdf/2309.16643v1.pdf

⭐️ Dataset: https://drive.google.com/file/d/1SNRGajIECxNwRp6ZJ0IlY7AEl2mRm2DR/view?usp=sharing

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍155🤔1
🔎 Text-to-3D using Gaussian Splatting

Новый подход к созданию высококачественных 3D-объектов - генерация текста в трехмерном пространстве на основе гауссова расслоения (GSGEN).

🎇 GSGEN: Text-to-3D using Gaussian Splatting

🖥 Github: https://github.com/gsgen3d/gsgen

☑️ Project: https://gsgen3d.github.io/

📕 Paper: https://arxiv.org/abs/2309.16585v1

⭐️ Dataset: https://paperswithcode.com/dataset/nerf

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍42
🔎 Датасет для анализа русскоязычных отзывов на организации

Яндекс опубликовал крупнейший русскоязычный датасет, в котором содержится 500 тысяч отзывов, собранных с января по июнь 2023 года. Туда входят адреса и названия организаций, список рубрик, оценки пользователей и отзывы. Датасет позволяет, к примеру, производить сентимент-анализ и лингвистический анализ.

Github: https://github.com/yandex/geo-reviews-dataset-2023
Habr: https://habr.com/ru/companies/yandex/articles/763832/

@ai_machinelearning_big_data
👍24🔥84
This media is not supported in your browser
VIEW IN TELEGRAM
DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation

A novel 3D content generation framework that achieves both efficiency and quality simultaneously.

DreamGaussian - новый фреймворк для генерации 3D-контента, позволяющий достичь одновременно эффективности и высокого качества генераций.

Работает на безе алгоритма преобразования трехмерных гауссианов в текстурированные сетки с применения файнтюнинга для улучшения деталей. Обширные эксперименты демонстрируют высокую эффективность и конкурентоспособное качество генерации предложенного подхода.


🖥 Github: https://github.com/dreamgaussian/dreamgaussian

☑️ Image-to-3D: https://colab.research.google.com/drive/1sLpYmmLS209-e5eHgcuqdryFRRO6ZhFS?usp=sharing

☑️ Text-to-3d: https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb

📕 Paper: https://arxiv.org/abs/2309.16653v1

⭐️ Dataset: https://paperswithcode.com/dataset/nerf

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥64
This media is not supported in your browser
VIEW IN TELEGRAM
🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation

Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ.

git clone git@github.com:guyyariv/TempoTokens.git

🖥 Github: https://github.com/guyyariv/TempoTokens

📕 Paper: https://arxiv.org/abs/2309.16429v1

⭐️ Dataset: https://paperswithcode.com/dataset/audioset

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍176🔥6😁1
Demystifying CLIP Data

MetaCLIP takes a raw data pool and metadata and yields a balanced subset over the metadata distribution.

Новый масштабируемый алгоритм MetaCLIP, работающий в конвейере обработки данных. MetaCLIP, примененная к CommonCrawl с 400 млн. пар данных "изображение-текст", превосходит данные CLIP по многим стандартным показателям. В классификации ImageNet точность MetaCLIP составляет 70,8%, что превосходит точность CLIP в 68,3% на моделях ViT-B.

🖥 Github: https://github.com/facebookresearch/metaclip

📕 Paper: https://arxiv.org/pdf/2309.16671v1.pdf

⭐️ Dataset: https://paperswithcode.com/dataset/laion-400m

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥74
🤖 AutoAgents: A Framework for Automatic Agent Generation

Generate different roles for GPTs to form a collaborative entity for complex tasks.

AutoAgents, инновационный фреймворк, который адаптивно генерирует и координирует множество специализированных агентов для создания ИИ-команды в соответствии с различными задачами.

🖥 Github: https://github.com/LinkSoul-AI/AutoAgents

📕 Paper: https://arxiv.org/abs/2309.17288v1

⭐️ Demo: https://huggingface.co/spaces/LinkSoul/AutoAgents

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍213🔥3
Яндекс опубликовал плейлист с докладами конференции Practical ML.

Вот некоторые из них:

— Алексей Морозов, руководитель группы модернизации нейронных сетей Яндекса. Про то, как можно полностью инкапсулировать от ML’щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU

— Юлий Шамаев, Data Science Team Lead, Банк ВТБ. Про про геоэмбеддинги – векторное представление контекста в пространственной аналитике. Они помогают определить лучшее расположение для банкоматов и банковских отделений.

— Евгений Сидоров, Head of AI, Third Opinion. Про то, как компенсировать недостаток трёхмерной информации на основе множественных проекций при анализе медицинских снимков.

@ai_machinelearning_big_data
👍213🔥3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Memory Gym: Partially Observable Challenges to Memory-Based Agents in Endless Episodes

Среда для обучения, тестирования и запуска агентов основе памяти.

🖥 Github: https://github.com/marcometer/endless-memory-gym

🖥 Colab: https://colab.research.google.com/drive/1LjlUOEer8vjGrz0rLM8pP5UyeNCsURkY?usp=sharing

📕 Paper: https://openreview.net/forum?id=jHc8dCx6DDr

⭐️ Dataset: https://paperswithcode.com/dataset/arcade-learning-environment

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥53
☑️ Efficient Streaming Language Models with Attention Sinks

StreamingLLM, an efficient framework that enables LLMs trained with a finite length attention window to generalize to infinite sequence length without any fine-tuning.

Фреймворк для развертывания больших языковых моделей в потоковых приложениях, таких как многораундовые диалоги, где ожидается длительное взаимодействие, является настоятельной необходимостью, но сопряжено с двумя серьезными проблемами. StreamingLLM позволяет Llama-2, MPT, Falcon и Pythia стабильно и эффективно выполнять моделирование общения с количеством лексем до 4 млн. и более.

🖥 Github: https://github.com/mit-han-lab/streaming-llm

📕 Paper: http://arxiv.org/abs/2309.17453

⭐️ Dataset: https://paperswithcode.com/dataset/pg-19

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍133🔥1
🦅 Jury: A Comprehensive Evaluation Toolkit

Комплексный набор инструментов для оценки НЛП-экспериментов, предлагающий различные автоматизированные метрики. Jury предлагает удобный и простой в использовании интерфейс.

pip install jury

🖥 Github: https://github.com/obss/jury

📕 Paper: https://arxiv.org/abs/2310.02040v1

🖥 Colab: https://colab.research.google.com/github/obss/jury/blob/main/examples/jury_evaluate.ipynb

⭐️ Demos: https://github.com/Parskatt/DeDoDe/blob/main/demo

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍172🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 GenSim: Generating Robotic Simulation Tasks via Large Language Models

Фреймворк для генерации и моделирования симуляций для роботов с помощью больших языковых моделей.

🖥 Github: https://github.com/liruiw/gensim

✔️ Project: https://liruiw.github.io/gensim

📕 Paper: https://arxiv.org/abs/2310.01361v1

Dataset: https://huggingface.co/datasets/Gen-Sim/Gen-Sim

⭐️ Demos: https://huggingface.co/spaces/Gen-Sim/Gen-Sim

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥4🗿21