NEW BOT Телеграм, страница - 292500198

Machinelearning

@ai_machinelearning_big_data

328K subscribers

4.65K photos

981 videos

17 files

5.09K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

328K subscribers

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🤗 ModelScope Text to Video Synthesis

For faster inference without waiting in queue, you may duplicate the space and upgrade to GPU in settings.

Новая диффузионная модель для генерации видео из текста.

⏩

Demo: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis

💨

Paper: https://arxiv.org/pdf/2303.08320v2.pdf

💡

Huggingface: https://huggingface.co/damo-vilab/modelscope-damo-text-to-video-synthesis/tree/main

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍4🔥2

8.42K viewsedited 10:10

Machinelearning

🦖 Яндекс выложил в опенсорс исходный код YTsaurus — платформы для работы с большими данными

«Вайтизавр» развивали почти 10 лет — историю можно почитать на Хабре. Сегодня платформу использует большинство сервисов Яндекса. YTsaurus может многое: от аналитики до обучения сложных моделей с миллиардами параметров. В Яндексе рассказывают, что один из самых популярных сценариев — построение DWH.

Например, заказы Еды, Такси и Лавки поступают в key-value хранилище YTsaurus в сыром виде — это сотни терабайт в месяц. Дальше они обрабатываются разными инструментами внутри платформы, и на выходе получаются аналитические витрины, поверх которых производится аналитика и строятся различные визуализации в DataLens.

Помимо MapReduce, пользователям предлагается прокаченный SQL-язык, который может запускать огромные операции для обработки петабайтов данных, богатый набор встроенных функций и гибкие возможности параметризации.

🖥 Github: https://github.com/YTsaurus/YTsaurus
вакансии в YTsaurus

ai_machinelearning_big_data

👍19🔥9❤3😁2🥴1

9.13K viewsedited 12:58

Machinelearning

Media is too big

VIEW IN TELEGRAM

Gen-2: The Next Step Forward for Generative AI

A multi-modal AI system that can generate novel videos with text, images, or video clips.

Мультимодальная AI модель Gen-2, которая преобразует текст или картинки в видео.

⏩

Project: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis

↪️

Paper: https://arxiv.org/abs/2302.03011

💨

Discord: https://discord.com/invite/tUp5Gbd7rk

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥5❤4

9.2K views14:56

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚜️

ViperGPT: Visual Inference via Python Execution for Reasoning

ViperGPT, a framework that leverages code-generation models to compose vision-and-language models into subroutines to produce a result for any query.

Новый фреймворк ViperGPT для генерации Python кода из изображений.

🖥

Github: https://github.com/cvlab-columbia/viper

⏩

Paper: https://arxiv.org/pdf/2303.08128.pdf

💨

Project: https://paperswithcode.com/dataset/beat

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍21❤4🔥3

9.82K views12:31

Machinelearning

🎥

Zero-1-to-3: Zero-shot One Image to 3D Object

Zero-1-to-3, a framework for changing the camera viewpoint of an object given just a single RGB image.

Новая система изменения ракурса камеры на объект по одному RGB-изображению.

🖥

Github: https://github.com/cvlab-columbia/zero123

🤗 Hugging face: https://huggingface.co/spaces/cvlab/zero123-live

⏩

Paper: https://arxiv.org/abs/2303.11328v1

⏩

Dataset: https://zero123.cs.columbia.edu/

💨

Project: https://paperswithcode.com/dataset/beat

⭐️

Demo: https://huggingface.co/spaces/cvlab/zero123

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12🔥4🤯3❤2

9.48K views08:35

Machinelearning

NeAT: Learning Neural Implicit Surfaces with Arbitrary Topologies from Multi-view Images

Novel neural volume rendering method, which uses SDF and validity to calculate the volume opacity and avoids rendering points with low validity.

Новая нейронная система рендеринга, которая может опрелелять различные поверхности на фото с произвольной топологией на основе многоракурсных изображений.

🖥

Github: https://github.com/xmeng525/NeAT

⏩

Paper: https://arxiv.org/abs/2303.12012v1

⏩

Dataset: https://www.dropbox.com/sh/utn5rnohmr0y2c8/AACdets4PQrP5CB1KwGkpOFUa?dl=0

💨

Project: https://xmeng525.github.io/xiaoxumeng.github.io/projects/cvpr23_neat

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13❤4🔥1

9.22K views10:56

Machinelearning

ReVersion : Diffusion-Based Relation Inversion from Images

ReVersion for the Relation Inversion task, which aims to learn a specific relation (represented as "relation prompt") from exemplar images.

Фреймворк для поиска общих сущностей в изображениях для генерации промптов для синтеза новых изображений.

🖥

Github: https://github.com/ziqihuangg/reversion

⏩

Paper: https://arxiv.org/abs/2303.13495v1

💨

Project: https://ziqihuangg.github.io/projects/reversion.html

⏩

Video: https://www.youtube.com/watch?v=pkal3yjyyKQ

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤4🔥4🤝1

9.58K views10:02

Machinelearning

Train your ControlNet with diffusers 🧨

ControlNet is a neural network structure that allows fine-grained control of diffusion models by adding extra conditions.

В этой статье подробно рассматривается каждый шаг, обучения модельи Uncanny Faces - модель поз лиц, основанную на синтетических 3D лицах.

🤗 Hugging face: https://huggingface.co/blog/train-your-controlnet#

🖥

Github: https://github.com/huggingface/blog/blob/main/train-your-controlnet.md

⏩

ControlNet training example: https://github.com/huggingface/diffusers/tree/main/examples/controlnet

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15❤3🔥3

9.49K views11:26

Machinelearning

🔥

Fix the Noise: Disentangling Source Feature for Controllable Domain Translation

A new approach for high-quality domain translation with better controllability.

Новый подход, который позволяет плавно контролировать степень сохранения исходных характеристик при генерации изображений.

🖥

Github: https://github.com/LeeDongYeun/FixNoise

⏩

Paper: https://arxiv.org/abs/2303.11545v1

💨

Dataset: https://paperswithcode.com/dataset/metfaces

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍6🔥3👎1🤔1

9.46K views10:24

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

Conditional Image-to-Video Generation with Latent Flow Diffusion Models

New approach for cI2V using novel latent flow diffusion models (LFDM) that synthesize an optical flow sequence in the latent space based on the given condition to warp the given image.

Генерация видео из изображений с использованием моделей диффузии.

🖥

Github: https://github.com/nihaomiao/cvpr23_lfdm

⏩

Paper: https://arxiv.org/abs/2303.13744v1

💨

Dataset: https://drive.google.com/file/d/1dRn1wl5TUaZJiiDpIQADt1JJ0_q36MVG/view?usp=share_link

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10❤9🔥7

10.2K views10:02

Machinelearning

Federated Learning using Hugging Face and Flower

В этом уроке рассматривается, как использовать Hugging Face для Federated Learning (так называется совокупность методов обучения ML моделей на распределённых данных) языковых моделей на нескольких клиентах с помощью фреймворка Flower

This tutorial will show how to leverage Hugging Face to federate the training of language models over multiple clients.

pip install datasets evaluate flwr torch transformers

🤗 Hugging face: https://huggingface.co/blog/fl-with-flower

🌷 Flower: https://flower.dev/

🖥

Colab: https://colab.research.google.com/github/huggingface/blog/blob/main/notebooks/fl-with-flower.ipynb

🖥

Github: https://github.com/adap/flower/tree/main/examples/quickstart_huggingface

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤13👍4🔥3

8.8K views14:50

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

One-Stage 3D Whole-Body Mesh Recovery with Component Aware Transformer

🖥

Github: https://github.com/IDEA-Research/OSX

⏩

Paper: http://arxiv.org/abs/2303.16160

⭐️

Project: https://osx-ubody.github.io/

💨

Dataset: https://paperswithcode.com/dataset/expose

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥6❤1

8.38K views08:28

Machinelearning

AutoAD: Movie Denoscription in Context

MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Denoscriptions.

MAD - это масштабный набор данных, собранный из аудиоописаний фильмов.

🖥

Github: https://github.com/Soldelli/MAD

⏩

Paper: https://arxiv.org/abs/2303.16899v1

💨

Dataset: https://paperswithcode.com/dataset/lsmdc

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤3🔥3😁1

8.54K views14:01

Machinelearning

DPF: Learning Dense Prediction Fields with Weak Supervision

🖥

Github: https://github.com/cxx226/dpf

⏩

Paper: https://arxiv.org/abs/2303.16890v1

💨

Dataset: https://paperswithcode.com/dataset/pascal-context

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14❤1🔥1😁1

8.64K views19:27

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

3D Line Mapping Revisited

LIMAP is a toolbox for mapping and localization with line features.

Интерфейсы для различных геометрических операций над 2D/3D линиями.

🖥

Github: https://github.com/cvg/limap

⏩

Paper: https://arxiv.org/abs/2303.17504v1

💨

Dataset: https://paperswithcode.com/dataset/hypersim

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤3🔥2🤯1

8.65K views10:00

Machinelearning

WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research

Propose a three-stage processing pipeline for filtering noisy data and generating high-quality captions, where ChatGPT.

Конвейер обработки для фильтрации зашумленных данных и создания высококачественных титров.

🖥

Github: https://github.com/xinhaomei/wavcaps

⏩

Paper: https://arxiv.org/abs/2303.17395v1

💨

Dataset: https://paperswithcode.com/dataset/sounddescs

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4🔥2

9.88K viewsedited 17:25

Machinelearning

vid2vid-zero for Zero-Shot Video Editing

We propose vid2vid-zero, a simple yet effective method for zero-shot video editing.

Мы предлагаем vid2vid-zero, простой, но эффективный метод редактирования видео.

🖥

Github: https://github.com/baaivision/vid2vid-zero

⏩

Paper: https://arxiv.org/abs/2303.17599v1

💨

Dataset: https://paperswithcode.com/dataset/sounddescs

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤5🤔3🔥2

9.52K views09:19