NEW BOT Телеграм, страница

⏩

OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception.

OpenOccupancy first surrounding semantic occupancy perception benchmar.

🖥

Github: https://github.com/jeffwang987/openoccupancy

⏩

Paper: https://arxiv.org/abs/2303.03991v1

⭐️

Dataset: https://paperswithcode.com/dataset/synthcity

💨

Project: https://www.mmlab-ntu.com/project/styleganex/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤1🔥1

19.3K views18:02

Machinelearning

Erasing Concepts from Diffusion Models

A fine-tuning method that can erase a visual concept from a pre-trained diffusion model, given only the name of the style and using negative guidance as a teacher.

Метод тонкой настройки, который может убрать имитацию стиля конкретного художника или даже стереть целый класс объектов из вывода модели, сохранив при этом поведение и возможности модели по другим настройкам.

🖥

Github: https://github.com/rohitgandikota/erasing

⏩

Paper: https://arxiv.org/abs/2303.07345v1

⭐️

Dataset: https://paperswithcode.com/dataset/imagenet

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍19😢4❤3🔥2

8.08K views10:02

Machinelearning

Gpt4 realise !

https://openai.com/research/gpt-4

@ai_machinelearning_big_data

Openai

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits…

👍34🔥15❤5🤯4⚡2😁2👏1👌1

17K views17:07

Machinelearning

GraphGym

Platform for designing and evaluating Graph Neural Networks (GNN).

GraphGym - это платформа для проектирования и оценки графовых нейронных сетей .

🖥

Github: https://github.com/snap-stanford/graphgym

⏩

Paper: https://arxiv.org/abs/2303.07666v1

⭐️

Dataset: https://paperswithcode.com/dataset/tieredimagenet

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍8🔥1

8.34K views10:08

Machinelearning

Tuned Lens 🔎

Simple interface training and evaluating tuned lenses. A tuned lens allows us to peak at the iterative computations a transformer uses to compute the next token.

Инструменты для понимания того, как послойно работают прогнозы трансформеров.

pip install tuned-lens

🖥

Github: https://github.com/alignmentresearch/tuned-lens

⏩

Paper: https://arxiv.org/abs/2303.08112v1

⭐️

Dataset: https://paperswithcode.com/dataset/the-pile

🖥

Colab: https://colab.research.google.com/github/AlignmentResearch/tuned-lens/blob/main/notebooks/interactive.ipynb

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤2👎2🔥2

8.8K viewsedited 08:11

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

FateZero: Fusing Attentions for Zero-shot Text-based Video Editing

Video Style Editing Using Stable Diffusion.

Новый метод редактирования видео из текстовых промтов без предварительного обучения модели и без использования маски, специфичной для конкретного видео.

🖥

Github: https://github.com/chenyangqiqi/fatezero

⏩

Paper: https://arxiv.org/abs/2303.09535

💨

Project: https://fate-zero-edit.github.io/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍8🔥2

8.87K views07:12

Machinelearning

Математика дата саентиста - здесь мы публикуем математические задачи и гайды для машинного обучения с упором на практику. Проверяем ваши знания, а затем на основе ошибок предлагаем статьи и уроки.

Если хочешь познать дзен и понимать как работают алгоритмы, а не просто импортировать их, подписывайся. Здесь реально учат.

@ds_math

❤9🖕2👍1🔥1

9.08K views08:28

Machinelearning

Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation (CVPR 2023)

Novel Diffusion Audio-Gesture Transformer is devised to better attend to the information from multiple modalities and model the long-term temporal dependency. M

Новая система на основе диффузии для эффективного захвата кросс-модальных ассоциаций между аудио и жестами для высокоточной генерации жестов на основе аудио.

🖥

Github: https://github.com/advocate99/diffgesture

⏩

Paper: https://arxiv.org/abs/2303.09119v1

💨

Dataset: https://paperswithcode.com/dataset/beat

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥2👍1

9.79K views10:00

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🤗 ModelScope Text to Video Synthesis

For faster inference without waiting in queue, you may duplicate the space and upgrade to GPU in settings.

Новая диффузионная модель для генерации видео из текста.

⏩

Demo: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis

💨

Paper: https://arxiv.org/pdf/2303.08320v2.pdf

💡

Huggingface: https://huggingface.co/damo-vilab/modelscope-damo-text-to-video-synthesis/tree/main

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍4🔥2

8.42K viewsedited 10:10

Machinelearning

🦖 Яндекс выложил в опенсорс исходный код YTsaurus — платформы для работы с большими данными

«Вайтизавр» развивали почти 10 лет — историю можно почитать на Хабре. Сегодня платформу использует большинство сервисов Яндекса. YTsaurus может многое: от аналитики до обучения сложных моделей с миллиардами параметров. В Яндексе рассказывают, что один из самых популярных сценариев — построение DWH.

Например, заказы Еды, Такси и Лавки поступают в key-value хранилище YTsaurus в сыром виде — это сотни терабайт в месяц. Дальше они обрабатываются разными инструментами внутри платформы, и на выходе получаются аналитические витрины, поверх которых производится аналитика и строятся различные визуализации в DataLens.

Помимо MapReduce, пользователям предлагается прокаченный SQL-язык, который может запускать огромные операции для обработки петабайтов данных, богатый набор встроенных функций и гибкие возможности параметризации.

🖥 Github: https://github.com/YTsaurus/YTsaurus
вакансии в YTsaurus

ai_machinelearning_big_data

👍19🔥9❤3😁2🥴1

9.13K viewsedited 12:58

Gen-2: The Next Step Forward for Generative AI

A multi-modal AI system that can generate novel videos with text, images, or video clips.

Мультимодальная AI модель Gen-2, которая преобразует текст или картинки в видео.

⏩

Project: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis

↪️

Paper: https://arxiv.org/abs/2302.03011

💨

Discord: https://discord.com/invite/tUp5Gbd7rk

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥5❤4

9.2K views14:56

Machinelearning

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

⚜️

ViperGPT: Visual Inference via Python Execution for Reasoning

ViperGPT, a framework that leverages code-generation models to compose vision-and-language models into subroutines to produce a result for any query.

Новый фреймворк ViperGPT для генерации Python кода из изображений.

🖥

Github: https://github.com/cvlab-columbia/viper

⏩

Paper: https://arxiv.org/pdf/2303.08128.pdf

💨

Project: https://paperswithcode.com/dataset/beat

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍21❤4🔥3

9.82K views12:31

Machinelearning

🎥

Zero-1-to-3: Zero-shot One Image to 3D Object

Zero-1-to-3, a framework for changing the camera viewpoint of an object given just a single RGB image.

Новая система изменения ракурса камеры на объект по одному RGB-изображению.

🖥

Github: https://github.com/cvlab-columbia/zero123

🤗 Hugging face: https://huggingface.co/spaces/cvlab/zero123-live

⏩

Paper: https://arxiv.org/abs/2303.11328v1

⏩

Dataset: https://zero123.cs.columbia.edu/

💨

Project: https://paperswithcode.com/dataset/beat

⭐️

Demo: https://huggingface.co/spaces/cvlab/zero123

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12🔥4🤯3❤2

9.47K views08:35

Machinelearning

NeAT: Learning Neural Implicit Surfaces with Arbitrary Topologies from Multi-view Images

Novel neural volume rendering method, which uses SDF and validity to calculate the volume opacity and avoids rendering points with low validity.

Новая нейронная система рендеринга, которая может опрелелять различные поверхности на фото с произвольной топологией на основе многоракурсных изображений.

🖥

Github: https://github.com/xmeng525/NeAT

⏩

Paper: https://arxiv.org/abs/2303.12012v1

⏩

Dataset: https://www.dropbox.com/sh/utn5rnohmr0y2c8/AACdets4PQrP5CB1KwGkpOFUa?dl=0

💨

Project: https://xmeng525.github.io/xiaoxumeng.github.io/projects/cvpr23_neat

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13❤4🔥1

9.22K views10:56

Machinelearning

ReVersion : Diffusion-Based Relation Inversion from Images

ReVersion for the Relation Inversion task, which aims to learn a specific relation (represented as "relation prompt") from exemplar images.

Фреймворк для поиска общих сущностей в изображениях для генерации промптов для синтеза новых изображений.

🖥

Github: https://github.com/ziqihuangg/reversion

⏩

Paper: https://arxiv.org/abs/2303.13495v1

💨

Project: https://ziqihuangg.github.io/projects/reversion.html

⏩

Video: https://www.youtube.com/watch?v=pkal3yjyyKQ

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤4🔥4🤝1

9.58K views10:02

Machinelearning

Train your ControlNet with diffusers 🧨

ControlNet is a neural network structure that allows fine-grained control of diffusion models by adding extra conditions.

В этой статье подробно рассматривается каждый шаг, обучения модельи Uncanny Faces - модель поз лиц, основанную на синтетических 3D лицах.

🤗 Hugging face: https://huggingface.co/blog/train-your-controlnet#

🖥

Github: https://github.com/huggingface/blog/blob/main/train-your-controlnet.md

⏩

ControlNet training example: https://github.com/huggingface/diffusers/tree/main/examples/controlnet

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15❤3🔥3

9.49K views11:26

Machinelearning

🔥

Fix the Noise: Disentangling Source Feature for Controllable Domain Translation

A new approach for high-quality domain translation with better controllability.

Новый подход, который позволяет плавно контролировать степень сохранения исходных характеристик при генерации изображений.

🖥

Github: https://github.com/LeeDongYeun/FixNoise

⏩

Paper: https://arxiv.org/abs/2303.11545v1

💨

Dataset: https://paperswithcode.com/dataset/metfaces

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍6🔥3👎1🤔1

9.46K views10:24

About

Blog

Apps

Platform