@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥15❤6⚡1😁1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥🎮 Video2Game: Real-time, Interactive, Realistic and Browser-Compatible Environment from a Single Video
Video2Game - фреймворк, который позволяет преобразовывать видео в реалистичную и интерактивную игровую среду!
В основе модели лежат ри основных компонента: (i) NeRF, который отображает геометрию и пространство сцены; (ii) mesh модуль, который использует NeRF для ускорения рендеринга; и (iii) физический модуль, который моделирует физическую динамику и взаимодействие объектов.
Встроенные агенты могут свободно перемещаются по местности в виртуальной среде, где их действия соответствуют физике реального мира. Игроки могут взаимодействовать с объектами на сцене, подчиняясь физическими законами.
▪ Project page: https://video2game.github.io
▪ Code: https://github.com/video2game/video2game
▪ Demo: https://video2game.github.io/src/garden/index.html
@ai_machinelearning_big_data
Video2Game - фреймворк, который позволяет преобразовывать видео в реалистичную и интерактивную игровую среду!
В основе модели лежат ри основных компонента: (i) NeRF, который отображает геометрию и пространство сцены; (ii) mesh модуль, который использует NeRF для ускорения рендеринга; и (iii) физический модуль, который моделирует физическую динамику и взаимодействие объектов.
Встроенные агенты могут свободно перемещаются по местности в виртуальной среде, где их действия соответствуют физике реального мира. Игроки могут взаимодействовать с объектами на сцене, подчиняясь физическими законами.
▪ Project page: https://video2game.github.io
▪ Code: https://github.com/video2game/video2game
▪ Demo: https://video2game.github.io/src/garden/index.html
@ai_machinelearning_big_data
🔥24👍9❤4
В то время как Anthropic Claude продолжает завоевывать пользователей, платформа ChatGPT от OpenAI испытывает снижение по трафику уже почти год. Сравнение данных показывает, что Claude обгоняет не только ChatGPT, но и других конкурентов.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14👍8🔥4😁1
🔎 Moving Object Segmentation:All You Need Is SAM (and Flow)
SAM + Optical Flow = FlowSAM
FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥
▪ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
▪ Code: https://github.com/Jyxarthur/flowsam
▪Paper: https://arxiv.org/abs/2404.12389
▪ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR
@ai_machinelearning_big_data
SAM + Optical Flow = FlowSAM
FlowSAM - новый инструмент для обнаружения и сегментации движущихся объектов на видео, который значительно превосходит все предыдущие модели, как для одного объекта, так и для множества объектов 🔥
▪ Project page: https://www.robots.ox.ac.uk/~vgg/research/flowsam/
▪ Code: https://github.com/Jyxarthur/flowsam
▪Paper: https://arxiv.org/abs/2404.12389
▪ Data: https://drive.google.com/drive/folders/1tmDq_vG_BvY5po40Ux5OBds1avUM_CbR
@ai_machinelearning_big_data
👍28🔥7❤6
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤3🔥2🤔2👌1
Ориентированная на конфиденциальность поисковая система Brave расширила функциональность своей системы ответов на запросы пользователей с помощью ИИ.
Теперь при вводе запроса в Brave в поле выдачи сперва отображается выжимка от AI с ссылками на источники, и только потом сайты.
Выглядит наподобие Perplexity и Phind.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤4🔥4🤬2🌭1
🪄👕 Magic Clothing: controllable garment-driven image synthesis
Вышла модель Waifu Dress Up 2024!
Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.
▪Github
▪Paper
@ai_machinelearning_big_data
Вышла модель Waifu Dress Up 2024!
Magic Clothing позволяет создавать персонажей, одетых в заданную одежду, на основе промпта и входного изображения.
git clone https://github.com/ShineChen1024/MagicClothing.git▪Github
▪Paper
@ai_machinelearning_big_data
👍16🔥7❤3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 AI Image Generator: Create images from text.
Новое поколение #Photoshop уже здесь.
Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.
Полный список обновлений здесь.
▪Blog
▪Demo
@ai_machinelearning_big_data
Новое поколение #Photoshop уже здесь.
Adobe добавили ИИ-инструменты в Photoshop на базе новой модели Firefly Image 3. Модель может самостоятельно подобрать или изменить фон, сгенерировать похожие изображения, генерировать изображения из промптов.
Полный список обновлений здесь.
▪Blog
▪Demo
@ai_machinelearning_big_data
👍13🔥7❤6❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️🗣 OpenVoice V2 - a Text-to-Speech model that can clone any voice and speak in any language.
OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.
• Github: https://github.com/myshell-ai/OpenVoice/tree/main
• Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md
@ai_machinelearning_big_data
OpenVoice V2 - новая версия открытой модели преобразования текста в речь, которая позволяет клонировать любой голос и генерировать речь на различных языках.
• Github: https://github.com/myshell-ai/OpenVoice/tree/main
• Usage: https://github.com/myshell-ai/OpenVoice/blob/main/docs/USAGE.md
@ai_machinelearning_big_data
👍25🔥8❤5
Сегодня Apple выпустили Openly.
- Новое семейство LM с открытым исходным кодом для обучения моделей и логического вывода
- Работает наравне с OLMo, но требует в 2 раза меньше токенов для обучения
- Модели для различных задач, включая базовые модели (например, CLIP и LLM), классификацию объектов, обнаружение объектов и семантическую сегментацию.
Cписок моделей и подробная информации о каждой из них:
- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct
• gitHub: https://github.com/apple/corenet
• hf: https://huggingface.co/apple/OpenELM
• abs: https://arxiv.org/abs/2404.14619
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11❤3
🖼 HiDiffusion: Unlocking High-Resolution Creativity and Efficiency in Low-Resolution Trained Diffusion Models 🦊
Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion.
Его можно интегрировать в конвейеры diffusion, добавив всего одну строку кода!
• page: https://hidiffusion.github.io
• paper: https://arxiv.org/abs/2311.17528
• code: https://github.com/megvii-research/HiDiffusion
•colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing
@ai_machinelearning_big_data
Новый метод, не требующий обучения, который повышает о и скорость предварительно обученных моделей diffusion.
Его можно интегрировать в конвейеры diffusion, добавив всего одну строку кода!
pip3 install hidiffusion• page: https://hidiffusion.github.io
• paper: https://arxiv.org/abs/2311.17528
• code: https://github.com/megvii-research/HiDiffusion
•colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=sharing
@ai_machinelearning_big_data
👍21🔥5❤4