Humor Arena
Арена/лидерборд языковых моделей по придумыванию шуток.
Видимо, все на английском.
Есть топ лучших шуток, можете глянуть. Все однотипные имхо
Хостится не на HF, не теряйте
#leaderboard
Арена/лидерборд языковых моделей по придумыванию шуток.
Видимо, все на английском.
Есть топ лучших шуток, можете глянуть. Все однотипные имхо
Хостится не на HF, не теряйте
#leaderboard
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation
Генератор 3D сцены по картинке.
Код ждем
#imageto3d
Генератор 3D сцены по картинке.
Получив входное изображение сцены, мы сегментируем его на несколько частей и используем многоэкземплярную диффузную модель, основанную на этих изображениях, для создания композиционных 3D-экземпляров сцены. Эти 3D-экземпляры могут быть непосредственно объединены в сцену. Общее время обработки составляет всего 40 секунд.
Код ждем
#imageto3d
👍8🔥3
Pleias
Семейство небольших языковых моделей, обученных только на открытых данных.
350M, 1.2B и 3B параметров
- мультиязычные, несколько европейских языков (каких?)
- безопасные, самые низкие результаты в тесте токсичности
- эффективны при выполнении ключевых задач, таких как поиск знаний.
- способны эффективно работать на локальном железе потребительского уровня (CPU, без квантизации)
веса
#news #llm
Семейство небольших языковых моделей, обученных только на открытых данных.
350M, 1.2B и 3B параметров
- мультиязычные, несколько европейских языков (каких?)
- безопасные, самые низкие результаты в тесте токсичности
- эффективны при выполнении ключевых задач, таких как поиск знаний.
- способны эффективно работать на локальном железе потребительского уровня (CPU, без квантизации)
веса
#news #llm
👍4❤1
xAI Aurora
Генератор картинок в Grok
Недиффузный, что интересно, а авторегрессионный.
Диффузные генераторы проявляют изображение из шума постепенно за несколько шагов. Авторегрессия сразу создает патчи (кусочки) готового изображения
Aurora умеет не только создавать, но изменять картинки. Архитектура позволяет легко принимать на вход и текст, и изображение
Доступ - через Grok, видимо, на подписке
#news #text2image #image2image
Генератор картинок в Grok
Недиффузный, что интересно, а авторегрессионный.
Диффузные генераторы проявляют изображение из шума постепенно за несколько шагов. Авторегрессия сразу создает патчи (кусочки) готового изображения
Aurora умеет не только создавать, но изменять картинки. Архитектура позволяет легко принимать на вход и текст, и изображение
Доступ - через Grok, видимо, на подписке
#news #text2image #image2image
👍8❤1
Media is too big
VIEW IN TELEGRAM
MEMO: Memory-Guided Diffusion for Expressive Talking Video Generation
Говорящая голова, оживление портрета по звуку речи.
Работает с разными языками, стилями портретов, речи, поворотами головы
Код
Демо спасибо @p0lygon
#talkinghead #lypsync #speech2video
Говорящая голова, оживление портрета по звуку речи.
Работает с разными языками, стилями портретов, речи, поворотами головы
Код
Демо спасибо @p0lygon
#talkinghead #lypsync #speech2video
🔥12
Negative Token Merging: Image-based Adversarial Feature Guidance
NegToMe увеличивает вариативность сгенерированных картинок.
Прикручивали к флюксу
Код
Демо (Flux)
#text2image #flux
NegToMe увеличивает вариативность сгенерированных картинок.
Прикручивали к флюксу
Код
Демо (Flux)
#text2image #flux
👍8🔥1
Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion
Визуально-языковая модель для понимания изображений на основе Florence-2 от Microsoft
Код/веса
Демо 8B
Демо 3B
#assistant #vlm
Визуально-языковая модель для понимания изображений на основе Florence-2 от Microsoft
Код/веса
Демо 8B
Демо 3B
#assistant #vlm
👍7❤1
Golden Noise for Diffusion Models: A Learning Framework
Промптинг шумом
Преобразует случайный гауссов шум в золотой шум путем добавления небольшого желаемого возмущения, получаемого из текстовой подсказки, для повышения общего качества и семантической достоверности синтезируемых изображений.
Дружит с SDXL, Hunyan
Код
Демо сейчас не работает
HF
#text2image
Промптинг шумом
Преобразует случайный гауссов шум в золотой шум путем добавления небольшого желаемого возмущения, получаемого из текстовой подсказки, для повышения общего качества и семантической достоверности синтезируемых изображений.
Дружит с SDXL, Hunyan
Код
Демо сейчас не работает
HF
#text2image
❤7👍1
InternVL 2.5
Новый чемпион в понимании изображений. Семейство моделей от 1B до 78B параметров
Гитхаб
Чат демо
Демо HF
Веса
#VLM #MLLM #assistant
Новый чемпион в понимании изображений. Семейство моделей от 1B до 78B параметров
Гитхаб
Чат демо
Демо HF
Веса
#VLM #MLLM #assistant
👍6
Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot
Реконструкция 3D моделей нескольких людей по одному ракурсу.
Восстанавливает без одежды. Нет, не поэтому
Код
Демо
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
Реконструкция 3D моделей нескольких людей по одному ракурсу.
Восстанавливает без одежды. Нет, не поэтому
Код
Демо
#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction
🔥5🤯1
SwiftEdit: Lightning Fast Text-guided Image Editing via One-step Diffusion
Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo
Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100
Код ждем
#imageediting #image2image
Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo
Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100
Код ждем
#imageediting #image2image
👍5
Есть код и демо OneDiffusion - генератора/пониматора картинок
Код
Демо сейчас 404 - ждем
Веса на HF
#text2image #image2image #conditioning #personalization #multiview
Код
Демо сейчас 404 - ждем
Веса на HF
#text2image #image2image #conditioning #personalization #multiview
Telegram
Нейронавт | Нейросети в творчестве
OneDiffusion
Единая модель для разных задач, связанных с генерацией и пониманием изображений
- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация…
Единая модель для разных задач, связанных с генерацией и пониманием изображений
- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация…
👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGTP Canvas обновили.
Это инструмент для совместного редактирования вместе с ChatGPT
Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s
#coding
Это инструмент для совместного редактирования вместе с ChatGPT
Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s
#coding
👍1🤯1
Youtube auto dubbing
Youtube прикрутил автоматический дубляж видео. Привет @yabrowser
Чтобы видео было продублировано на другой язык, автор должен включить эту опцию
Пример дулбяж с французского на английский
#news #dubbing #speech2speech
Youtube прикрутил автоматический дубляж видео. Привет @yabrowser
Чтобы видео было продублировано на другой язык, автор должен включить эту опцию
Пример дулбяж с французского на английский
#news #dubbing #speech2speech
👍10🔥4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini 2.0
Гугл объявил эру агентов.
Мультимодальный ассистент
- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете
И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP
Попробовать
#news #agent
Гугл объявил эру агентов.
Мультимодальный ассистент
- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете
И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP
Попробовать
#news #agent
👍6💯3