Промптхаб Яндекса
Яндекс выпустил платформу с идеями для применения нейронок. Есть как готовые промпты для разных задач, так и мини-курсы для обучения. Свои промпты тоже можно добавлять.
Если хотите посоревноваться в нейротворчестве – челленджи с разными заданиями на генерации, например видео для продажи товара на маркетплейсе или книжка со сказками.
Призы:
250 000 за первое место
150 000 за второе
50 000 за третье
и Яндекс станции за 4 и 5 места
#news #competition
Яндекс выпустил платформу с идеями для применения нейронок. Есть как готовые промпты для разных задач, так и мини-курсы для обучения. Свои промпты тоже можно добавлять.
Если хотите посоревноваться в нейротворчестве – челленджи с разными заданиями на генерации, например видео для продажи товара на маркетплейсе или книжка со сказками.
Призы:
250 000 за первое место
150 000 за второе
50 000 за третье
и Яндекс станции за 4 и 5 места
#news #competition
👍7👎4🥴4😐3🍌1
Fara-7B: An Efficient Agentic Model for Computer Use
Локальный компактный агент от Microsoft для управления компьютером на базе Qwen2.5-VL-7B
— ищет информацию и суммирует результаты;
— заполняет формы и управляет аккаунтами;
— бронирует путешествия, билеты в кино и рестораны;
— занимается шопингом и сравнивает цены в разных магазинах;
— находит объявления о работе и недвижимость.
Гитхаб
HF
#agent #gui #vlm
Локальный компактный агент от Microsoft для управления компьютером на базе Qwen2.5-VL-7B
— ищет информацию и суммирует результаты;
— заполняет формы и управляет аккаунтами;
— бронирует путешествия, билеты в кино и рестораны;
— занимается шопингом и сравнивает цены в разных магазинах;
— находит объявления о работе и недвижимость.
Гитхаб
HF
#agent #gui #vlm
1👍8❤1
In-Video Instructions: Visual Signals as Generative Control
Контроль сюжета на видеогенерации визуальными аннотациями
Метод тестировали на нескольких моделях: Veo 3.1, Kling 2.5 и Wan 2.2
Код ждем
#visualprompting #motioncontrol #image2video
Контроль сюжета на видеогенерации визуальными аннотациями
Метод тестировали на нескольких моделях: Veo 3.1, Kling 2.5 и Wan 2.2
Код ждем
#visualprompting #motioncontrol #image2video
👍18🔥1
🔥22👍9❤1😱1💯1
Adv-GRPO
ByteDance ищет новые пути улучшения качества генерации картинок
Adv-GRPO — фреймворк для обучения с подкреплением (RL), который использует состязательное вознаграждение для улучшения генерации изображений по тексту
— применяет визуальные базовые модели (например, DINO) в качестве системы вознаграждения, что даёт более детальные визуальные сигналы для оптимизации
— позволяет проводить настройку стиля с помощью референсных наборов данных, направляя базовую модель к определённым визуальным стилям
— эффективнее борется с проблемой «хакерства вознаграждений», при которой модель получает высокие оценки, но не улучшает качество изображений
Прикрутили к #SD3 и превзошли его и Flow-GRPO
Гитхаб
HF
Демо
#research #text2image
ByteDance ищет новые пути улучшения качества генерации картинок
Adv-GRPO — фреймворк для обучения с подкреплением (RL), который использует состязательное вознаграждение для улучшения генерации изображений по тексту
— применяет визуальные базовые модели (например, DINO) в качестве системы вознаграждения, что даёт более детальные визуальные сигналы для оптимизации
— позволяет проводить настройку стиля с помощью референсных наборов данных, направляя базовую модель к определённым визуальным стилям
— эффективнее борется с проблемой «хакерства вознаграждений», при которой модель получает высокие оценки, но не улучшает качество изображений
Прикрутили к #SD3 и превзошли его и Flow-GRPO
Гитхаб
HF
Демо
#research #text2image
❤4👍3🔥2
Fara-7B GGUF
Квантизованные веса компактного агента
Huihui-Fara-7B-abliterated-GGUF - статические
Fara-7B-i1-GGUF - взвешенные
В чем разница понятия не имею
mradermacher quant download page
#agent #gui #vlm #gguf
Квантизованные веса компактного агента
Huihui-Fara-7B-abliterated-GGUF - статические
Fara-7B-i1-GGUF - взвешенные
В чем разница понятия не имею
mradermacher quant download page
#agent #gui #vlm #gguf
Telegram
Нейронавт | Нейросети в творчестве
Fara-7B: An Efficient Agentic Model for Computer Use
Локальный компактный агент от Microsoft для управления компьютером на базе Qwen2.5-VL-7B
— ищет информацию и суммирует результаты;
— заполняет формы и управляет аккаунтами;
— бронирует путешествия,…
Локальный компактный агент от Microsoft для управления компьютером на базе Qwen2.5-VL-7B
— ищет информацию и суммирует результаты;
— заполняет формы и управляет аккаунтами;
— бронирует путешествия,…
👍9