NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Почему японский дизайн такой странный? Как любое медиа рано или поздно превращается в телевидение? Можно ли отличить сгенерированные фотки (и котиков 😐 ) от настоящих?

На эти и другие вопросы о влиянии технологий ищите ответы на канале «Живем в обществе».

Подписывайтесь!

#промо

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍2

1.58K views08:06

Нейронавт | Нейросети в творчестве

1:22

This media is not supported in your browser

VIEW IN TELEGRAM

GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

Агент от Tencent по фото определяет координаты где оно снято

Объединяет визуальное рассуждение и веб-поиск для уточнения гипотез.

Увеличивает масштаб изображений чтобы детально рассматривать интересующие области.

Гитхаб
HF ~34 ГБ

#image2geolocation #map #location #geolocation

👍11

2K views10:09

Нейронавт | Нейросети в творчестве

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

Adobe Photoshop Web на год бесплатно

Раздача годовой подписки на Photoshop Web - на странице расширения Adobe Photoshop для Гугл Хром.

Заходим на страницу расширения притворившись нероссиянином. У меня сработало через Польшу
Устанавливаем расширение и жмем кнопку с подпиской.
Нужна будет авторизация - пользуемся нероссийским аккаунтом.
Нейросетки должны работать в нем.

#giveaway #imageediting

👍7❤6

2.19K views11:08

Нейронавт | Нейросети в творчестве

#humor

😁13👍4

1.66K views12:22

Нейронавт | Нейросети в творчестве

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Dia2

Потоковый рилтаймовый генератор речи от Nari-labs, новая версия
Про первую версию тут

Всего 1B и 2B параметров.

Создает аудио до 2 минут на английском, ну этого должно хватать для диалогов. А для чего еще потоковая речь? Что с другими языками непонятно.

проект вдохновлён KyutaiTTS и Sesame

Гитхаб
HF
Демо

#tts #voicecloning #realtime #text2speech

👍6❤1

2.06K views13:36

Нейронавт | Нейросети в творчестве

FLUX.2: Frontier Visual Intelligence

Слухи оказались правдивы, новую версию генератора картинок Flux 2 выпустили.
Внутри Mistral-3 VLM 24B

— сохраняет характер и стиль при работе с несколькими референсными изображениями;

— следует сложным структурированным подсказкам;

— читает и пишет сложный текст;

— соблюдает брендбуки;

— грамотно работает с освещением, макетами и логотипами;

— редактирует изображения размером до 4 мегапикселей, сохраняя детали и целостность изображения;

— поддерживает работу с до 10 референсными изображениями одновременно;

— создаёт детальные фотореалистичные изображения и инфографику со сложной типографикой;

— надёжно обрабатывает сложную типографику, включая создание инфографики, мемов и макетов пользовательских интерфейсов с читаемым мелким текстом.

В релиз вошли следующие модели семейства FLUX.2:

FLUX.2 [pro]: модель с высоким качеством генерации изображений, быстрой работой и относительно низкими затратами.

FLUX.2 [flex]: модель, которая позволяет настраивать параметры (количество шагов, шкала руководства) и хорошо рендерит текст и мелкие детали.

FLUX.2 [dev]: открытая модель с 32 миллиардами параметров, поддерживает синтез текста в изображение и редактирование изображений с несколькими входными изображениями.

FLUX.2 [klein]: предстоящий релиз — открытая модель, более мощная и удобная для разработчиков по сравнению с аналогами того же размера. Вписаться в бету

FLUX.2 - VAE: вариационный автоэнкодер для латентных представлений, обеспечивает баланс между обучаемостью, качеством и степенью сжатия.

BFL Playground
BFL API
HF
Демо

#text2image #referencing #image2image #imageediting #vlm

🔥18❤3

2.89K views16:55

Нейронавт | Нейросети в творчестве

64 ГБ. бежим скачивать, ага

😭14😁6😱2

1.57K views16:57

Нейронавт | Нейросети в творчестве

fp8

https://huggingface.co/Comfy-Org/flux2-dev

huggingface.co

Comfy-Org/flux2-dev · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍6😁1

2.13K viewsedited 17:03

Нейронавт | Нейросети в творчестве

Ну неплохо

Но с направлениями беда. Надо справа налево.
И как прочие модели не любит изображать людей на заднем плане с лица, предпочитает рисовать спины.

photo of fantasy Fish straight-walking from right to the left in a human city as undercover agent, wearing a survival landsuit with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguise, masterpiece, wide view, distant view

👍4🤷‍♂2🔥1

1.64K views17:36

Нейронавт | Нейросети в творчестве

https://huggingface.co/orabazes/FLUX.2-dev-GGUF/tree/main

Держите ггуфы нового флюкса

Спасибо Gos

#gguf #flux2

huggingface.co

orabazes/FLUX.2-dev-GGUF at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍7❤2

1.61K views06:08

Нейронавт | Нейросети в творчестве

В Comfy Cloud обновки

Переход на GPUs Blackwell RTX 6000 Pro, которые примерно в два раза быстрее A100. У новых GPU 96 ГБ VRAM и 180 ГБ RAM, что позволяет работать с более тяжёлыми задачами, например, с масштабированием видео. Обновление доступно всем пользователям без дополнительной платы

Возможность загружать собственные LoRAs с Civitai (поддержка HuggingFace появится позже). Функция будет доступна с 8 декабря на плане Creator

Увеличение максимального времени работы рабочих процессов с 30 минут до 1 часа. Функция будет доступна с 8 декабря на плане Pro

Введение единой системы кредитов Comfy Credits: теперь все операции выполняются с использованием единого баланса кредитов, включая использование Partner Nodes и облачных рабочих процессов. Стоимость использования Partner Nodes будет фиксированной, а за облачные рабочие процессы будут взимать плату в зависимости от продолжительности их работы.

#Comfyui #news

❤9👍3😱2

1.95K viewsedited 07:11

Нейронавт | Нейросети в творчестве

7 tips to get the most out of Nano Banana Pro

Если еще не видели, вот официальный гайд по Nano Banana Pro

#guide

👍7

1.54K views07:41

Нейронавт | Нейросети в творчестве

DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

Диффузный генератор изображений напрямую в пиксельном пространстве.

Тут интересна архитектура

В отличие от аналогов, DeCo эффективнее разделяет задачи моделирования высоко- и низкочастотных компонентов, что позволяет улучшить качество изображений и ускорить обучение и вывод

Текстовый энкодер Qwen 3 поддерживает несколько языков

Авторы не стали заморачиваться с разрешением, сделали модели на 256 и 512 пикселей. В демо можно поднять до 1024 но результат будет покореженный как в SD1.5

Ну и веса у нее 2 ГБ. Если искали замену SD1.5 посмотрите DeCo

Гитхаб
HF
Демо

#text2image

👍12❤1

1.66K views08:12

About

Blog

Apps

Platform