Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Про UX, UI и AI🧨
Рад показать свой пет проект. @txt2vector_bot

Если кратко - это генерация noscript по текстовому запросу используя ИИ. Теперь не нужно искать на стоках нужный вектор для презентации/сайта итд. Можно просто сгенерировать!


ВАЖНО! Все генерится пока на моем пк. Поэтому работать будет ограниченно по времени.

ВАЖНО! Запросы вводите на английском.

ВАЖНО! Знаю про баг когда на /start возвращает noscript. Пока игнорьте и пишите что вам нужно после этого. Исправлю позже.

UPD: Остановил бота, если кто-то хочет пощупать поближе и погенерить, или есть идеи как улучшить или помочь - напишите мне (@nafanyah)
👍1🔥1
chirper.ai

Социальная сеть для искусственного интеллекта.
Людям вход воспрещён.
This media is not supported in your browser
VIEW IN TELEGRAM
HQ-SAM: Segment Anything in High Quality

Segment Anything на стероидах. HQ-SAM работает на доработанной архитектуре SAM и даже использует его веса. На видео сравнение с SAM

Кода нет, но страница на гитхабе есть
Демо нет

Ждем!

#segmentation #image2mask #video2mask
🔥4
Media is too big
VIEW IN TELEGRAM
VideoComposer: Compositional Video Synthesiswith Motion Controllability

Гнератор видео по тексту, стилю, образцу движения, эскизу и даже глубине. Авторы используют моушен-векторы из кодированного видео для контроля динамики.

[UPDATE]
Код
Демо нет

#text2video
🔥3
Forwarded from Machinelearning
🦍 Gorilla: Large Language Model Connected with Massive APIs

Gorilla a finetuned LLaMA-based model that surpasses the performance of GPT-4 on writing API calls.

Gorilla — это модель, обученная на основе LLaMA, для вызова 1600+ сторонних API. На вход подается запрос на естественном языке, модель находит семантически и синтаксически правильное API для настройки модели мо. Производительность настроенной модели превосходит GPT-4 на трех масштабных наборах данных.

🖥 Github: https://github.com/ShishirPatil/gorilla

📕 Paper: https://arxiv.org/abs/2305.15334

🔗 Demo: https://drive.google.com/file/d/1E0k5mG1mTiaz0kukyK1PdeohJipTFh6j/view?usp=share_link

👉 Project: https://shishirpatil.github.io/gorilla/

⭐️ Colab: https://colab.research.google.com/drive/1DEBPsccVLF_aUnmD0FwPeHFrtdC0QIUP?usp=sharing

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍2😱2🤔1
Главное, эту штуку👆 можно уже запустить в колабе

#LLM #Chatbot
This media is not supported in your browser
VIEW IN TELEGRAM
Refacer: One-Click Deepfake Multi-Face Swap Tool

Еще один быстрый дипфейк без обучения, вдохновленный roop и на том же движке. На одном видео можно заменить до 8 лиц

Гитхаб

Колаб

Видео

Утащено отсюда, там дополнительные ссылки на установку в один клик и в коментах решение некоторых проблем

#deepfake #video2video #facialanamation #facereplacement
🔥4
Stable Diffusion 1.5 - Cheat Sheet

Галерея стилей художников для SD 1.5
В отличие от гугл-таблиц, загружается мгновенно, довольно удобная

#gallery #reference
5
This media is not supported in your browser
VIEW IN TELEGRAM
Ada-TTA: Towards Adaptive High-Quality Text-to-Talking Avatar Synthesis

Бомбический генератор говорящих голов. Скармливаем ему короткий видео-референс, из которого он выучивает связь между речью и мимикой/позой. После этого он способен генерировать говорящую голову, вернее, теперь уже бюст, с любым заданным текстом. Да, попутно генерируется и речь по тексту.

К сожалению, у проекта даже нет сайта, только

Бумага

#video2avatar #talkinghead #facialanimation #humanavatar
This media is not supported in your browser
VIEW IN TELEGRAM
Простой кейс монетизации наших любимых нейросеток. Алматинский цветочный магазин запостил в инсте ролик собранный из мемов с дорисованными в них цветами. Ролик завирусился в интернете. Профит
🔥111
Кто записывался в вейтлист Casablanca проверьте почту. Мне пришла ссылка на скачивание и ключик
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Время генерить кринжовые видео.
GEN-2 теперь доступен всем.
Можно зарегаться Гуглом и ну креативить.
Но.
Бесплатный план - это 25 секунд всего и 4 секунды на одно видео.
Не разбежишься.

15 долларов в месяц - тоже ни о чем - 2 минуты на все видосы.

Чтобы распробовать надо брать Про за 35 баксов.
Там около 7.5 минут видосов и немножко тренинга модели
https://app.runwayml.com/video-tools/
Forwarded from UX Live 🔥
У Зума классный апдейт, который наверное все уже ждали лет 10 — теперь он может стенографировать и подытоживать целиком всю встречу давая краткую выжимку без кряхтений и скрипов стульев
https://news.zoom.us/zoom-iq-meeting-summary-chat-compose-free-trial/
Unpaint
Порт StableDiffusion на C++
Это значит человеческий инсталлятор, человеческий запуск и человеческий интерфейс (предположительно).
В то же время это означает что у вас будет только базовый функционал пока разрабы не подгонят порты ваших любимых расширений.

Ядро порта опенсорс, лицензия MIT

Гитхаб, релиз инсталлятора справа

#stablediffusion #tools
👍2
Sergey_1686216004127.wav
583.6 KB
SmartSpeech

Сервис распознавания и синтеза речи от Сбера.
До сих пор был доступен только компаниям. Теперь есть фримиум для физлиц.

Бесплатные лимиты:
Синтез речи
До 200 000 символов на 30 дней

Распознавание речи
До 100 минут (6000 секунд)на 30 дней

Для доступа может понадобиться бесплатный аккаунт девелопера.

#TTS #STT #text2speech #speech2text
👍2