Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
DALL-E 3 умеет рисовать панорамы 360.
А шов прятать не умеет.

покрутить готовые панорамы можно здесь

твиттер
🔥4
Forwarded from Сиолошная
Новая модель:
— контекст длиннее. 128K токенов (365 страниц обычной книги)
— модель более аккуратна при работе с длинным текстом, не теряет то, что было в серединке
— фича для разрабов: можно заставить модель писать ответы в JSON-формате
— можно вызывать несколько функций за раз
— можно указать seed генерации, чтобы получать воспроизводимость
— скоро добавят logprobs в API
— Retrieval прямо из коробки, можно загружать документы на платформу и они будут подтягиватсья (F стартапам chatWithPDF)
— Теперь модель знает события не до сентября 2021го, а апреля 2023го
— Эта новая модель принимает картинки на вход через API

— DALLE-3 + text-to-speech (6 голосов) сегодня появятся в API
— Для GPT-4 появится файнтюнинг сегодня (но на узкую выборку пользователей)
— Custom Models: программа плотной работыт инженеров OpenAI с вашей компанией, чтобы помочь адаптировать тренировку под ваши проблемы

ЦЕНА НА GPT-4-TURBO (Sam говорит, что эта модель ещё и умнее GPT-4) уменьшена в 3 раза для промпта и в 2 раза для генерации!

Обещают скоро ещё больше ускорить GPT-4 Turbo
👍62
Deepseek coder

Ассисент программиста.
- режим чата
- дописывание кода
- вставка кода
- дописывание кода на уровне репозитория
- контекстное окно (или как там это называется) 16000 токенов

По заявлениям разработчиков превосходит все существующие опенсорсные аналоги.

Чат с ассистенотом на офсайте. Придется пройти регистрацию
Гитхаб
Демо 7B
Демо 33B
Скачать модели
Дискорд

#coding #llm #chatbot #assistant
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
xAI Grok

ИИ-ассистент от X (твиттер) и Илона Маска с доступом к актуальным данным из твиттера и умением в юмор.

Доступ дадут премиум-пользователям.
Сейчас можно записаться в вейтлист

#llm #assiatant #chatbot
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision

#nerf для автопилотов.
Отделяет динамические объекты от сцены, может рендерить отдельно то и другое. Из интересного для меня - глубина на выходе.

Код

#novelview #video2depth
👍1🔥1
нет пальцев - нет проблемы
👍9🔥7😁4
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI Text-To-Speech API with Gradio

Демоспейс для попробовать генератор речи от OpenAI.
А он неплох.

#tts #text2speech
🔥7
Forwarded from эйай ньюз
🔥Consistency Decoder

Среди недавних релизов OpenAI больше всего в мое сердечко запал их новый декодер для LDM - Consistency Decoder.

Напомню, что Stable Diffusion генерирует изображения в Latent пространстве, которое затем декодируется VQ-VAE декодером (на картинке выше, кажется, его назвали GAN Decoder). Такой декодер довольно легковесен, но он не может точно восстанавливать мелки детали типа лиц людей на заднем плане. Поэтому парни из OpenAI решили натренировать еще одну диффузию вместо VAE декодера.

Но диффузия работает медленно и требует много шагов во время инференса... Тут на помощь пришла дистилляция из диффузии в Consistency Model, которая может неплохо работать за 1-2 шага, если руки не кривые.

В статье про Dalle-3 было вскользь упомянуто, что в новой архитектуре для перевода скрытого кода в RGB они как раз используют такой Consistency Decoder, который работает за 2 шага.

Consistency Decoder - это тоже Unet, и довольно большой, 620 M параметров (для сравнения SD 1.5 ~900M параметров). Но это все равно допустимая жертва ради улучшенного качества восстановления лиц, мелких деталей и регулярных линий.

Жаль, только, что кода тренировки нет, и остается только заниматься реверс-инженирингом и экспериментировать, чтобы понять как они натренировали этот декодер. Выложили только инференс и веса декодера, который совместим с базовым Stable Diffusion 1.x - 2x и может использоваться как drop-in replacement вместо стандартного декодера.

➡️ Код и веса

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3
Forwarded from Aamir Khan
https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/consistency-dec - ветка автоматика с этим декодером VAE type for decode поменять на Consistency Decoderв настройках.
https://colab.research.google.com/drive/1k3ejvTOraWFbuxj17dPFYDAULliDW0JN?usp=sharing
вот колаб
помоему в статье всеже чери пикинг но результат есть и меньше мешанины в кадре. Но я только на 1.5 стандартной тестил возможно с другими моделями лучше пойдет
🔥4👎2
Media is too big
VIEW IN TELEGRAM
vimGPT

Браузер-агент на основе GPT-4V. Умеет сам ходить по сайтам, проходить капчу. Разработчик планирует дообучить LLaVa или CogVLM в качестве альтернативы платному GPT-4V

Гитхаб

#LLM #VLM #assistant #agent
В Южной Корее робот убил сотрудника завода, потому что идентифицировал его как картонную коробку

Погибший — 40-летний рабочий центра распределения сельскохозяйственной продукции, задачей которого было проверять датчики роботизированных машин. Поздно ночью мужчина провел тестовый запуск робота — он должен был погрузить коробку с болгарским перцем на поддон, но произошла техническая ошибка. Роботизированная рука схватила человека и прижала его к конвейерной ленте.

Сотрудника экстренно увезли в больницу, где он и умер. Сейчас руководство завода призвало создать точные и безопасные системы, чтобы предотвратить новые аварии.

the Guardian

#яниначтоненамекаю
2
Сегодня новостей не будет, админ расклеился

#neutonaut_art
😱7🎃4🤯1