NEW BOT Телеграм, страница

This media is not supported in your browser

Тэкс, Google анонсировал модельки для генерации кода встроенные прямо в Colab. Скоро появятся во всех ноутбуках.

Под ноутбуком будут бегать модельки под названием Codey (типа аналог OpenAI Codex), которые основаны на Palm-2 и натренены на опенсоурсных исходниках. Теперь везде будут пихать этот Палм.

Хотя, думаю, народ в FAANG-ах уже давно пользуются аналогичным дополнялками внутри компаний. Не будешь же на работе в гугл колабе писать (если вы не стартап) или кодексу свои велосипеды показывать.

@ai_newz

337 views11:37

Нейронавт | Нейросети в творчестве

Forwarded from QWERTY

ИИ сам освоил новый язык, которому его не учили

Разработчики нейросети от Google были удивлены тому, что она стала обладать знаниями, которые знать не должна. В данном случае речь идет о бенгальском языке. Потребовалось совсем немного подсказок, чтобы получать внятные и вполне осмысленные ответы на этом языке. На данный момент профильные специалисты не находят ничего лучше, чем сказать, что открытое свойство ИИ является «загадочным». Разработчики озадачены еще и тем, что этот феномен становится все более распространенным.

Бенгальский язык распространен на северо-востоке Индийского субконтинента, на нем говорят более 260 млн чел.

❤4

408 views12:03

Нейронавт | Нейросети в творчестве

Ян Лекун - один из нескольких человек в мире, которые больше всех понимают про большие языковые модели (LLM), их возможности и риски, с ними связанные

❤3

396 viewsedited 07:32

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

lalamu
Липсинк. Заставляем любого персонажа шевелить губами под заданный аудиотрек с речью. Есть какой-то бесплатный функционал

Делитесь результатами в коментах!

#lipsync #speech2video #talkinghead

484 views07:37

Нейронавт | Нейросети в творчестве

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

Ecout — транскрипция любого видео в реальном времени

Он ещё и придумывает ответы на вопросы, которые звучат прямо в эфире, используя OpenAI GPT-3.5

Код

#speech2text #video2text

461 viewsedited 07:41

Нейронавт | Нейросети в творчестве

Forwarded from Градиент обреченный (Sergei Averkiev)

Всем продуктивной недели. Не обижайте языковые модели, они наши друзья.

433 views08:01

Нейронавт | Нейросети в творчестве

Forwarded from Dreams and Robots

Вы наверняка слышали про Instruct pix2pix. Это модель, которая позволяет менять картинку на основе текстового запроса типа "make his hair blue" или "turn it into a wood carving".

Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength.

Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate.

Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём.

#совет #A1111 #stablehoudini

👍4

491 views10:03

Нейронавт | Нейросети в творчестве

Поругаться с поумневшим скрепышем

😁1

572 views11:54

Нейронавт | Нейросети в творчестве

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

CoDi: Any-to-Any Generation via Composable Diffusion

Microsoft сообразил генерацию чего угодно из чего угодно:
текст, звук, видео, картинки

[UPDATE]
Код

#multimodal #anything2anything

👍1

697 viewsedited 12:02

Нейронавт | Нейросети в творчестве

Forwarded from Derp Learning

RWKV: Parallelizable RNN with Transformer-level LLM Performance

Пока все засовывают эти ваши 30b int4 лламы на cpu, EleutherAI x BlinkDL выкладывают RNN, которая перформит на уровне GPT-level (14b). При этом она (14b int8) влезает в 3gb VRAM, и имеет, в принципе, бесконечную длину контекста, как и все RNN.

Paper
Code
Models

Discord
Twitter

Чат-версия: https://github.com/BlinkDL/ChatRWKV

@derplearning

👍4

458 views05:09

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MaskFreeVIS: Mask-Free Video Instance Segmentation

Новый эффективный метод сегментации видео.

Код

#segmentation #video2mask

532 views06:52

Нейронавт | Нейросети в творчестве

0:41

Media is too big

VIEW IN TELEGRAM

Наконец руки дошли поковыряться в этих ваших нейросетках.
В ответ на мэшапы голосом Винни Пуха Гомер Симпсон исполнил песню Винни Пуха.

Сделано вот в этом колабе

Инструкция

Youtube

#Neuronaut_art

❤2

608 views07:27

Нейронавт | Нейросети в творчестве

Forwarded from CGIT_Vines (Marvin Heemeyer)

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Casablanca.ai – сервис, который пошёл дальше, чем сервисы Nvidia, сдвигающие ваши глаза в камеру, он позволяет повернуть всю вашу голову.

Считаю, что хватит уже ходить вокруг да около, замените всё тело, и пусть оно само делает заинтересованный вид на дейли синках.

😁6

373 views08:16

Нейронавт | Нейросети в творчестве

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

1:30

This media is not supported in your browser

VIEW IN TELEGRAM

MMS: Scaling Speech Technology to 1000+ languages

Специалисты из Meta AI выпустили модель, которая переводит 1100 языков из текста в аудио и из аудио в текст. Целью было, как я понял, создание единой модели, понимающей много языков. Судя по демо, получилось.

Кроме всего прочего, для обучения собрали и использовали аудио записи, где люди читают Библию на разных языках. Потому что, кажется, нет другой книги, которая была бы переведена на столько разных языков. Очень хитро́!

Код

#TTS #STT

550 views08:43

Нейронавт | Нейросети в творчестве

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

ControlVideo

Пытаются обучать #text2video при помощи Controlnet.
Ну, такое. Посмотрим что будет дальше

494 views08:51

About

Blog

Apps

Platform