Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Тэкс, Google анонсировал модельки для генерации кода встроенные прямо в Colab. Скоро появятся во всех ноутбуках.
Под ноутбуком будут бегать модельки под названием Codey (типа аналог OpenAI Codex), которые основаны на Palm-2 и натренены на опенсоурсных исходниках. Теперь везде будут пихать этот Палм.
Хотя, думаю, народ в FAANG-ах уже давно пользуются аналогичным дополнялками внутри компаний. Не будешь же на работе в гугл колабе писать (если вы не стартап) или кодексу свои велосипеды показывать.
@ai_newz
Под ноутбуком будут бегать модельки под названием Codey (типа аналог OpenAI Codex), которые основаны на Palm-2 и натренены на опенсоурсных исходниках. Теперь везде будут пихать этот Палм.
Хотя, думаю, народ в FAANG-ах уже давно пользуются аналогичным дополнялками внутри компаний. Не будешь же на работе в гугл колабе писать (если вы не стартап) или кодексу свои велосипеды показывать.
@ai_newz
Forwarded from QWERTY
ИИ сам освоил новый язык, которому его не учили
Разработчики нейросети от Google были удивлены тому, что она стала обладать знаниями, которые знать не должна. В данном случае речь идет о бенгальском языке. Потребовалось совсем немного подсказок, чтобы получать внятные и вполне осмысленные ответы на этом языке. На данный момент профильные специалисты не находят ничего лучше, чем сказать, что открытое свойство ИИ является «загадочным». Разработчики озадачены еще и тем, что этот феномен становится все более распространенным.
Бенгальский язык распространен на северо-востоке Индийского субконтинента, на нем говорят более 260 млн чел.
Разработчики нейросети от Google были удивлены тому, что она стала обладать знаниями, которые знать не должна. В данном случае речь идет о бенгальском языке. Потребовалось совсем немного подсказок, чтобы получать внятные и вполне осмысленные ответы на этом языке. На данный момент профильные специалисты не находят ничего лучше, чем сказать, что открытое свойство ИИ является «загадочным». Разработчики озадачены еще и тем, что этот феномен становится все более распространенным.
Бенгальский язык распространен на северо-востоке Индийского субконтинента, на нем говорят более 260 млн чел.
❤4
This media is not supported in your browser
VIEW IN TELEGRAM
lalamu
Липсинк. Заставляем любого персонажа шевелить губами под заданный аудиотрек с речью. Есть какой-то бесплатный функционал
Делитесь результатами в коментах!
#lipsync #speech2video #talkinghead
Липсинк. Заставляем любого персонажа шевелить губами под заданный аудиотрек с речью. Есть какой-то бесплатный функционал
Делитесь результатами в коментах!
#lipsync #speech2video #talkinghead
This media is not supported in your browser
VIEW IN TELEGRAM
Ecout — транскрипция любого видео в реальном времени
Он ещё и придумывает ответы на вопросы, которые звучат прямо в эфире, используя OpenAI GPT-3.5
Код
#speech2text #video2text
Он ещё и придумывает ответы на вопросы, которые звучат прямо в эфире, используя OpenAI GPT-3.5
Код
#speech2text #video2text
Forwarded from Градиент обреченный (Sergei Averkiev)
Всем продуктивной недели. Не обижайте языковые модели, они наши друзья.
Forwarded from Dreams and Robots
Вы наверняка слышали про Instruct pix2pix. Это модель, которая позволяет менять картинку на основе текстового запроса типа "make his hair blue" или "turn it into a wood carving".
Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength.
Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate.
Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём.
#совет #A1111 #stablehoudini
Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength.
Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate.
Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём.
#совет #A1111 #stablehoudini
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
CoDi: Any-to-Any Generation via Composable Diffusion
Microsoft сообразил генерацию чего угодно из чего угодно:
текст, звук, видео, картинки
[UPDATE]
Код
#multimodal #anything2anything
Microsoft сообразил генерацию чего угодно из чего угодно:
текст, звук, видео, картинки
[UPDATE]
Код
#multimodal #anything2anything
👍1
Forwarded from Derp Learning
RWKV: Parallelizable RNN with Transformer-level LLM Performance
Пока все засовывают эти ваши 30b int4 лламы на cpu, EleutherAI x BlinkDL выкладывают RNN, которая перформит на уровне GPT-level (14b). При этом она (14b int8) влезает в 3gb VRAM, и имеет, в принципе, бесконечную длину контекста, как и все RNN.
Paper
Code
Models
Discord
Twitter
Чат-версия: https://github.com/BlinkDL/ChatRWKV
@derplearning
Пока все засовывают эти ваши 30b int4 лламы на cpu, EleutherAI x BlinkDL выкладывают RNN, которая перформит на уровне GPT-level (14b). При этом она (14b int8) влезает в 3gb VRAM, и имеет, в принципе, бесконечную длину контекста, как и все RNN.
Paper
Code
Models
Discord
Чат-версия: https://github.com/BlinkDL/ChatRWKV
@derplearning
👍4
MaskFreeVIS: Mask-Free Video Instance Segmentation
Новый эффективный метод сегментации видео.
Код
#segmentation #video2mask
Новый эффективный метод сегментации видео.
Код
#segmentation #video2mask
Media is too big
VIEW IN TELEGRAM
Наконец руки дошли поковыряться в этих ваших нейросетках.
В ответ на мэшапы голосом Винни Пуха Гомер Симпсон исполнил песню Винни Пуха.
Сделано вот в этом колабе
Инструкция
Youtube
#Neuronaut_art
В ответ на мэшапы голосом Винни Пуха Гомер Симпсон исполнил песню Винни Пуха.
Сделано вот в этом колабе
Инструкция
Youtube
#Neuronaut_art
❤2
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Casablanca.ai – сервис, который пошёл дальше, чем сервисы Nvidia, сдвигающие ваши глаза в камеру, он позволяет повернуть всю вашу голову.
Считаю, что хватит уже ходить вокруг да около, замените всё тело, и пусть оно само делает заинтересованный вид на дейли синках.
Считаю, что хватит уже ходить вокруг да около, замените всё тело, и пусть оно само делает заинтересованный вид на дейли синках.
😁6
MMS: Scaling Speech Technology to 1000+ languages
Специалисты из Meta AI выпустили модель, которая переводит 1100 языков из текста в аудио и из аудио в текст. Целью было, как я понял, создание единой модели, понимающей много языков. Судя по демо, получилось.
Кроме всего прочего, для обучения собрали и использовали аудио записи, где люди читают Библию на разных языках. Потому что, кажется, нет другой книги, которая была бы переведена на столько разных языков. Очень хитро́!
Код
#TTS #STT
Специалисты из Meta AI выпустили модель, которая переводит 1100 языков из текста в аудио и из аудио в текст. Целью было, как я понял, создание единой модели, понимающей много языков. Судя по демо, получилось.
Кроме всего прочего, для обучения собрали и использовали аудио записи, где люди читают Библию на разных языках. Потому что, кажется, нет другой книги, которая была бы переведена на столько разных языков. Очень хитро́!
Код
#TTS #STT
This media is not supported in your browser
VIEW IN TELEGRAM
ControlVideo
Пытаются обучать #text2video при помощи Controlnet.
Ну, такое. Посмотрим что будет дальше
Пытаются обучать #text2video при помощи Controlnet.
Ну, такое. Посмотрим что будет дальше