Open AI опять дразнят! Новая нейросеть скопирует голос за 15 секунд
Open AI опять решили подразнить обычных пользователей и предоставили ограниченный доступ к своей новой нейросети для преобразования текста в голос - Voice Engine. Она позволяет скопировать голос человека из 15-секундной аудиозаписи
Технология как и ElevenLabs поможет компаниям, преподавателям и инфлюенсерам обращаться к аудитории на любом языке собственным голосом, причем сохранив родной акцент.
Доступ к ней получили пока только серьезные компании HeyGen, Age of Learning и Dimagi.
HeyGen вообще красавчики - используют технологии как ElevenLabs, так и OpenAI, чтобы предложить своим пользователям более широкие возможности при создании видео с искусственным интеллектом.
Так вот, тестирование Voice Engine показало как можно использовать технологию во благо в различных отраслях. Вот несколько ранних примеров: перевод контента, помощь в чтении и поддержка лиц, не способных говорить, восстановление голоса людям с нарушениями речи.
Подробнее в блоге OpenAI
Open AI опять решили подразнить обычных пользователей и предоставили ограниченный доступ к своей новой нейросети для преобразования текста в голос - Voice Engine. Она позволяет скопировать голос человека из 15-секундной аудиозаписи
Технология как и ElevenLabs поможет компаниям, преподавателям и инфлюенсерам обращаться к аудитории на любом языке собственным голосом, причем сохранив родной акцент.
Доступ к ней получили пока только серьезные компании HeyGen, Age of Learning и Dimagi.
HeyGen вообще красавчики - используют технологии как ElevenLabs, так и OpenAI, чтобы предложить своим пользователям более широкие возможности при создании видео с искусственным интеллектом.
Так вот, тестирование Voice Engine показало как можно использовать технологию во благо в различных отраслях. Вот несколько ранних примеров: перевод контента, помощь в чтении и поддержка лиц, не способных говорить, восстановление голоса людям с нарушениями речи.
Подробнее в блоге OpenAI
🔥10👍6
Нейросеть определяет любые объекты на фото и видео бесплатно в один клик
T-Rex по запросу находит даже самые мелкие детали в кадре! Обратите внимание, как точно нейросеть выделила пули, летящие в Нео.
T-Rex помогает собрать все объекты в базу данных, удалить мусорные баки с фотки, посчитать количество конфет и многое другое.
Код на GitHub
Попробовать на изображениях на сайте
Функции⚙️
Основные операции
Нажмите прямоугольную кнопку на левой панели инструментов и выделите объект для обнаружения. Нажмите кнопку "Старт" для запуска. iVP поддерживает несколько визуальных подсказок одновременно и может возвращать рамки, точки и маски.
Многораундовое взаимодействие
Когда одной визуальной подсказки недостаточно, можно добавить дополнительные визуальные подсказки, чтобы улучшить результаты обнаружения.
Отрицательная подсказка (только для Trex)
Если в результатах обнаружения присутствуют ложные обнаружения, для их устранения можно использовать негативные подсказки. Щелкните раскрывающееся поле, чтобы выбрать негативную подсказку, а затем выделите рамкой цель ложного обнаружения.
Обнаружение перекрестных изображений
iVP обладает определенной способностью к обнаружению перекрестных изображений. В сценарии обнаружения перекрестных изображений визуальная подсказка, предоставленная пользователем, может отличаться от изображения, которое должно быть обнаружено.
T-Rex по запросу находит даже самые мелкие детали в кадре! Обратите внимание, как точно нейросеть выделила пули, летящие в Нео.
T-Rex помогает собрать все объекты в базу данных, удалить мусорные баки с фотки, посчитать количество конфет и многое другое.
Код на GitHub
Попробовать на изображениях на сайте
Функции
Основные операции
Нажмите прямоугольную кнопку на левой панели инструментов и выделите объект для обнаружения. Нажмите кнопку "Старт" для запуска. iVP поддерживает несколько визуальных подсказок одновременно и может возвращать рамки, точки и маски.
Многораундовое взаимодействие
Когда одной визуальной подсказки недостаточно, можно добавить дополнительные визуальные подсказки, чтобы улучшить результаты обнаружения.
Отрицательная подсказка (только для Trex)
Если в результатах обнаружения присутствуют ложные обнаружения, для их устранения можно использовать негативные подсказки. Щелкните раскрывающееся поле, чтобы выбрать негативную подсказку, а затем выделите рамкой цель ложного обнаружения.
Обнаружение перекрестных изображений
iVP обладает определенной способностью к обнаружению перекрестных изображений. В сценарии обнаружения перекрестных изображений визуальная подсказка, предоставленная пользователем, может отличаться от изображения, которое должно быть обнаружено.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍7🔥3
Media is too big
VIEW IN TELEGRAM
Новая бесплатная нейросеть Command R+. Достойный аналог GPT-4 и Claude 3
Cohere выпустил опенсорсную LLM Command R+, в которой 104 миллиарда параметров. Контекстное окно 128 тысяч токенов, как и у GPT-4 Turbo, поддерживает длительный диалог с пользователем. По данным некоторых бенчмарков Command R+ работает наравне с Claude 3 Sonnet и GPT-4.
Command R+ предназначен для разнообразных задач - написание кода, текста или решение примеров по алгебре.
На сайте написано, что это многоязычная версия, и перечислены 10 языков, в числе которых русский не значится.
Однако, как можно видеть из видео, Command R+ без проблем мне сгенерировал доклад на тему “История развития моды”, да еще и подробно разделил на периоды по простому запросу “раскрой каждый период”.
Мне инструмент понравился, никаких впн, регистраций и прочих препятствий - все просто и быстро. Интерфейс понятный, зашел на сайт, написал запрос и тут же получил ответ. И это при том, что использовала демо-версию, контекст чат-бот действительно запоминает
Открытый код Huggingface
Демо на Huggingface
Cohere выпустил опенсорсную LLM Command R+, в которой 104 миллиарда параметров. Контекстное окно 128 тысяч токенов, как и у GPT-4 Turbo, поддерживает длительный диалог с пользователем. По данным некоторых бенчмарков Command R+ работает наравне с Claude 3 Sonnet и GPT-4.
Command R+ предназначен для разнообразных задач - написание кода, текста или решение примеров по алгебре.
На сайте написано, что это многоязычная версия, и перечислены 10 языков, в числе которых русский не значится.
Однако, как можно видеть из видео, Command R+ без проблем мне сгенерировал доклад на тему “История развития моды”, да еще и подробно разделил на периоды по простому запросу “раскрой каждый период”.
Мне инструмент понравился, никаких впн, регистраций и прочих препятствий - все просто и быстро. Интерфейс понятный, зашел на сайт, написал запрос и тут же получил ответ. И это при том, что использовала демо-версию, контекст чат-бот действительно запоминает
Открытый код Huggingface
Демо на Huggingface
🔥19👍12❤2
Две классных новости за раз 🎉
1️⃣ В GPTs Dall-E от 💻 Open AI появились стили и соотношение сторон
2️⃣ 🌐 Нейросеть от Google Gemini 1.5 Pro обновили и научили обрабатывать аудио
Теперь легко можно загрузить длинный подкаст и получить саммари - краткую выжимку на нужном языке, переконвертировать видео-курс в текст или загрузить лекцию, как на видео, и Gemini 1.5 Pro сделает тест по содержанию.
Что классно❓
🟢 Нейросеть хорошо распознает слова, тон, эмоции
🟢 Можно загрузить до 11 часов видео за раз
🟢 Добавили режим JSON и открыли API без листа ожидания
Подробнее про Gemini 1.5 Pro в этом посте
Как подключать Gemini в этом посте
Теперь легко можно загрузить длинный подкаст и получить саммари - краткую выжимку на нужном языке, переконвертировать видео-курс в текст или загрузить лекцию, как на видео, и Gemini 1.5 Pro сделает тест по содержанию.
Что классно
Подробнее про Gemini 1.5 Pro в этом посте
Как подключать Gemini в этом посте
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤12
Меняйте людей на фотографиях с помощью ИИ бесплатно
PhotoHero- это сервис, призванный разнообразить визуальный контент за счет использования искусственного интеллекта для замены людей на фотографиях без особых усилий.
Платформа пока 100% бесплатная, простая в использовании и быстрая, что позволяет пользователям привлечь больше клиентов по всем каналам.
Подойдет не только для исправления и улучшения неудачных фоточек.
Инструмент может быть особенно полезен для компаний и создателей контента, стремящихся сделать свои материалы более привлекательными для различных аудиторий.
Так что нейросеть без труда поменяет местами людей и фон.
Цель проекта - привлечь новую аудиторию, позволяя пользователям улучшать свой контент, делая его более инклюзивным и привлекательным.
PhotoHero- это сервис, призванный разнообразить визуальный контент за счет использования искусственного интеллекта для замены людей на фотографиях без особых усилий.
Платформа пока 100% бесплатная, простая в использовании и быстрая, что позволяет пользователям привлечь больше клиентов по всем каналам.
Подойдет не только для исправления и улучшения неудачных фоточек.
Инструмент может быть особенно полезен для компаний и создателей контента, стремящихся сделать свои материалы более привлекательными для различных аудиторий.
Так что нейросеть без труда поменяет местами людей и фон.
Цель проекта - привлечь новую аудиторию, позволяя пользователям улучшать свой контент, делая его более инклюзивным и привлекательным.
🔥20👍9❤4🙈4❤🔥2
Заменитель Sora для создания видео
Пока нейросеть для создания самых эффектных видео по тексту Sora не представили в открытый доступ, энтузиасты хотят воспроизвести эту модель с открытым исходным кодом. Вот любопытная модель
Open-Sora - проект с открытым исходным кодом с 724M параметрами. Разрешение 512*512, длительность 2 секунды.
Код на GitHub
Попробовать на HuggingFace 1
Попробовать на HuggingFace 2
Попробовать на Replikate
Collab
Пока нейросеть для создания самых эффектных видео по тексту Sora не представили в открытый доступ, энтузиасты хотят воспроизвести эту модель с открытым исходным кодом. Вот любопытная модель
Open-Sora - проект с открытым исходным кодом с 724M параметрами. Разрешение 512*512, длительность 2 секунды.
Код на GitHub
Попробовать на HuggingFace 1
Попробовать на HuggingFace 2
Попробовать на Replikate
Collab
🔥19👍8❤5
Media is too big
VIEW IN TELEGRAM
Еще один убийца Suno 🤖
Новая нейросеть UDIO вышла в открытую бету, это значит, что на этот период продукт бесплатен и пользователи могут генерировать до 1200 песен в месяц!
Можно создать песню как со своими словами, так и рандомными, еще можно перенять стиль артиста.
Я опять использовала такой же промпт, что и для Suno и Stable Audio. Нейросеть так же генерирует по 2 трека длительностью 30 секунд, но понравившийся трек можно продлевать.
Треки генерировались 4 минуты и сам сервис немного подвисает из-за наплыва пользователей, желающих протестировать новинку бесплатно.
Видео, кстати, тоже скачать не удалось, ну как видео- обложка сингла с играющей музыкой. Так что, пришлось быстренько на коленке соорудить видос под эту музычку📺 🎬
Чтобы написать собственную лирику, просто добавьте текст на вкладку "Пользовательская лирика" в выпадающем списке подсказок. Чтобы разнообразить свои творения, попробуйте добавить в поле текста такие дескрипторы, как [Chorus], [Hook], [Verse], [Sax Solo] или [Drop]. Вы также можете указать бэк-вокал, используя круглые скобки. Больше полезных советов здесь
Трек по такому же промпту в Suno
Трек по такому же промпту в Stable Audio 2
Чье исполнение лучше?
🔥 UDIO
👍🏻 Suno
❤️ Stable Audio 2
Новая нейросеть UDIO вышла в открытую бету, это значит, что на этот период продукт бесплатен и пользователи могут генерировать до 1200 песен в месяц!
Можно создать песню как со своими словами, так и рандомными, еще можно перенять стиль артиста.
Я опять использовала такой же промпт, что и для Suno и Stable Audio. Нейросеть так же генерирует по 2 трека длительностью 30 секунд, но понравившийся трек можно продлевать.
Треки генерировались 4 минуты и сам сервис немного подвисает из-за наплыва пользователей, желающих протестировать новинку бесплатно.
Видео, кстати, тоже скачать не удалось, ну как видео- обложка сингла с играющей музыкой. Так что, пришлось быстренько на коленке соорудить видос под эту музычку
Чтобы написать собственную лирику, просто добавьте текст на вкладку "Пользовательская лирика" в выпадающем списке подсказок. Чтобы разнообразить свои творения, попробуйте добавить в поле текста такие дескрипторы, как [Chorus], [Hook], [Verse], [Sax Solo] или [Drop]. Вы также можете указать бэк-вокал, используя круглые скобки. Больше полезных советов здесь
Трек по такому же промпту в Suno
Трек по такому же промпту в Stable Audio 2
Чье исполнение лучше?
🔥 UDIO
👍🏻 Suno
❤️ Stable Audio 2
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍7❤3💊1
Media is too big
VIEW IN TELEGRAM
Рай для прокатчика! Нейросеть адаптирует видеоконтент под каждого - заменит мат, синхронно переведет на другие языки 🍿 🎬
Flawless AI предлагает инструменты для кинопроизводителей, студий и дистрибьюторов, которые с помощью ИИ улучшают процесс создания фильмов.
Их продукты, такие как TrueSync и DeepEditor, позволяют создавать фильмы с синхронизированным дубляжом на любом языке и редактировать диалоги и исполнение без необходимости пересъемок.
Иными словами можно вообще поменять диалог в фильме, или убрать мат и поменять язык, как в видео примере, или например, сделать фейк с Илоном Маском, который рассказывает, какой крутойⓂ️ Facebook )) Нужные движения губ подстроит нейросеть.
Flawless AI направлен на удешевление и упрощение производства фильмов, а также на обеспечение глобального распространения контента.
Нейросеть может быть полезна не только кинопроизводителям, но и телевизионным компаниям, создателям контента для социальных сетей, рекламным агентствам и видеоиграм. Flawless AI позволяет легко адаптировать контент для разных языковых и культурных аудиторий, улучшая глобальное взаимодействие и доступность.
Flawless AI предлагает инструменты для кинопроизводителей, студий и дистрибьюторов, которые с помощью ИИ улучшают процесс создания фильмов.
Их продукты, такие как TrueSync и DeepEditor, позволяют создавать фильмы с синхронизированным дубляжом на любом языке и редактировать диалоги и исполнение без необходимости пересъемок.
Иными словами можно вообще поменять диалог в фильме, или убрать мат и поменять язык, как в видео примере, или например, сделать фейк с Илоном Маском, который рассказывает, какой крутой
Flawless AI направлен на удешевление и упрощение производства фильмов, а также на обеспечение глобального распространения контента.
Нейросеть может быть полезна не только кинопроизводителям, но и телевизионным компаниям, создателям контента для социальных сетей, рекламным агентствам и видеоиграм. Flawless AI позволяет легко адаптировать контент для разных языковых и культурных аудиторий, улучшая глобальное взаимодействие и доступность.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍5😁2
Нейросеть для быстрых реалистичных дипфейков и ИИ-клонов
Argil - нейросеть для создания качественных дипфейков, которая способна скопировать стиль общения, язык тела и голос, плюс очень хорошо имитирует движение губ
Для создания дипфейков достаточно загрузить пару минут видео с аудио и добавить текст, чтобы получить дипфейк, как вверху - Цукерберг, Андриссен и Обама полностью сгенерированы, хоть в это и сложно поверить.
Вообще, изначально это сервис для создания своего AI клона, просто процедура такая же - загружаете видеоролик, где вы четко смотрите в камеру и говорите, на этом видео натренируют ии, чтоб вы могли уже без своего участия делать Shorts, Reels и другие видео с собой, просто написав текст. В случае с дипфейком нужно тогда загрузить короткое видео с персонажем в качестве референса. Озвучку так же можно сделать в сервисе
Короче, всем сервис хорош, кроме того, что нужно записаться в лист ожидания. Я уже записалась, там вообще коротенькая анкетка - имя, почта, зачем хотите потестить, где увидели - в основном, надо выбрать да/нет, у меня пол минуты, наверное, заняло
Argil - нейросеть для создания качественных дипфейков, которая способна скопировать стиль общения, язык тела и голос, плюс очень хорошо имитирует движение губ
Для создания дипфейков достаточно загрузить пару минут видео с аудио и добавить текст, чтобы получить дипфейк, как вверху - Цукерберг, Андриссен и Обама полностью сгенерированы, хоть в это и сложно поверить.
Вообще, изначально это сервис для создания своего AI клона, просто процедура такая же - загружаете видеоролик, где вы четко смотрите в камеру и говорите, на этом видео натренируют ии, чтоб вы могли уже без своего участия делать Shorts, Reels и другие видео с собой, просто написав текст. В случае с дипфейком нужно тогда загрузить короткое видео с персонажем в качестве референса. Озвучку так же можно сделать в сервисе
Короче, всем сервис хорош, кроме того, что нужно записаться в лист ожидания. Я уже записалась, там вообще коротенькая анкетка - имя, почта, зачем хотите потестить, где увидели - в основном, надо выбрать да/нет, у меня пол минуты, наверное, заняло
🔥18👍15👎1😡1