Нейросеть для озвучки видео
SonicVisionLM - нейросеть, которая анализирует происходящее на видео, а под действия генерирует звуковые эффекты.
Модель превосходит современные методы преобразования видео в аудио, что приводит к улучшенной синхронизации с визуальными эффектами и улучшенному согласованию между аудио- и видеокомпонентами.
Проект скоро будет выложен на GitHub, а значит использовать технологию можно будет бесплатно, локально и в своих целях
На сайте разработчики представили примеры видео с оригинальной озвучкой и видео, озвученные с помощью SonicVisionLM. Выглядит впечатляюще, особенно мне понравился пример из фильма “Леон”. А вы с ходу сможете определить, какое видео с оригинальной звуковой дорожкой, а где работа нейросети? Если первое ставьте👍🏻 , если второе 🔥
SonicVisionLM - нейросеть, которая анализирует происходящее на видео, а под действия генерирует звуковые эффекты.
Модель превосходит современные методы преобразования видео в аудио, что приводит к улучшенной синхронизации с визуальными эффектами и улучшенному согласованию между аудио- и видеокомпонентами.
Проект скоро будет выложен на GitHub, а значит использовать технологию можно будет бесплатно, локально и в своих целях
На сайте разработчики представили примеры видео с оригинальной озвучкой и видео, озвученные с помощью SonicVisionLM. Выглядит впечатляюще, особенно мне понравился пример из фильма “Леон”. А вы с ходу сможете определить, какое видео с оригинальной звуковой дорожкой, а где работа нейросети? Если первое ставьте
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥11🤮2😁1
Большая подборка нейросетей для синтеза речи
Free Text To Speech Online - Использует библиотеку Microsoft AI Speech для синтеза речи. Простые настройки темпа и тона, предусмотрено скачивание аудио в mp3.
PlayHT - Генерирует человеческие голоса, неотличимые от настоящих. Имеет редактор для создания уникальных голосов персонажей. Предоставляет огромный выбор голосов – более 800, поддерживает 130+ языков.
Подробно про этот сервис и заодно про то, как я "украла" голос Илона Маска
RHVoice - Голосовой синтезатор с качественными русскими голосами, поддерживает 13 других языков.
Mimic - Быстрый и легкий голосовой синтезатор, созданный на основе CMU Flite.а.
Murf - Предоставляет более 120 реалистичных мужских и женских голосов, которые можно настраивать и кастомизировать. Поддерживает 20+ языков.
Speechify - Озвучивает любой текстовый контент, быстро переводит видео.
Mozilla TTS - Включает большой набор обученных моделей. Поддерживает 20+ языков, генерирует нейтральную по эмоциональной окраске реалистичную речь.
Deepgram - Сервис использует 4 модели для синтеза реалистичной речи – Nova-2, Enhanced, Base, Whisper Large.
Tortoise TTS - Синтезирует речь с использованием множества реалистичных голосов, учитывает указания на эмоции в тексте, клонирует голос.
Wondercraft AI - Располагает библиотекой реалистичных голосов для озвучивания текста, есть опция клонирования голоса. Предусмотрено автоматическое создание транскрипта и заметок.
Coqui - Предоставляет 5 реалистичных голосов, поддерживает 7 языков.
Fluxon - 5 голосов на выбор, возможность клонировать любой голос по образцу, перевод аудио на другой язык.
VoiceMy - Озвучивает текст, клонирует голос, обучает голосовые модели.
Recast AI - Превращает лонгриды в сжатые интересные подкасты.
Free Text To Speech Online - Использует библиотеку Microsoft AI Speech для синтеза речи. Простые настройки темпа и тона, предусмотрено скачивание аудио в mp3.
PlayHT - Генерирует человеческие голоса, неотличимые от настоящих. Имеет редактор для создания уникальных голосов персонажей. Предоставляет огромный выбор голосов – более 800, поддерживает 130+ языков.
Подробно про этот сервис и заодно про то, как я "украла" голос Илона Маска
RHVoice - Голосовой синтезатор с качественными русскими голосами, поддерживает 13 других языков.
Mimic - Быстрый и легкий голосовой синтезатор, созданный на основе CMU Flite.а.
Murf - Предоставляет более 120 реалистичных мужских и женских голосов, которые можно настраивать и кастомизировать. Поддерживает 20+ языков.
Speechify - Озвучивает любой текстовый контент, быстро переводит видео.
Mozilla TTS - Включает большой набор обученных моделей. Поддерживает 20+ языков, генерирует нейтральную по эмоциональной окраске реалистичную речь.
Deepgram - Сервис использует 4 модели для синтеза реалистичной речи – Nova-2, Enhanced, Base, Whisper Large.
Tortoise TTS - Синтезирует речь с использованием множества реалистичных голосов, учитывает указания на эмоции в тексте, клонирует голос.
Wondercraft AI - Располагает библиотекой реалистичных голосов для озвучивания текста, есть опция клонирования голоса. Предусмотрено автоматическое создание транскрипта и заметок.
Coqui - Предоставляет 5 реалистичных голосов, поддерживает 7 языков.
Fluxon - 5 голосов на выбор, возможность клонировать любой голос по образцу, перевод аудио на другой язык.
VoiceMy - Озвучивает текст, клонирует голос, обучает голосовые модели.
Recast AI - Превращает лонгриды в сжатые интересные подкасты.
🔥15👍6🎉3❤2👻1
Нейросеть очеловечит текст ChatGPT до 99%? Разбираемся
Сколько хайпа вокруг нейросети HIX Bypass, которая перефразирует сгенерированный нейросетью текст так, чтобы система антиплагиата не обнаружила признаков ИИ до 99%
А какие громкие заголовки - “Обходите обнаружение искусственного интеллекта”, “очеловечит текст ии” - я представляю, как обрадовались те, кто на Дзене☺️ пишет. Но радость их будет не полной, при том, что сервис платный, а для теста можно вставить кусок текста со 125 словами.
В чем же подвох❓
1️⃣ Разработчики утверждают, что сервис преобразует написанный ИИ контент в человекоподобный текст, гарантируя, что он пройдет через различные детекторы ИИ, такие как GPTZero, Turnitin и другие, не будучи отмеченным как созданный ИИ. По факту, если вам нужен русский текст, то русские AI - детектеры он не пройдет.
2️⃣ Сервис заявлен как подходящий для различных целей, включая бизнес, академические и SEO-цели, и поддерживает несколько языков. Ну да, русский он поддерживает, однако, даже если в настройках выставить локацию Россия, выдаст он белиберду.
На второй картинке слева текст даже почеловечней, хотя он от ChatGPT, а справа - просто жесть. Так что не ведитесь. Даже старый-добрый промпт для ChatGPT работает лучше👍 А цены у них от 15$ за 5000 слов.
Видимо сервис все же для английских текстов, с русскими работать бесполезно.
Сколько хайпа вокруг нейросети HIX Bypass, которая перефразирует сгенерированный нейросетью текст так, чтобы система антиплагиата не обнаружила признаков ИИ до 99%
А какие громкие заголовки - “Обходите обнаружение искусственного интеллекта”, “очеловечит текст ии” - я представляю, как обрадовались те, кто на Дзене
В чем же подвох
На второй картинке слева текст даже почеловечней, хотя он от ChatGPT, а справа - просто жесть. Так что не ведитесь. Даже старый-добрый промпт для ChatGPT работает лучше
Видимо сервис все же для английских текстов, с русскими работать бесполезно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15👍9🔥5👎1
Нейросеть для 3D-моделей из одной картинки
TripoSR очень быстро создает 3D модель, стоит только загрузить картинку. Можно использовать с телефона.
Что доступно на сайте бесплатно:
✔️ Бесплатно до 10 3D-моделей в месяц
✔️ Преобразование текста в 3D и изображения в 3D
✔️ Доступ и загрузка созданных моделей
✔️ Неограниченная генерация эскизов
Что крутого❓
🟢 Скорость
🟢 Возможность пользоваться бесплатно даже на телефоне
🟢 Хорошее качество
🟢 Можно загрузить результат и доделать по своему усмотрению
Как использовать вообще бесплатно❓
Попробовать можно на HuggingFace
Код на GitHub
Так что можно бесплатно генерировать объекты для игр или фильмов и CGI в один клик.
TripoSR очень быстро создает 3D модель, стоит только загрузить картинку. Можно использовать с телефона.
Что доступно на сайте бесплатно:
Что крутого
Как использовать вообще бесплатно
Попробовать можно на HuggingFace
Код на GitHub
Так что можно бесплатно генерировать объекты для игр или фильмов и CGI в один клик.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤7👍4
Друзья, всем привет 👋
Давненько я не радовала вас годными обзорами, знаю, многие соскучились! Сейчас как раз тестирую крутой сервис для торговли, дропшипинга и дизайна карточек товаров. Инструмент с более широкими возможностями, чем я обозревала до этого.
Опытные дизайнеры и бизнесмены смогут увеличить производительность, малый бизнес сможет успешно делать карточки и фото товаров, легко повторять дизайн конкурентов, и так же избавляться от рутины. Тем, кто связан с продажей одежды и дропшипингом там отдельная крутая функция🔥
Если вам интересно - ставьте реакции, и я запишу подробное видеоруководство на инструмент😉
Давненько я не радовала вас годными обзорами, знаю, многие соскучились! Сейчас как раз тестирую крутой сервис для торговли, дропшипинга и дизайна карточек товаров. Инструмент с более широкими возможностями, чем я обозревала до этого.
Опытные дизайнеры и бизнесмены смогут увеличить производительность, малый бизнес сможет успешно делать карточки и фото товаров, легко повторять дизайн конкурентов, и так же избавляться от рутины. Тем, кто связан с продажей одежды и дропшипингом там отдельная крутая функция
Если вам интересно - ставьте реакции, и я запишу подробное видеоруководство на инструмент
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥77👍9❤🔥8❤2👀1
Media is too big
VIEW IN TELEGRAM
PhotoJam - мощная нейросеть для торговли и дропшипинга
Ну что ж, реакции собраны, поэтому встречайте мой подробный видео обзор на PhotoJam.ai, я постаралась охватить функционал сервиса. А уж охватить было что 🙆🏻♀️, так как это не просто сервис для реалистичных фотографий товара. Это крутой помощник для тех, кто занимается продажами и дропшипингом. Особенно порадуются те, кто занимается одеждой - больше не придется тратиться на модель и съемку одежды.
Можно взять готовое фото в одежде, отправить в сервис свое или чужое фото/ изображение, и PhotoJam.ai сгенерирует модель в одежде с вашим/чужим лицом. Я взяла фото с Али Экспресс, загрузила в сервис и получила новое уникальное фото в этой же одежде, и никакого плагиата🔥
Что крутого❓
🟢 Можно добавить желаемое изображение или даже карточку товара с маркетплейса в качестве референса, и сервис сделает изображение с вашим продуктом в похожем стиле. 💡Совет: если на изображении с маркетплейса есть текст, его лучше удалить перед тем, как использовать в качестве референса. Так вы получите чистый результат. Этот инстайт, в том числе, я получила от от службы поддержки в чате.
🟢 Чат Поддержки. Можно обратиться с вопросом, прикрепить изображения. У меня сначала не получалось скопировать дизайн с карточки, и я не понимала, что делаю не так. Я написала в чат слева и приложила скрины. Ребята оперативно помогли, причем расписали по пунктам действия, и за меня сделали шаблон дизайна, где я уже увидела все настройки наглядно. Плюсую 👍🏻
Что еще крутого❓
🟢 реалистичные фото
🟢 можно загрузить свою модель, свой фон, свои объекты или сгенерировать там же
🟢 можно влиять на степень интенсивности отдельного элемента в текстовой подсказке, если взять его в скобки () или в двойные скобки (())
🟢 можно загрузить референс и повторить понравившийся дизайн
PhotoJam.ai отлично подойдет всем, кто занимается дизайном, товарным бизнесом, онлайн-торговлей, маркетплейсами, дропшипингом. Профессионалам поможет увеличить эффективность, малому бизнесу поможет увеличить продажи.
Ну что ж, реакции собраны, поэтому встречайте мой подробный видео обзор на PhotoJam.ai, я постаралась охватить функционал сервиса. А уж охватить было что 🙆🏻♀️, так как это не просто сервис для реалистичных фотографий товара. Это крутой помощник для тех, кто занимается продажами и дропшипингом. Особенно порадуются те, кто занимается одеждой - больше не придется тратиться на модель и съемку одежды.
Можно взять готовое фото в одежде, отправить в сервис свое или чужое фото/ изображение, и PhotoJam.ai сгенерирует модель в одежде с вашим/чужим лицом. Я взяла фото с Али Экспресс, загрузила в сервис и получила новое уникальное фото в этой же одежде, и никакого плагиата
Что крутого
Что еще крутого
PhotoJam.ai отлично подойдет всем, кто занимается дизайном, товарным бизнесом, онлайн-торговлей, маркетплейсами, дропшипингом. Профессионалам поможет увеличить эффективность, малому бизнесу поможет увеличить продажи.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42❤10👏6👍4⚡3🙏1
Лучшие бесплатные нейросети для улучшения качества (апскейл) изображений и фото 📸
Нашла две крутые нейросети для улучшения фотографий и изображений, в отличие от большинства своих аналогов, эти бесплатные, но от этого не менее эффективные.
🟢 Upscayl - бесплатная нейросеть для улучшения качества в 16 раз и размера фото и изображений в 4 раза.
Работает локально на компьютере, без подключения к интернету и мощной видеокарты. Есть возможность апскейлить фотографии целыми папками.
Что крутого❓
🟢 Есть версии для Mac OS, linux и Windows
🟢 Работает с форматами jpg, webp, png
🟢 5 моделей на выбор
🟢 Умеет увеличивать качество до 16 раз
🟢 Можно заапскейлить сразу целую папку с изображениями
В зависимости от выбранной модели варьируется время обработки и итоговое качество.
🟢 Clarity-upscaler - качественно новый уровень апскейла (улучшения качества фото/изображений). Сделает хорошее качество из мутной фото и даже дорисует логические элементы.
На выходе получаете прекрасную картинку, при этом можно использовать текстовые подсказки, чтобы получить то, что вам нужно.
Попробовать на Replicate
Установить с GitHub
Нашла две крутые нейросети для улучшения фотографий и изображений, в отличие от большинства своих аналогов, эти бесплатные, но от этого не менее эффективные.
Работает локально на компьютере, без подключения к интернету и мощной видеокарты. Есть возможность апскейлить фотографии целыми папками.
Что крутого
В зависимости от выбранной модели варьируется время обработки и итоговое качество.
На выходе получаете прекрасную картинку, при этом можно использовать текстовые подсказки, чтобы получить то, что вам нужно.
Попробовать на Replicate
Установить с GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥10❤5🆒2
Подборка нейросетей для генерации логотипов
Free Logo Design - генератор логотипов, рассказывала, как создавать логотип с этой нейросетью в этом посте
LOGO - для логотипов и брендбордов. Полный обзор нейросети для создания логотипов и брендбордов я выкладывала в этом посте
Ideogram – по промпту создаст логотип, и нарисует достойные картинки с надписями бесплатно.
Looka – поможет сделать референсы к дизайнам логотипов под не коммерческий проект. Про этот сервис можно прочитать здесь.
Logo Diffusion – нарисует векторный логотип из текста, скетча, изображения или другого лого.
Namelix – генерируют логотипы, брендборд, названия для продукта или проекта на основе ключевых слов, а после сгенерирует готовые варианты логотипов. , брендборд, названия. Подробное руководство в этом посте
#логотип #дизайн #нейминг
Free Logo Design - генератор логотипов, рассказывала, как создавать логотип с этой нейросетью в этом посте
LOGO - для логотипов и брендбордов. Полный обзор нейросети для создания логотипов и брендбордов я выкладывала в этом посте
Ideogram – по промпту создаст логотип, и нарисует достойные картинки с надписями бесплатно.
Looka – поможет сделать референсы к дизайнам логотипов под не коммерческий проект. Про этот сервис можно прочитать здесь.
Logo Diffusion – нарисует векторный логотип из текста, скетча, изображения или другого лого.
Namelix – генерируют логотипы, брендборд, названия для продукта или проекта на основе ключевых слов, а после сгенерирует готовые варианты логотипов. , брендборд, названия. Подробное руководство в этом посте
#логотип #дизайн #нейминг
🔥14👍6✍3❤🔥2🙏2❤1🆒1
Polycam — приложение для 3D-сканирования
С приложением Polycam можно легко отсканировать квартиру или любой другой предмет с помощью мобильного устройства.
В приложении два режима: LiDAR и фото. LiDAR доступен для устройств, которые имеют эту функцию.
Даже с помощью обычной камеры приложение справляется очень круто и собирает 3D-модели. Есть на Android и iPhone.
Возможность редактирования:
Недавно нейросеть мощно обновилась и в программе появилась возможность редактировать. Например, вы можете загрузить фотки любого предмета с нескольких сторон, получить модель и тут же допилить ее - вращать, обрезать, масштабировать, менять фон.
С приложением Polycam можно легко отсканировать квартиру или любой другой предмет с помощью мобильного устройства.
В приложении два режима: LiDAR и фото. LiDAR доступен для устройств, которые имеют эту функцию.
Даже с помощью обычной камеры приложение справляется очень круто и собирает 3D-модели. Есть на Android и iPhone.
Возможность редактирования:
Недавно нейросеть мощно обновилась и в программе появилась возможность редактировать. Например, вы можете загрузить фотки любого предмета с нескольких сторон, получить модель и тут же допилить ее - вращать, обрезать, масштабировать, менять фон.
🔥11❤8👍4✍1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый уровень говорящих портретов - создание видео из фото с эмоциями и звуком
Ну что ж, мы скоро станем еще на шаг ближе к созданию фильмов без актеров 📽
Alibaba показали сервис Emote Portrait Alive для анимации говорящих портретов. Технология так же основана на модели диффузии Audio2Video, но, в отличие от других нейросетей в том, что она не просто оживляет изображения, а наделяет их эмоциями, делает переходы между кадрами более плавными, а сам “анимируемый” остается похожим на себя. То есть тут не будет как в D-ID компьютерного рта, который убивает “личность” персонажа. А сам ролик выглядит гораздо реалистичнее
Достаточно загрузить одно фото и к нему аудиофайл, и нейросеть реалистично подстроит движение губ и эмоции персонажа.
Код выложат позже на github , так же пробная версия будет на huggingface
Ну что ж, мы скоро станем еще на шаг ближе к созданию фильмов без актеров 📽
Alibaba показали сервис Emote Portrait Alive для анимации говорящих портретов. Технология так же основана на модели диффузии Audio2Video, но, в отличие от других нейросетей в том, что она не просто оживляет изображения, а наделяет их эмоциями, делает переходы между кадрами более плавными, а сам “анимируемый” остается похожим на себя. То есть тут не будет как в D-ID компьютерного рта, который убивает “личность” персонажа. А сам ролик выглядит гораздо реалистичнее
Достаточно загрузить одно фото и к нему аудиофайл, и нейросеть реалистично подстроит движение губ и эмоции персонажа.
Код выложат позже на github , так же пробная версия будет на huggingface
🔥21👍6❤4🤮1
Google открыла доступ к Gemini 1.5 Pro бесплатно для всех
Google бесплатно открыли доступ к Gemini 1.5 Pro в интерфейсе AI Studio
Что крутого❓
Пока что у Gemini 1.5 Pro самое большое контекстное окно - 1 миллион токенов - это около 700 000 слов. Для сравнения, у GPT-4 Turbo размер контекста всего 128 000 токенов. В скринах я привела пример произведений, в которых около 200к слов. Можно загрузить сразу несколько произведений, или научных трудов, или учебников и спросить, что общего между ними, выявить закономерности. А можно загрузить инструкции, истории разговоров и тд и проанализировать большой объем данных.
Можно загрузить изображения, видео, файлы и целую папку с файлами.
На вопрос “в каком произведении 200 000 слов?” и Gemini 1.5 Pro и ChatGPT-4 дали приблизительные ответы. На вопрос “1 млн токенов это сколько тысяч русских слов?” Gemini 1.5 Pro ответил правильно 750к слов, ChatGPT ответил 200-250к. В большинстве источников пишут про 700-750к слов, так что тут ChatGPT-4 был дальше от истины.
Что не понравилось❓
🟢 Пока нет выхода в инет
🟢 Как и в случае с ChatGPT, не доступен в России
🟢 Пока немного тупит и повторяет как мантру на все “Как большая языковая модель, я разрабатываюсь в Google”
А вообще Gemini уже успел поучаствовать в скандалах - Google оштрафовали на 250 миллионов евро за обучение Gemini на чужих данных, конкретно новостных изданий, «без уведомления правообладателей или властей».
Интересная модель, открывает большие возможности - можно загрузить часовое видео или 11 часов аудио лекций и попросить выписать основные тезисы с примерами, и так далее, но вот с выходом в интернет … с одной стороны, хорошо, что информация будет “стерильная” выдаваться, но с другой стороны и нет 🤷🏻♀️ Попробовать однозначно стоит, только перед этим “телепортируйтесь зарубеж”, ну вы поняли)
Google бесплатно открыли доступ к Gemini 1.5 Pro в интерфейсе AI Studio
Что крутого
Пока что у Gemini 1.5 Pro самое большое контекстное окно - 1 миллион токенов - это около 700 000 слов. Для сравнения, у GPT-4 Turbo размер контекста всего 128 000 токенов. В скринах я привела пример произведений, в которых около 200к слов. Можно загрузить сразу несколько произведений, или научных трудов, или учебников и спросить, что общего между ними, выявить закономерности. А можно загрузить инструкции, истории разговоров и тд и проанализировать большой объем данных.
Можно загрузить изображения, видео, файлы и целую папку с файлами.
На вопрос “в каком произведении 200 000 слов?” и Gemini 1.5 Pro и ChatGPT-4 дали приблизительные ответы. На вопрос “1 млн токенов это сколько тысяч русских слов?” Gemini 1.5 Pro ответил правильно 750к слов, ChatGPT ответил 200-250к. В большинстве источников пишут про 700-750к слов, так что тут ChatGPT-4 был дальше от истины.
Что не понравилось
А вообще Gemini уже успел поучаствовать в скандалах - Google оштрафовали на 250 миллионов евро за обучение Gemini на чужих данных, конкретно новостных изданий, «без уведомления правообладателей или властей».
Интересная модель, открывает большие возможности - можно загрузить часовое видео или 11 часов аудио лекций и попросить выписать основные тезисы с примерами, и так далее, но вот с выходом в интернет … с одной стороны, хорошо, что информация будет “стерильная” выдаваться, но с другой стороны и нет 🤷🏻♀️ Попробовать однозначно стоит, только перед этим “телепортируйтесь зарубеж”, ну вы поняли)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥8👎4❤3