Acid Crunch — AI, GameDev, R&D, нейросети и GPT хаки – Telegram
Acid Crunch — AI, GameDev, R&D, нейросети и GPT хаки
5.36K subscribers
922 photos
664 videos
8 files
683 links
⚡️ AI в GameDev и Media — через нейросети и личный R&D

🎯 Новости, эксперименты, prompts, tutorials и хаки, которые реально работают

#acidcrunch

Чат: https://news.1rj.ru/str/+A--pIccfkaQyZWIy
Download Telegram
Супер крутая болталка на английском языке с ИИ ссылка

Голос живой естественный с придыханиями итд всем советую оч круто.
This media is not supported in your browser
VIEW IN TELEGRAM
Octave от Hume Ai

Octave — революционная программа, которая обещает изменить наше представление о технологиях преобразования текста в речь. В отличие от существующих систем, Octave не просто озвучивает текст, а придаёт ему глубину и эмоциональность, учитывая смысл и контекст.

Ключевые особенности Octave:


🎨 Создание уникальных голосов: С помощью текстовых подсказок пользователи могут мгновенно генерировать любые голоса ИИ, открывая безграничные возможности для творчества.

🎬 Тонкая настройка эмоций и интонаций: Octave позволяет задавать актёрские инструкции, контролируя эмоции и подачу — от сарказма до шёпота, делая речь максимально живой и естественной.

🛠 Создание длинных форматов контента: Благодаря интегрированной Creator Studio, пользователи могут разрабатывать и редактировать продолжительные аудиоматериалы, полностью контролируя процесс создания контента.

Эти инновации делают Octave мощным инструментом для создателей контента, разработчиков и всех, кто заинтересован в высококачественной синтезированной речи.

👉 Потестить тут
2
🎉 Нас уже 80! Растём потихоньку 🚀

Кстати, очень интересно, как вы здесь оказались? По моим данным, канал пока не находится через поиск в телеге. Может, кто-то репостнул, рассказал друг, или есть другой секретный путь? 🤔

Напишите в комментариях — мне правда любопытно узнать вашу историю! 👇
👍2
Китайцы релизнули новую модель Kimi k1.5 и она open source и на уровне GPT o1

Пробуем новинку — здесь.
Новый Gemini Flash 2.0 теперь умеет редактировать картинки текстом – видимо OpenAI правда эту же фичу скоро докатит

Я поигрался и такие выводы: пока она галлюцинирует и качество картинок на выходе не очень, но это временно и верное направление исследований – не очень понимаю что будет делать Adobe с фотошопом через пару лет 😮

Поиграться можно тут выбрав Gemini 2.0 Flash experimental (это бесплатно)

Оно умеет:
– реставрировать фото (немного)
– колоризировать (пока плохо)
– копировать текстуры на объекты
– оно пока не умеет переводить картинки, и часто само не знает с чем оно работает – с текстом или картинкой, часто путается
– увеличивать картинки оно пока не может нормально
– оно умеет продолжать последовательность картинок и даже сохранять внешность персонажа
– Оно умеет неплохо редактировать общий муд сцены

В общем, очень клевое направление – Google AI молодцы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
У кого есть ChatGPT Pro:
operator.chatgpt.com – заработал в ЕС
GigaChat 2 MAX — мощная нейронка с улучшенным контекстом

Сбер представил GigaChat 2 MAX, и по результатам бенчмарка MERA модель демонстрирует высокие показатели, обгоняя DeepSeek-V3, LLaMA 70B, Qwen 2.5 и GPT-4o.

Команда улучшила понимание контекста в четыре раза, особенно для сложных и длинных вопросов, сравнивая с зарубежными аналогами. Есть три версии — MAX, Pro и Lite, которые легко интегрируются с бизнесом через бесплатный API.
Open-Sora 2.0 — доступная генерация видео на уровне лидеров

Исследователь Янг Ю (Yang You) представил Open-Sora 2.0 — открытую модель генерации видео, достигающую результатов, сопоставимых с коммерческими решениями, но обученную всего за $200K против $2,5M у конкурентов.

С 11 млрд параметров она конкурирует с HunyuanVideo и 30B Step-Video по метрикам VBench и предпочтениям людей. Код открыт, вывод ускорен в 10 раз благодаря автокодировщику, снижая барьеры для разработчиков.
AirPods получат функцию синхронного перевода речи!

Её дропнут в сентябре вместе с обновлением iOS 19. Наушники смогут переводить речь с разных языков в режиме реального времени.