Acid Crunch — AI, GameDev, R&D, нейросети и GPT хаки
Video
This media is not supported in your browser
VIEW IN TELEGRAM
Иногда кадры из разных генераций можно удачно смэтчить для более интересного сюжета
Open Ai выпустила новый функционал Deep Research)
Deep Research — это совмещение думающей модели и поиска в интернете, что-то вроде агентской системы
— Deep Research может написать научную статью и включить все источники, картинки и создать графики
— Инструмент может думать 5-30 минут перед тем как дать ответ — он сам ищет нужные статьи и страницы во время написания отчета, сам понимает когда нужно поискать что-то новое если знаний не хватает
— Инструмент может писать статьи на очень узкие темы — например, в демке показали как Deep Research пишет отчет на сложную тему продуктовой разработки с исследованием рынка iOS/Android аппов используя больше 30+ сайтов
— Humanity Last Exam, новый бенчмарк для AI систем, она прошла уже на 26.6%
— Работает на базе файнтюн версии o3
— Пока это самая лучшая модель OpenAI в плане галлюцинаций — их меньше всего по сравнению с другими моделями
Доступен с Pro сегодня с лимитом в 100 использований в месяц, позже будет для Plus с лимитом в 10 запросов в месяц
Deep Research — это совмещение думающей модели и поиска в интернете, что-то вроде агентской системы
— Deep Research может написать научную статью и включить все источники, картинки и создать графики
— Инструмент может думать 5-30 минут перед тем как дать ответ — он сам ищет нужные статьи и страницы во время написания отчета, сам понимает когда нужно поискать что-то новое если знаний не хватает
— Инструмент может писать статьи на очень узкие темы — например, в демке показали как Deep Research пишет отчет на сложную тему продуктовой разработки с исследованием рынка iOS/Android аппов используя больше 30+ сайтов
— Humanity Last Exam, новый бенчмарк для AI систем, она прошла уже на 26.6%
— Работает на базе файнтюн версии o3
— Пока это самая лучшая модель OpenAI в плане галлюцинаций — их меньше всего по сравнению с другими моделями
Доступен с Pro сегодня с лимитом в 100 использований в месяц, позже будет для Plus с лимитом в 10 запросов в месяц
Deep Research помог в сложном выборе лечения рака груди его жены. После диагноза двустороннего рака молочной железы, двойной мастэктомии и курса химиотерапии возник вопрос о необходимости лучевой терапии, поскольку мнения специалистов расходились. Используя Deep Research для анализа патологоанатомического отчёта с учётом индивидуальных факторов, инструмент не только подтвердил рекомендации врачей, но и предоставил дополнительные исследования, что дало семье уверенность в принятом решении и продемонстрировало потенциал технологий, способных изменить мир в самые трудные моменты
Media is too big
VIEW IN TELEGRAM
Классный новый алгоритм на подходе:
Даем на вход картинку, аудио и модель сама оживляет персонажа
Кода пока нет, сайт проекта тут:
https://omnihuman-lab.github.io/
Даем на вход картинку, аудио и модель сама оживляет персонажа
Кода пока нет, сайт проекта тут:
https://omnihuman-lab.github.io/
👍2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Le Chat теперь в 30 раз быстрее ChatGPT
ИИ чипы от Cerebras позволяют чату работать на скорости в 1100 токенов в секунду, с новой фичей Flash Answers. Сейчас это просто интересная демка, но когда французы из Mistral сделают свою reasoning модель, это будет серьёзным преимуществом их чата. Зачем ждать пока какая-то o3-mini-high или R1 думает несколько минут, если она может справиться за секунды?
Но это не единственная новая фича - Le Chat теперь умеет исполнять код на Python и это доступно всем пользователям. Исполнение кода ограничено минутой, чего в принципе достаточно для большинства задач.
А ещё, у Le Chat теперь есть приложения на iOS и Android и Pro подписка за 15 долларов в месяц (со скидкой студентам). За подписку дают неограниченное количество сообщений, возможность отключить тренировку на своих данных и расширенное использование дополнительных фич - интерпретатора кода, поиска, генерации изображений и Flash Answers.
chat.mistral.ai
@ai_newz
ИИ чипы от Cerebras позволяют чату работать на скорости в 1100 токенов в секунду, с новой фичей Flash Answers. Сейчас это просто интересная демка, но когда французы из Mistral сделают свою reasoning модель, это будет серьёзным преимуществом их чата. Зачем ждать пока какая-то o3-mini-high или R1 думает несколько минут, если она может справиться за секунды?
Но это не единственная новая фича - Le Chat теперь умеет исполнять код на Python и это доступно всем пользователям. Исполнение кода ограничено минутой, чего в принципе достаточно для большинства задач.
А ещё, у Le Chat теперь есть приложения на iOS и Android и Pro подписка за 15 долларов в месяц (со скидкой студентам). За подписку дают неограниченное количество сообщений, возможность отключить тренировку на своих данных и расширенное использование дополнительных фич - интерпретатора кода, поиска, генерации изображений и Flash Answers.
chat.mistral.ai
@ai_newz
❤🔥1👏1
Forwarded from Адель и МЛь
Сэм Альтман рассказал о дальнейших планах OpenAI.
Планируют выпустить GPT-4.5 (подтвердили, что это Orion) в ближайшие недели — это будет последняя “нелинейно размышляющая” (non-chain-of-thought) модель.
Затем последует GPT-5, которая объединит модели o-series и GPT-series, станет универсальнее. Будет доступна как в приложении, так и через API.
GPT-5 заменит o3, а сама o3 не будет выпускаться отдельно. Бесплатные пользователи ChatGPT получат доступ к GPT-5 (на стандартном уровне интеллекта). Plus-подписчики получат улучшенную версию GPT-5. Pro-подписчики получат ещё более мощную версию, включающую голос, canvas, поиск, deep research и другие функции (какие?).
GPT-4.5 – через несколько недель!
GPT-5 – через несколько месяцев!
Планируют выпустить GPT-4.5 (подтвердили, что это Orion) в ближайшие недели — это будет последняя “нелинейно размышляющая” (non-chain-of-thought) модель.
Затем последует GPT-5, которая объединит модели o-series и GPT-series, станет универсальнее. Будет доступна как в приложении, так и через API.
GPT-5 заменит o3, а сама o3 не будет выпускаться отдельно. Бесплатные пользователи ChatGPT получат доступ к GPT-5 (на стандартном уровне интеллекта). Plus-подписчики получат улучшенную версию GPT-5. Pro-подписчики получат ещё более мощную версию, включающую голос, canvas, поиск, deep research и другие функции (какие?).
GPT-4.5 – через несколько недель!
GPT-5 – через несколько месяцев!
ChatGPT немного обновили:
- o1 и o3-mini теперь поддерживают картинки на входе и файлы
- o3-mini high теперь можно использовать 50 раз в день если у вас Plus подписка за 20$
- Deep research добавили во все аппы, готовят к релизу видимо
- o1 и o3-mini теперь поддерживают картинки на входе и файлы
- o3-mini high теперь можно использовать 50 раз в день если у вас Plus подписка за 20$
- Deep research добавили во все аппы, готовят к релизу видимо
Простой гайд какие модели когда использовать в ChatGPT:
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
❤1
Попросил Deep Research провести анализ лучших нейро генераторов видео (цена/качество/функционал), и вот, что получилось:
Hailuo (MiniMax):
Супер детализация и кинематографичный вид, но клипы ограничены 6 секундами, а генерация идёт медленно.
Kling AI:
Золотая середина — четкое 1080p, плавная анимация и щедрые бесплатные кредиты. Идеально для тех, кто хочет качественное видео без лишних затрат.
Runway (Gen-2 / Gen-3):
Супер реалистичный "киношный" визуал и мощные инструменты для монтажа. Немного ограничен по разрешению и длительности, но для профессионалов — отличный выбор.
OpenAI Sora:
Прорыв с качеством 1080p и креативными возможностями, хотя пока дорогой и иногда не справляется со сложными сценами.
Вывод:
Если нужно оптимальное соотношение цена/качество, то Kling AI – лучший вариант. А если важны расширенные возможности редактирования и VFX, то Runway заслуживает внимания.
Для подробностей заглядывайте в полный PDF-отчет!
Hailuo (MiniMax):
Супер детализация и кинематографичный вид, но клипы ограничены 6 секундами, а генерация идёт медленно.
Kling AI:
Золотая середина — четкое 1080p, плавная анимация и щедрые бесплатные кредиты. Идеально для тех, кто хочет качественное видео без лишних затрат.
Runway (Gen-2 / Gen-3):
Супер реалистичный "киношный" визуал и мощные инструменты для монтажа. Немного ограничен по разрешению и длительности, но для профессионалов — отличный выбор.
OpenAI Sora:
Прорыв с качеством 1080p и креативными возможностями, хотя пока дорогой и иногда не справляется со сложными сценами.
Вывод:
Если нужно оптимальное соотношение цена/качество, то Kling AI – лучший вариант. А если важны расширенные возможности редактирования и VFX, то Runway заслуживает внимания.
Для подробностей заглядывайте в полный PDF-отчет!
Ещё парочку неплохих подкастов на базе Deep Research от @denissexy
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, народ! Сегодня расскажу про технологию Light-A-Video — способ изменять освещение в видеороликах без долгого обучения нейросетей. Эта методика решает проблему применения стандартных моделей на каждом кадре, когда результат получается несогласованным и дерганым.
Основная фишка в двух модулях:
• Consistent Light Attention (CLA) – обеспечивает взаимосвязь между кадрами, поддерживая стабильность освещения.
• Progressive Light Fusion (PLF) – отвечает за плавное смешение оригинального изображения с изменённым вариантом, что помогает добиться естественных переходов.
В итоге получается видео с согласованным освещением по всему ролика, где каждый кадр плавно переходит в следующий. Если вам интересно, как можно улучшить качество видео-релайтинга без лишней подготовки, Light-A-Video — достойный вариант для экспериментов.
Уже можно затестить
Основная фишка в двух модулях:
• Consistent Light Attention (CLA) – обеспечивает взаимосвязь между кадрами, поддерживая стабильность освещения.
• Progressive Light Fusion (PLF) – отвечает за плавное смешение оригинального изображения с изменённым вариантом, что помогает добиться естественных переходов.
В итоге получается видео с согласованным освещением по всему ролика, где каждый кадр плавно переходит в следующий. Если вам интересно, как можно улучшить качество видео-релайтинга без лишней подготовки, Light-A-Video — достойный вариант для экспериментов.
Уже можно затестить
Magic 1-For-1 — модель, способная генерировать видеоклипы длительностью до одной минуты за одну минуту. Концепция основана на разделении задачи текст-видео на два этапа: сначала создаётся изображение по входному тексту, затем из этого изображения генерируется видео с плавной анимацией.
Ключевые особенности:
• Step Distillation. Алгоритм поэтапной дистилляции сокращает количество шагов генерации без потери качества.
• Оптимизация вычислений. Применяются методы снижения потребления памяти и ускорения инференса, включая CFG distillation.
• Скользящее окно. Позволяет формировать видео длительностью до 60 секунд, сохраняя высокое визуальное качество и плавность движения.
Источник: [Magic 1-For-1] + ссылка на установку
Ключевые особенности:
• Step Distillation. Алгоритм поэтапной дистилляции сокращает количество шагов генерации без потери качества.
• Оптимизация вычислений. Применяются методы снижения потребления памяти и ускорения инференса, включая CFG distillation.
• Скользящее окно. Позволяет формировать видео длительностью до 60 секунд, сохраняя высокое визуальное качество и плавность движения.
Источник: [Magic 1-For-1] + ссылка на установку