Смотрите, что нашла у AIRI 🧩
День святого Валентина — это же не просто повод обменяться сердечками и шоколадками.
Это также отличный момент, чтобы выразить свои чувства для тех, кто влюблён в науку и учёных❤️ Они ведь каждый день совершают открытия и двигают человечество вперёд!
Всё с учётом темы и очень милое🥰 Вы знаете, кому это отправить ❤️ Разбирайте!
День святого Валентина — это же не просто повод обменяться сердечками и шоколадками.
Это также отличный момент, чтобы выразить свои чувства для тех, кто влюблён в науку и учёных
Всё с учётом темы и очень милое
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5👏3😁1
Grok 3 vs все остальные 🔜
Маск объявил, что Grok 3 почти готов к запуску и уже через неделю-две выйдет в свет👍
В заявлении Илона на Всемирном правительственном саммите в Дубае было сказано:
⏳ Grok 3 находится на завершающей стадии
🏋️ новая версия круто справляется с задачами и показывает результаты лучше всех существующих аналогов
🤑 намерение OpenAI полностью перейти на коммерческие рельсы — явный перебор
Маск не был бы Маском, если бы в очередной раз не прошёлся по конкурентам. Но раз уж Grok 3 рвётся в бой, остаётся только ждать развязки😉
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Маск объявил, что Grok 3 почти готов к запуску и уже через неделю-две выйдет в свет
В заявлении Илона на Всемирном правительственном саммите в Дубае было сказано:
Маск не был бы Маском, если бы в очередной раз не прошёлся по конкурентам. Но раз уж Grok 3 рвётся в бой, остаётся только ждать развязки
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5💯3🔥2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Goku ставит рекорды ⚡
На пике популярности видео ByteDance выдали серию моделей Goku, использующих продвинутые трансформеры для одновременной генерации картинок и видео. Причём на уровне индустрии📤
Детально проработали каждую мелочь:
😵💫 сбор данных: система фильтрует видео и фото по качеству, анализирует содержание с помощью OCR и проводит субъективные оценки
🧑💻 дизайн: модели Goku доступны в версиях 2B и 8B
💪 rectified flow (RF) сжимает входные данные в единое пространство, это помогает лучше обучаться и генерить
🤘 для масштабирования — настройка инфраструктуры с параллельными вычислениями и защитой от сбоев
Результаты Goku: по картинкам — 0.76 на GenEval и 83.65 на DPG-Bench, по видео — 84.85 на VBench👍
На пике популярности видео ByteDance выдали серию моделей Goku, использующих продвинутые трансформеры для одновременной генерации картинок и видео. Причём на уровне индустрии
Детально проработали каждую мелочь:
Результаты Goku: по картинкам — 0.76 на GenEval и 83.65 на DPG-Bench, по видео — 84.85 на VBench
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
AI-звукооператор: Elgato улучшает качество голоса в новом Wave Link 2.0 🎤
Разработчики ПО для видеоконтента апгрейдили свой популярный инструмент.
Голосом теперь там рулит AI:
🎙 фичу Voice Focus придумали вместе с AIcoustics
⏳ звук микрофона очищается от посторонних шумов для идеальной записи
🏠 анализируются характеристики помещения, чтобы внести необходимые корректировки для устранения эха и других эффектов
Качаем тут.
Разработчики ПО для видеоконтента апгрейдили свой популярный инструмент.
Голосом теперь там рулит AI:
Качаем тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Pikadditions: реально нереально 🤌
Не пропустите новое решение от Pika Labs — возможность вставить в ролик любой объект или персонажа🗿
Что есть:
📸 бесшовная интеграция: добавляем что угодно и кого угодно с учётом реальных условий съёмки
🚀 различные варианты для идеального результата: можно адаптировать элементы под ракурсы камеры и движения
🎈 реалистичная анимация: тени и динамика
Процесс работы: загрузка оригинала видео, выбор объекта, промпт😎
Доступна на Pika 1.5, 2.0, 2.1 и Turbo. 150 кредитов в месяц на 15 роликов👍
Не пропустите новое решение от Pika Labs — возможность вставить в ролик любой объект или персонажа
Что есть:
Процесс работы: загрузка оригинала видео, выбор объекта, промпт
Доступна на Pika 1.5, 2.0, 2.1 и Turbo. 150 кредитов в месяц на 15 роликов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4🤔1
Рассказываю про AI-апгрейды в Google Workspace: :
💌 вставляем ответы Gemini сразу в черновик письма в Gmail. Если хочешь в деловую переписку добавить инфу из предыдущих сообщений, не надо искать фрагменты вручную
❓ быстрые команды в Google Chat — без использования команд со слешем. При частых запросах (проверка статуса проекта, напоминалки) можно мгновенно запускать эти действия, не вводя длинную команду ручками
💃 генерим людей с помощью Imagen 3 во всех сервисах пространства — Google Docs, Sheets, Drive, Slides и снова Gmail. Допустим, если надо презентацию запилить
Упрощаем повседневность, повышаем эффективность😉
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Упрощаем повседневность, повышаем эффективность
Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👏2
Как научить нейросеть не ошибаться в математике 👨💻
Действительно, почему у современных моделей типа ChatGPT есть проблемы с задачами выше школьного уровня?
Учёные подготовили качественный обзор успехов AI в подобных вычислениях:
😲 трудности у LLM возникают из-за того, что они не опираются на строгие доказательства
⚡️ важно переходить к формальному символьному мышлению
👍 системы надо обучать на опыте существующих proof assistants (Lean, Coq, Isabelle)
⛔️ это поможет не только в математике, но и снизит вероятность того, что модель будет выдавать галлюцинации вместо точных ответов
Да, есть прогресс — взять хотя бы AlphaProof и AlphaGeometry, но всё равно остаются вопросы❓
Например, пока мало хороших датасетов и бенчей, чтобы точно оценить, насколько эффективно эти методы работают.
Изображение Meta*, Stanford University, UC Berkeley, University of Edinburgh, UT Austin
* экстремистская организация, деятельность которой запрещена на территории РФ
Действительно, почему у современных моделей типа ChatGPT есть проблемы с задачами выше школьного уровня?
Учёные подготовили качественный обзор успехов AI в подобных вычислениях:
Да, есть прогресс — взять хотя бы AlphaProof и AlphaGeometry, но всё равно остаются вопросы
Например, пока мало хороших датасетов и бенчей, чтобы точно оценить, насколько эффективно эти методы работают.
Изображение Meta*, Stanford University, UC Berkeley, University of Edinburgh, UT Austin
* экстремистская организация, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
iPhone в Китае: что на борту?
Когда мы говорили “китайский айфон”, мы не это имели в виду 😁 Но теперь всё именно так! В Apple действительно подумывают внедрить модель Qwen от Alibaba в свой легендарный смартфон. Вместо GPT, между прочим 🙃
Это поможет компании лучше вписаться в специфику рынка Поднебесной и прокачать продажи 💰
Переговоры уже идут вовсю:
😮 Qwen круто себя показала на Hugging Face, так что выбор понятен. Модели на её основе занимают топовые места среди аналогичных инструментов
😙 партнёрство с Alibaba встраивает Apple в строгие китайские стандарты, касающиеся иностранных технологий
😵💫 для местных разрабов iOS это отличная новость: можно создавать приложения с продвинутыми функциями обработки текста и плотно интегрировать их в родные сервисы
📈 акции обеих компаний взлетели после новостей
Анонс будет на конференции Apple в Шанхае 25 марта 🗓
Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
Когда мы говорили “китайский айфон”, мы не это имели в виду 😁 Но теперь всё именно так! В Apple действительно подумывают внедрить модель Qwen от Alibaba в свой легендарный смартфон. Вместо GPT, между прочим 🙃
Это поможет компании лучше вписаться в специфику рынка Поднебесной и прокачать продажи 💰
Переговоры уже идут вовсю:
😮 Qwen круто себя показала на Hugging Face, так что выбор понятен. Модели на её основе занимают топовые места среди аналогичных инструментов
😙 партнёрство с Alibaba встраивает Apple в строгие китайские стандарты, касающиеся иностранных технологий
😵💫 для местных разрабов iOS это отличная новость: можно создавать приложения с продвинутыми функциями обработки текста и плотно интегрировать их в родные сервисы
📈 акции обеих компаний взлетели после новостей
Анонс будет на конференции Apple в Шанхае 25 марта 🗓
Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1
❤5👏2🔥1
Тестила в PixVerse прикольную функцию LipSync, которая пытается подстроить движение губ под аудиоозвучку 💋
Предупреждаю: на 60 бесплатных кредитов в день особо не разбежишься, при условии, что один ролик забирает 30😕
1️⃣ первый блин комом не получился, так как, по моим догадкам, нейронка озвучивает только людей (но вы пробуйте ❗️ ). У меня кот петь не захотел 🐱
2️⃣ со второй попытки всё сложилось 🐰
3️⃣ видео сгенерил MiniMax — исходник прилагаю, чтобы была заметна разница ➡️
Песню написала Suno. А так процесс элементарный: грузим видео и аудио. Но помните, что чем длиннее трек, тем больше кредитов на него уйдёт🎵
Предупреждаю: на 60 бесплатных кредитов в день особо не разбежишься, при условии, что один ролик забирает 30
Песню написала Suno. А так процесс элементарный: грузим видео и аудио. Но помните, что чем длиннее трек, тем больше кредитов на него уйдёт
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥4
LearnLM отвечает на вопросы по всем канонам педагогики! 🤓
Нейросетка Google для образования работает на основе Gemini. Для этого её тренировали следовать педагогическим гайдлайнам и дополнительно файнтюнили на учебных данных, включая разговоры экспертов с AI.
Как готовили:
💬 через supervised fine-tuning (SFT) LearnLM осваивала учительские инструкции. Диалог начинался с детального описания, чтобы она подстраивалась под промпты и варьировала стили преподавания
✍️ RLHF подключали для донастройки. Тут уже настоящие педагоги размечали ответы в многоэтапных диалогах
➕ наконец, её совместно обучили с Gemini, чтобы добавить к преподавательским скиллам LearnLM её базовые AI-умения
Получилась крутая штука, которую эксперты признали лучше GPT-4o, Claude 3.5 и Gemini 1.5 Pro. Для использования AI в образовании это большой шаг вперёд🙂
Изображение Google
Нейросетка Google для образования работает на основе Gemini. Для этого её тренировали следовать педагогическим гайдлайнам и дополнительно файнтюнили на учебных данных, включая разговоры экспертов с AI.
Как готовили:
Получилась крутая штука, которую эксперты признали лучше GPT-4o, Claude 3.5 и Gemini 1.5 Pro. Для использования AI в образовании это большой шаг вперёд
Изображение Google
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍2🤔1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Deep Research от Perplexity: когда нужно быстро стать экспертом 🤓
В системе запустили фичу, которая берёт на себя работу по исследованиям и продвинутому анализу данных.
Вот как всё происходит:
🥸 Deep Research ищет документы, читает их и решает, что дальше, разбираясь и умнея по ходу процесса
🎉 когда всё собрано, формируется понятный и полный отчёт
🏌️ сохраняем в PDF или доком, а дальше делимся с кем надо
Что может? Да многое: от планирования путешествия до финансового анализа🤑 А ещё проходит тесты уровня Humanity's Last Exam.
Бесплатная версия у всех, у Pro-подписчиков безлимит по запросам. Доступно на вебе, скоро будет на iOS, Android и macOS⛔️
В системе запустили фичу, которая берёт на себя работу по исследованиям и продвинутому анализу данных.
Вот как всё происходит:
Что может? Да многое: от планирования путешествия до финансового анализа
Бесплатная версия у всех, у Pro-подписчиков безлимит по запросам. Доступно на вебе, скоро будет на iOS, Android и macOS
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
AugmentOS: AI как ваше продолжение 🔠 🔠
Речь про операционку для умных очков, выпущенную Vuzix и Mentra😎
Где работает и что умеет:
🤝 совместима с моделями Even Realities G1, Vuzix Z100 и Mentra Mach1
📞 функционирует через смартфон
⛔️ пока что поддерживается только на устройствах с Android, на iOS дадут в феврале
🧑💻 скиллы на основе нейросетей
🆘 поддержка разработки приложений с субтитрами, переводом, проактивной помощью и другими фичами
* в видео упоминается продукт экстремистской организации, деятельность которой запрещена на территории РФ
Речь про операционку для умных очков, выпущенную Vuzix и Mentra
Где работает и что умеет:
* в видео упоминается продукт экстремистской организации, деятельность которой запрещена на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Даже на те, что вы не задавали. Маск не обманул и выкатил чат-бота xAI на новом уровне.
Фишки:
Показывает крутые результаты в математике, физике, биологии и химии.
Сейчас Grok-3 в стадии бета-тестирования. Голосовой режим пока отложили из-за багов, но обещают запустить через неделю
Изображения Х
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥4❤3
Проверь себя: как чаще всего модель выбирает правильный ответ из нескольких вариантов?
Anonymous Poll
66%
оценивает, какой ответ точно отражает контекст вопроса
29%
сравнивает ответы между собой
19%
случайным образом
Бенчмарки: не всё так сложно, как кажется (но иногда сложнее!)
Отвечаю на вопрос о способе выбора моделью верного ответа (опрос см. выше🤘 ). Обычно в тестах на понимание языка модели сталкиваются с множественным выбором в вопросах. Алгоритмы скорят каждый ответ, опираясь только на контекст вопроса ⁉️
Но это противоречит элементарной логике☹️ Модель не учитывает другие доступные опции, в то время как люди всегда сравнивают варианты ответов между собой, чтобы найти подходящий 🧑💻
Snowflake AI решили проверить, насколько реально сложны популярные бенчмарки. Так и выяснилось, что сложность тестов не в самих заданиях, а в подходах к скорингу.
Исследование показало: если дать модели все варианты ответов сразу, перформанс заметно улучшается. Например, LLaMA 3.1 70B* повышает показатели с 64% до 93%💪
* продукт экстремистской организации, деятельность которой запрещена на территории РФ
Изображение Snowflake AI Research
Отвечаю на вопрос о способе выбора моделью верного ответа (опрос см. выше
Но это противоречит элементарной логике
Snowflake AI решили проверить, насколько реально сложны популярные бенчмарки. Так и выяснилось, что сложность тестов не в самих заданиях, а в подходах к скорингу.
Исследование показало: если дать модели все варианты ответов сразу, перформанс заметно улучшается. Например, LLaMA 3.1 70B* повышает показатели с 64% до 93%
* продукт экстремистской организации, деятельность которой запрещена на территории РФ
Изображение Snowflake AI Research
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤔3
Тайная печать Google: когда AI становится видимым 👻
Компания внедряет водяные знаки SynthID для фоток, отредактированных Magic Editor.
Опция нужна, чтобы пользователи могли знать о манипуляциях reimagine с картинкой. Про SynthID я рассказывала, она работает с генерациями Google Imagen✨
Но есть нюансы:
🙅♂️ SynthID может не распознать небольшие правки
🥢 для обнаружения вотермарки нужен AI-детектор из About this image
Так что пока это полумера, а разоблачение цифрового следа может и не состояться⌛
Изображение DeepMind
Компания внедряет водяные знаки SynthID для фоток, отредактированных Magic Editor.
Опция нужна, чтобы пользователи могли знать о манипуляциях reimagine с картинкой. Про SynthID я рассказывала, она работает с генерациями Google Imagen
Но есть нюансы:
Так что пока это полумера, а разоблачение цифрового следа может и не состояться
Изображение DeepMind
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2