Forwarded from Not Boring Tech
🧨 Вышла лучшая нейронка для апскейла и реставрации любых видео — FLASHVSR воскрешает даже самые шакальные ролики низкого разрешения.
Работает в реальном времени через три этапа: дистилляция для улучшения качества видео, сокращение лишних вычислений и ускоренная реконструкции без потери качества.
GitHub — тут, а HuggingFace — тут.
@notboring_tech
Работает в реальном времени через три этапа: дистилляция для улучшения качества видео, сокращение лишних вычислений и ускоренная реконструкции без потери качества.
GitHub — тут, а HuggingFace — тут.
@notboring_tech
❤5👍3🔥2
Forwarded from The Edinorog 🦄
Человекоподобные роботы: кто и какие модели делает
Это подборка моделей 2025 года. Можно посмотреть в большом разрешении, чтобы все подписи прочитать. А еще есть такие же подборки за 2023-й и за 2024-й годы.
Интересно, а как там поживает разработчик легендарного робота Федора? Что-то уже несколько лет новинок от них не видно. Интересно, почему перестали новых делать? Если вдруг знаете, то чирканите в личку.
@TheEdinorogBlog — тот самый канал про стартапы🦄
Это подборка моделей 2025 года. Можно посмотреть в большом разрешении, чтобы все подписи прочитать. А еще есть такие же подборки за 2023-й и за 2024-й годы.
Интересно, а как там поживает разработчик легендарного робота Федора? Что-то уже несколько лет новинок от них не видно. Интересно, почему перестали новых делать? Если вдруг знаете, то чирканите в личку.
@TheEdinorogBlog — тот самый канал про стартапы🦄
🔥4🤣2
Forwarded from Точки над ИИ
Решил полностью пересесть на Atlas (вышедший вчера браузер от OpenAI)
У меня не работает подход – использовать два браузера (так было с Comet, я тогда параллельно продолжал использовать Chrome, в итоге забил на Comet).
Вчера скачал Atlas, импортировал в него весь Хром с историей, закладками и всем остальным.
Пока AI-функционал потестил на трех штуках, докладываю:
1. Саммари по стриму лекции.
Тут он мне реально помог. Лекция шла в прямом эфире, шла долго, времени посмотреть ее у меня не нашлось. Я открыл на странице стрима GPT и попросил его слушать спикера, смотреть слайды и фиксировать все по блокам с главными идеями, инсайтами, цифрами. Справился отлично, все посмотрел, записал, собрал в 5-страничный PDF. Бонусом потом в этом чате можно продолжить диалог на основе этой лекции, задавать любые вопросы.
2. Упорядочить инфу в моем Notion.
Здесь он, как агент, справился просто отвратительно😭.
Задача была несложная: есть страничка внутри ноушн, в ней хаотичный набор ссылок, тезисов и файлов. Нужно все собрать в табличку, упорядочить, разбить по категориям. В итоге он сделал нечто похожее на таблицу, все перепутал местами, все файлы удалил, как и половину ссылок. Потом мне пришлось уговаривать агента вернуть файлы, так как в корзине самого Notion их, почему-то, не было. Для примера – Comet c похожей задачей справлялся у меня отлично. Но лучше всех это делает, конечно, AI-ассистент в самом ноушн.
3. Имитировать поведение игрока.
Мы в студии сейчас делаем метаверс-проект для одного фестиваля. Я дал агенту инструкции как управлять аватаром и запустил его в демо-локацию. Тут он тоже не справился, так как оказалось, что он не умеет зажимать кнопку. Умеет только нажимать. Управление у нас внутри стандартное – WASD. В итоге он много раз тыкал в W, забывая про вращение курсора и поворот другими кнопками.
Продолжаю тестить. Буду делиться интересными юзкейсами, которые обнаружу.
#Agents@TochkiNadAI
У меня не работает подход – использовать два браузера (так было с Comet, я тогда параллельно продолжал использовать Chrome, в итоге забил на Comet).
Вчера скачал Atlas, импортировал в него весь Хром с историей, закладками и всем остальным.
Пока AI-функционал потестил на трех штуках, докладываю:
1. Саммари по стриму лекции.
Тут он мне реально помог. Лекция шла в прямом эфире, шла долго, времени посмотреть ее у меня не нашлось. Я открыл на странице стрима GPT и попросил его слушать спикера, смотреть слайды и фиксировать все по блокам с главными идеями, инсайтами, цифрами. Справился отлично, все посмотрел, записал, собрал в 5-страничный PDF. Бонусом потом в этом чате можно продолжить диалог на основе этой лекции, задавать любые вопросы.
2. Упорядочить инфу в моем Notion.
Здесь он, как агент, справился просто отвратительно😭.
Задача была несложная: есть страничка внутри ноушн, в ней хаотичный набор ссылок, тезисов и файлов. Нужно все собрать в табличку, упорядочить, разбить по категориям. В итоге он сделал нечто похожее на таблицу, все перепутал местами, все файлы удалил, как и половину ссылок. Потом мне пришлось уговаривать агента вернуть файлы, так как в корзине самого Notion их, почему-то, не было. Для примера – Comet c похожей задачей справлялся у меня отлично. Но лучше всех это делает, конечно, AI-ассистент в самом ноушн.
3. Имитировать поведение игрока.
Мы в студии сейчас делаем метаверс-проект для одного фестиваля. Я дал агенту инструкции как управлять аватаром и запустил его в демо-локацию. Тут он тоже не справился, так как оказалось, что он не умеет зажимать кнопку. Умеет только нажимать. Управление у нас внутри стандартное – WASD. В итоге он много раз тыкал в W, забывая про вращение курсора и поворот другими кнопками.
Продолжаю тестить. Буду делиться интересными юзкейсами, которые обнаружу.
#Agents@TochkiNadAI
🔥9❤6
Forwarded from Милитарист
ChatGPT официально достиг человеческого уровня интеллекта.
После того, как ему дали 10 тыс. долларов и отправили торговать криптовалютами, он проиграл 42 сделки из 44, потеряв 7200 долл. за неделю. Но ИИ не собирается сдаваться и продолжает сливать деньги в надежде выйти в плюс.
После того, как ему дали 10 тыс. долларов и отправили торговать криптовалютами, он проиграл 42 сделки из 44, потеряв 7200 долл. за неделю. Но ИИ не собирается сдаваться и продолжает сливать деньги в надежде выйти в плюс.
🤣16😁11
This media is not supported in your browser
VIEW IN TELEGRAM
С помощью нейросетей можно оживить фотографию из семейного архива, заново прожить воспоминания или поиграться с любимыми мемами.
Собрали семь инструментов, которые помогут превратить статичные кадры в анимацию или полноценный ролик с озвучкой
vc.ru/ai/2311063
Собрали семь инструментов, которые помогут превратить статичные кадры в анимацию или полноценный ролик с озвучкой
vc.ru/ai/2311063
❤5
Forwarded from Not Boring Tech
This media is not supported in your browser
VIEW IN TELEGRAM
📜 Datalab выпустили лучшую OCR-модель — Chandra максимально точно извлекает всё содержимое из любых изображений и PDF-документов.
• Превращает фотки и файлы в структурированные форматы HTML, Markdown и JSON.
• Сохраняет макет и отлично вытаскивает таблицы, формулы, диаграммы и даже рукописный текст.
• Поддерживает более 40 языков.
• Возглавляет все независимые бенчмарки, обгоняя DeepSeek OCR, Mistral OCR и других конкурентов.
• Модель Chandra доступна как локально, так и удалённо.
GitHub — здесь, а бесплатная демка — тут.
@notboring_tech
• Превращает фотки и файлы в структурированные форматы HTML, Markdown и JSON.
• Сохраняет макет и отлично вытаскивает таблицы, формулы, диаграммы и даже рукописный текст.
• Поддерживает более 40 языков.
• Возглавляет все независимые бенчмарки, обгоняя DeepSeek OCR, Mistral OCR и других конкурентов.
• Модель Chandra доступна как локально, так и удалённо.
GitHub — здесь, а бесплатная демка — тут.
@notboring_tech
❤8👍3🔥1
Forwarded from Малоизвестное интересное
Даже лев с мозгами ИИ не выжил бы в реальном мире
До робота-кошки – далеко. А пока ИИ останутся умными, но бесплотными “духами”
Новое исследование "Benchmarking World-Model Learning" сравнило людей и топ-модели ИИ в задачах «сначала свободно изучи мир, потом реши новую родственную задачу». Итог прост: люди несравнимо лучше строят модель мира – они целенаправленно экспериментируют, гибко пересматривают гипотезы и переносят знания. Модели же часто «застревают» в первой догадке. Главная причина – у них нет врождённых приоров и социальной стаевой педагогики.
N.B. Приоры (Priors) – это прошитые ожидания о том, как устроены объекты, причины и последствия; у животных это результат эволюции и детского опыта. У ИИ такие ожидания в основном статистические и книжные – они плохо работают в живой, изменчивой среде.
На сегодняшнем уровне технологий у нас нет волшебной кнопки, которая сразу даст инстинкты, безопасное исследование, долговременную память и поведенческие нормы стаи.
Но есть реалистичная дорожная карта. Она включает:
• Объектные и причинные приоры (видеть мир как набор устойчивых вещей и причинно-следственных связей).
• Внутренние мировые модели с планированием (умение «прокручивать» будущие сценарии в уме).
• Популяционное обучение с эмерджентной коммуникацией и ToM-сигналами – задачами/наградами за точное моделирование убеждений и намерений других (Theory of Mind).
• Нормативную надстройку вроде RLHF/«конституции», задающую социальные запреты и предпочтения.
Так почему же мы ещё не там?
Поэтому в обозримом будущем ИИ останутся очень умными, но по сути бесплотными «духами». И до робота-кошки, сопоставимого с настоящей (мечта, близкая к цели Яна ЛеКуна), нам ещё действительно далеко.
P.S. Роботов конечно будет всё больше и больше – но без врождённых приоров и безопасной онлайновой учёбы это будут в основном хорошо дрессированные исполнители в контролируемых декорациях, а не “кошки”, которые учатся жить в мире, а не только в сценариях.
#ВоплощенныйИнтеллект #LLM
До робота-кошки – далеко. А пока ИИ останутся умными, но бесплотными “духами”
Новое исследование "Benchmarking World-Model Learning" сравнило людей и топ-модели ИИ в задачах «сначала свободно изучи мир, потом реши новую родственную задачу». Итог прост: люди несравнимо лучше строят модель мира – они целенаправленно экспериментируют, гибко пересматривают гипотезы и переносят знания. Модели же часто «застревают» в первой догадке. Главная причина – у них нет врождённых приоров и социальной стаевой педагогики.
N.B. Приоры (Priors) – это прошитые ожидания о том, как устроены объекты, причины и последствия; у животных это результат эволюции и детского опыта. У ИИ такие ожидания в основном статистические и книжные – они плохо работают в живой, изменчивой среде.
Можно ли «вложить» это в ИИ одним трюком?
Увы, но ответ «нет».
На сегодняшнем уровне технологий у нас нет волшебной кнопки, которая сразу даст инстинкты, безопасное исследование, долговременную память и поведенческие нормы стаи.
Но есть реалистичная дорожная карта. Она включает:
• Объектные и причинные приоры (видеть мир как набор устойчивых вещей и причинно-следственных связей).
• Внутренние мировые модели с планированием (умение «прокручивать» будущие сценарии в уме).
• Популяционное обучение с эмерджентной коммуникацией и ToM-сигналами – задачами/наградами за точное моделирование убеждений и намерений других (Theory of Mind).
• Нормативную надстройку вроде RLHF/«конституции», задающую социальные запреты и предпочтения.
Так почему же мы ещё не там?
Да потому, что самое трудное – сшить всё вместе: онлайн-обновление убеждений без “забывания”, долговременную память, телесную сенсомоторику и безопасное обучение новому – аккуратно пробуя действия, заранее оценивая риск и останавливаясь до катастрофы.
Поэтому в обозримом будущем ИИ останутся очень умными, но по сути бесплотными «духами». И до робота-кошки, сопоставимого с настоящей (мечта, близкая к цели Яна ЛеКуна), нам ещё действительно далеко.
P.S. Роботов конечно будет всё больше и больше – но без врождённых приоров и безопасной онлайновой учёбы это будут в основном хорошо дрессированные исполнители в контролируемых декорациях, а не “кошки”, которые учатся жить в мире, а не только в сценариях.
#ВоплощенныйИнтеллект #LLM
❤3🤯1
Forwarded from FSCP
This media is not supported in your browser
VIEW IN TELEGRAM
БУДУЩЕЕ 3D-ПЕЧАТИ УЖЕ ЗДЕСЬ
https://www.youtube.com/watch?v=M5DV-ORlXZY
https://www.youtube.com/watch?v=M5DV-ORlXZY
👍4
Media is too big
VIEW IN TELEGRAM
Компания Shenzhen Yuejiang Technology начала продажи робособаки Rover X1. Она может носить вещи и следовать с камерой во время путешествий, а в обычное время — сторожить территорию и выполнять роль компаньона.
Робот стоит 7499 юаней, что несколько «ниже» средних цен робособак на китайском рынке
vc.ru/dev/2320029
Робот стоит 7499 юаней, что несколько «ниже» средних цен робособак на китайском рынке
vc.ru/dev/2320029
❤4😱1
Forwarded from эйай ньюз
GPT 5.1 — вайбы получше 🎧
С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.
Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.
Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.
Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.
@ai_newz
С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.
Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.
Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.
Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Forwarded from e/acc
Любопытно.
2,5 года назад: подписка за $20 на GPT это прикольно, не обязательно
1,5 года назад: отменю GPT, куплю Claude; через месяц, с выходом новой модели, обратно
0,5 года назад: отменю Claude code за $200, куплю GPT Pro
сегодня: если у меня нет подписки на Gemini/NanoBanana, Claude Code и GPT Pro, то я не могу нормально функционировать в личной жизни и профессионально.
Продукты становятся незаменимы, а мы становится все больше киборгами.
2,5 года назад: подписка за $20 на GPT это прикольно, не обязательно
1,5 года назад: отменю GPT, куплю Claude; через месяц, с выходом новой модели, обратно
0,5 года назад: отменю Claude code за $200, куплю GPT Pro
сегодня: если у меня нет подписки на Gemini/NanoBanana, Claude Code и GPT Pro, то я не могу нормально функционировать в личной жизни и профессионально.
Продукты становятся незаменимы, а мы становится все больше киборгами.
👍7
Forwarded from Femida
Uno Reverse из мира индийского скама
Стандартная схема: индус-скамер написал парню с просьбой оплаты доставки каких-то вещей (чтобы потом украсть данные его карты).
Но парень оказался не из простых и, поняв что это развод, он обратился к ChatGPT и попросил написать фейковый «платёжный шлюз», замаскированный под сканер qr-кодов, который при включении камеры фотографировал бы зашедшего на сайт пользователя и отправлял его местоположение.
Он скинул эту ссылку скамеру и попросил «отсканировать QR для ускорения оплаты». Сразу после этого создателю сайта пришла геопозиция и фото горе-скамера.😆
Пикрелейтед.
Стандартная схема: индус-скамер написал парню с просьбой оплаты доставки каких-то вещей (чтобы потом украсть данные его карты).
Но парень оказался не из простых и, поняв что это развод, он обратился к ChatGPT и попросил написать фейковый «платёжный шлюз», замаскированный под сканер qr-кодов, который при включении камеры фотографировал бы зашедшего на сайт пользователя и отправлял его местоположение.
Он скинул эту ссылку скамеру и попросил «отсканировать QR для ускорения оплаты». Сразу после этого создателю сайта пришла геопозиция и фото горе-скамера.
Пикрелейтед.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Google добавила в Gemini генератор веб-приложений Opal. Он помогает вайб-кодить внутри чат-бота, давая схему с готовыми шагами.
Также Opal доступен бесплатно на отдельном сайте, где есть визуальный конструктор
vc.ru/ai/2656482
Также Opal доступен бесплатно на отдельном сайте, где есть визуальный конструктор
vc.ru/ai/2656482
❤3
Forwarded from e/acc
Любопытный график сегодня скинули. Полтора года назад Сергей Брин вернулся в Google, став де-факто СЕО направления ИИ в компании. Вот результат, когда СЕО-фаундер-инженер руководит компанией.
👍4🤪2🤝1