Forwarded from Amigo | Crash Index
This media is not supported in your browser
VIEW IN TELEGRAM
Новую веху в ИИ вчера презентовали OpenAI
Теперь вы можете "общаться" с другими приложениями внутри GPT, а разработчики могут создавать интеграции с GPT
Мне кажется именно таким должны быть все эти встроенные помощники типа Siri. Это своего рода операционная система внутри операционной системы.
По идее мы будем общаться в 90% с одним ИИ ассистентом, который выполняет любое поручение, которое можно сделать с помощью компьютера и телефона.
Мне кажется следующим шагом будет интеграция в альтернативное устройство, что станет нашим зрением, слухом и передачей команд внутрь телефона/компьютера.
Этот форм фактор уже назревает давно. Много команд делают прототипы. Будет ли это линза в глаз или что то другое не знаю, но мир не будет прежний уже лет через 5. Как когда то появились мобильники с интернетом, потом с камерой (лет за 10 накрыло всю Землю) так и вскоре появится новое устройство внутри которого будет цифровой ассистент, как второй мозг у которого есть полный доступ чтобы решить прямо на ходу любую задачу, от построения маршрута и вывода прямо в вашу линзу, так и разворачивания вашего утром разработанного с помощью ИИ агента приложения в облаке.
Агентность это главное свойство, которым обладал тот самый Джарвис. OpenAI метит именно туда.
Теперь вы можете "общаться" с другими приложениями внутри GPT, а разработчики могут создавать интеграции с GPT
Мне кажется именно таким должны быть все эти встроенные помощники типа Siri. Это своего рода операционная система внутри операционной системы.
По идее мы будем общаться в 90% с одним ИИ ассистентом, который выполняет любое поручение, которое можно сделать с помощью компьютера и телефона.
Мне кажется следующим шагом будет интеграция в альтернативное устройство, что станет нашим зрением, слухом и передачей команд внутрь телефона/компьютера.
Этот форм фактор уже назревает давно. Много команд делают прототипы. Будет ли это линза в глаз или что то другое не знаю, но мир не будет прежний уже лет через 5. Как когда то появились мобильники с интернетом, потом с камерой (лет за 10 накрыло всю Землю) так и вскоре появится новое устройство внутри которого будет цифровой ассистент, как второй мозг у которого есть полный доступ чтобы решить прямо на ходу любую задачу, от построения маршрута и вывода прямо в вашу линзу, так и разворачивания вашего утром разработанного с помощью ИИ агента приложения в облаке.
Агентность это главное свойство, которым обладал тот самый Джарвис. OpenAI метит именно туда.
🔥2💯2
Forwarded from Alex Exler online
This media is not supported in your browser
VIEW IN TELEGRAM
Как люди получали информацию во времена, когда еще не было ChatGPT.
Мой любимый персонаж из сериала The Police Squad. Жалко, что они его в "Голый пистолет" не включили.
Мой любимый персонаж из сериала The Police Squad. Жалко, что они его в "Голый пистолет" не включили.
😁9🔥5🤣2
Forwarded from Not Boring Tech
🧨 Вышла лучшая нейронка для апскейла и реставрации любых видео — FLASHVSR воскрешает даже самые шакальные ролики низкого разрешения.
Работает в реальном времени через три этапа: дистилляция для улучшения качества видео, сокращение лишних вычислений и ускоренная реконструкции без потери качества.
GitHub — тут, а HuggingFace — тут.
@notboring_tech
Работает в реальном времени через три этапа: дистилляция для улучшения качества видео, сокращение лишних вычислений и ускоренная реконструкции без потери качества.
GitHub — тут, а HuggingFace — тут.
@notboring_tech
❤5👍3🔥2
Forwarded from The Edinorog 🦄
Человекоподобные роботы: кто и какие модели делает
Это подборка моделей 2025 года. Можно посмотреть в большом разрешении, чтобы все подписи прочитать. А еще есть такие же подборки за 2023-й и за 2024-й годы.
Интересно, а как там поживает разработчик легендарного робота Федора? Что-то уже несколько лет новинок от них не видно. Интересно, почему перестали новых делать? Если вдруг знаете, то чирканите в личку.
@TheEdinorogBlog — тот самый канал про стартапы🦄
Это подборка моделей 2025 года. Можно посмотреть в большом разрешении, чтобы все подписи прочитать. А еще есть такие же подборки за 2023-й и за 2024-й годы.
Интересно, а как там поживает разработчик легендарного робота Федора? Что-то уже несколько лет новинок от них не видно. Интересно, почему перестали новых делать? Если вдруг знаете, то чирканите в личку.
@TheEdinorogBlog — тот самый канал про стартапы🦄
🔥4🤣2
Forwarded from Точки над ИИ
Решил полностью пересесть на Atlas (вышедший вчера браузер от OpenAI)
У меня не работает подход – использовать два браузера (так было с Comet, я тогда параллельно продолжал использовать Chrome, в итоге забил на Comet).
Вчера скачал Atlas, импортировал в него весь Хром с историей, закладками и всем остальным.
Пока AI-функционал потестил на трех штуках, докладываю:
1. Саммари по стриму лекции.
Тут он мне реально помог. Лекция шла в прямом эфире, шла долго, времени посмотреть ее у меня не нашлось. Я открыл на странице стрима GPT и попросил его слушать спикера, смотреть слайды и фиксировать все по блокам с главными идеями, инсайтами, цифрами. Справился отлично, все посмотрел, записал, собрал в 5-страничный PDF. Бонусом потом в этом чате можно продолжить диалог на основе этой лекции, задавать любые вопросы.
2. Упорядочить инфу в моем Notion.
Здесь он, как агент, справился просто отвратительно😭.
Задача была несложная: есть страничка внутри ноушн, в ней хаотичный набор ссылок, тезисов и файлов. Нужно все собрать в табличку, упорядочить, разбить по категориям. В итоге он сделал нечто похожее на таблицу, все перепутал местами, все файлы удалил, как и половину ссылок. Потом мне пришлось уговаривать агента вернуть файлы, так как в корзине самого Notion их, почему-то, не было. Для примера – Comet c похожей задачей справлялся у меня отлично. Но лучше всех это делает, конечно, AI-ассистент в самом ноушн.
3. Имитировать поведение игрока.
Мы в студии сейчас делаем метаверс-проект для одного фестиваля. Я дал агенту инструкции как управлять аватаром и запустил его в демо-локацию. Тут он тоже не справился, так как оказалось, что он не умеет зажимать кнопку. Умеет только нажимать. Управление у нас внутри стандартное – WASD. В итоге он много раз тыкал в W, забывая про вращение курсора и поворот другими кнопками.
Продолжаю тестить. Буду делиться интересными юзкейсами, которые обнаружу.
#Agents@TochkiNadAI
У меня не работает подход – использовать два браузера (так было с Comet, я тогда параллельно продолжал использовать Chrome, в итоге забил на Comet).
Вчера скачал Atlas, импортировал в него весь Хром с историей, закладками и всем остальным.
Пока AI-функционал потестил на трех штуках, докладываю:
1. Саммари по стриму лекции.
Тут он мне реально помог. Лекция шла в прямом эфире, шла долго, времени посмотреть ее у меня не нашлось. Я открыл на странице стрима GPT и попросил его слушать спикера, смотреть слайды и фиксировать все по блокам с главными идеями, инсайтами, цифрами. Справился отлично, все посмотрел, записал, собрал в 5-страничный PDF. Бонусом потом в этом чате можно продолжить диалог на основе этой лекции, задавать любые вопросы.
2. Упорядочить инфу в моем Notion.
Здесь он, как агент, справился просто отвратительно😭.
Задача была несложная: есть страничка внутри ноушн, в ней хаотичный набор ссылок, тезисов и файлов. Нужно все собрать в табличку, упорядочить, разбить по категориям. В итоге он сделал нечто похожее на таблицу, все перепутал местами, все файлы удалил, как и половину ссылок. Потом мне пришлось уговаривать агента вернуть файлы, так как в корзине самого Notion их, почему-то, не было. Для примера – Comet c похожей задачей справлялся у меня отлично. Но лучше всех это делает, конечно, AI-ассистент в самом ноушн.
3. Имитировать поведение игрока.
Мы в студии сейчас делаем метаверс-проект для одного фестиваля. Я дал агенту инструкции как управлять аватаром и запустил его в демо-локацию. Тут он тоже не справился, так как оказалось, что он не умеет зажимать кнопку. Умеет только нажимать. Управление у нас внутри стандартное – WASD. В итоге он много раз тыкал в W, забывая про вращение курсора и поворот другими кнопками.
Продолжаю тестить. Буду делиться интересными юзкейсами, которые обнаружу.
#Agents@TochkiNadAI
🔥9❤6
Forwarded from Милитарист
ChatGPT официально достиг человеческого уровня интеллекта.
После того, как ему дали 10 тыс. долларов и отправили торговать криптовалютами, он проиграл 42 сделки из 44, потеряв 7200 долл. за неделю. Но ИИ не собирается сдаваться и продолжает сливать деньги в надежде выйти в плюс.
После того, как ему дали 10 тыс. долларов и отправили торговать криптовалютами, он проиграл 42 сделки из 44, потеряв 7200 долл. за неделю. Но ИИ не собирается сдаваться и продолжает сливать деньги в надежде выйти в плюс.
🤣16😁11
This media is not supported in your browser
VIEW IN TELEGRAM
С помощью нейросетей можно оживить фотографию из семейного архива, заново прожить воспоминания или поиграться с любимыми мемами.
Собрали семь инструментов, которые помогут превратить статичные кадры в анимацию или полноценный ролик с озвучкой
vc.ru/ai/2311063
Собрали семь инструментов, которые помогут превратить статичные кадры в анимацию или полноценный ролик с озвучкой
vc.ru/ai/2311063
❤5
Forwarded from Not Boring Tech
This media is not supported in your browser
VIEW IN TELEGRAM
📜 Datalab выпустили лучшую OCR-модель — Chandra максимально точно извлекает всё содержимое из любых изображений и PDF-документов.
• Превращает фотки и файлы в структурированные форматы HTML, Markdown и JSON.
• Сохраняет макет и отлично вытаскивает таблицы, формулы, диаграммы и даже рукописный текст.
• Поддерживает более 40 языков.
• Возглавляет все независимые бенчмарки, обгоняя DeepSeek OCR, Mistral OCR и других конкурентов.
• Модель Chandra доступна как локально, так и удалённо.
GitHub — здесь, а бесплатная демка — тут.
@notboring_tech
• Превращает фотки и файлы в структурированные форматы HTML, Markdown и JSON.
• Сохраняет макет и отлично вытаскивает таблицы, формулы, диаграммы и даже рукописный текст.
• Поддерживает более 40 языков.
• Возглавляет все независимые бенчмарки, обгоняя DeepSeek OCR, Mistral OCR и других конкурентов.
• Модель Chandra доступна как локально, так и удалённо.
GitHub — здесь, а бесплатная демка — тут.
@notboring_tech
❤8👍3🔥1
Forwarded from Малоизвестное интересное
Даже лев с мозгами ИИ не выжил бы в реальном мире
До робота-кошки – далеко. А пока ИИ останутся умными, но бесплотными “духами”
Новое исследование "Benchmarking World-Model Learning" сравнило людей и топ-модели ИИ в задачах «сначала свободно изучи мир, потом реши новую родственную задачу». Итог прост: люди несравнимо лучше строят модель мира – они целенаправленно экспериментируют, гибко пересматривают гипотезы и переносят знания. Модели же часто «застревают» в первой догадке. Главная причина – у них нет врождённых приоров и социальной стаевой педагогики.
N.B. Приоры (Priors) – это прошитые ожидания о том, как устроены объекты, причины и последствия; у животных это результат эволюции и детского опыта. У ИИ такие ожидания в основном статистические и книжные – они плохо работают в живой, изменчивой среде.
На сегодняшнем уровне технологий у нас нет волшебной кнопки, которая сразу даст инстинкты, безопасное исследование, долговременную память и поведенческие нормы стаи.
Но есть реалистичная дорожная карта. Она включает:
• Объектные и причинные приоры (видеть мир как набор устойчивых вещей и причинно-следственных связей).
• Внутренние мировые модели с планированием (умение «прокручивать» будущие сценарии в уме).
• Популяционное обучение с эмерджентной коммуникацией и ToM-сигналами – задачами/наградами за точное моделирование убеждений и намерений других (Theory of Mind).
• Нормативную надстройку вроде RLHF/«конституции», задающую социальные запреты и предпочтения.
Так почему же мы ещё не там?
Поэтому в обозримом будущем ИИ останутся очень умными, но по сути бесплотными «духами». И до робота-кошки, сопоставимого с настоящей (мечта, близкая к цели Яна ЛеКуна), нам ещё действительно далеко.
P.S. Роботов конечно будет всё больше и больше – но без врождённых приоров и безопасной онлайновой учёбы это будут в основном хорошо дрессированные исполнители в контролируемых декорациях, а не “кошки”, которые учатся жить в мире, а не только в сценариях.
#ВоплощенныйИнтеллект #LLM
До робота-кошки – далеко. А пока ИИ останутся умными, но бесплотными “духами”
Новое исследование "Benchmarking World-Model Learning" сравнило людей и топ-модели ИИ в задачах «сначала свободно изучи мир, потом реши новую родственную задачу». Итог прост: люди несравнимо лучше строят модель мира – они целенаправленно экспериментируют, гибко пересматривают гипотезы и переносят знания. Модели же часто «застревают» в первой догадке. Главная причина – у них нет врождённых приоров и социальной стаевой педагогики.
N.B. Приоры (Priors) – это прошитые ожидания о том, как устроены объекты, причины и последствия; у животных это результат эволюции и детского опыта. У ИИ такие ожидания в основном статистические и книжные – они плохо работают в живой, изменчивой среде.
Можно ли «вложить» это в ИИ одним трюком?
Увы, но ответ «нет».
На сегодняшнем уровне технологий у нас нет волшебной кнопки, которая сразу даст инстинкты, безопасное исследование, долговременную память и поведенческие нормы стаи.
Но есть реалистичная дорожная карта. Она включает:
• Объектные и причинные приоры (видеть мир как набор устойчивых вещей и причинно-следственных связей).
• Внутренние мировые модели с планированием (умение «прокручивать» будущие сценарии в уме).
• Популяционное обучение с эмерджентной коммуникацией и ToM-сигналами – задачами/наградами за точное моделирование убеждений и намерений других (Theory of Mind).
• Нормативную надстройку вроде RLHF/«конституции», задающую социальные запреты и предпочтения.
Так почему же мы ещё не там?
Да потому, что самое трудное – сшить всё вместе: онлайн-обновление убеждений без “забывания”, долговременную память, телесную сенсомоторику и безопасное обучение новому – аккуратно пробуя действия, заранее оценивая риск и останавливаясь до катастрофы.
Поэтому в обозримом будущем ИИ останутся очень умными, но по сути бесплотными «духами». И до робота-кошки, сопоставимого с настоящей (мечта, близкая к цели Яна ЛеКуна), нам ещё действительно далеко.
P.S. Роботов конечно будет всё больше и больше – но без врождённых приоров и безопасной онлайновой учёбы это будут в основном хорошо дрессированные исполнители в контролируемых декорациях, а не “кошки”, которые учатся жить в мире, а не только в сценариях.
#ВоплощенныйИнтеллект #LLM
❤3🤯1
Forwarded from FSCP
This media is not supported in your browser
VIEW IN TELEGRAM
БУДУЩЕЕ 3D-ПЕЧАТИ УЖЕ ЗДЕСЬ
https://www.youtube.com/watch?v=M5DV-ORlXZY
https://www.youtube.com/watch?v=M5DV-ORlXZY
👍4
Media is too big
VIEW IN TELEGRAM
Компания Shenzhen Yuejiang Technology начала продажи робособаки Rover X1. Она может носить вещи и следовать с камерой во время путешествий, а в обычное время — сторожить территорию и выполнять роль компаньона.
Робот стоит 7499 юаней, что несколько «ниже» средних цен робособак на китайском рынке
vc.ru/dev/2320029
Робот стоит 7499 юаней, что несколько «ниже» средних цен робособак на китайском рынке
vc.ru/dev/2320029
❤3😱1
Forwarded from эйай ньюз
GPT 5.1 — вайбы получше 🎧
С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.
Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.
Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.
Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.
@ai_newz
С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.
Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.
Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.
Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Forwarded from e/acc
Любопытно.
2,5 года назад: подписка за $20 на GPT это прикольно, не обязательно
1,5 года назад: отменю GPT, куплю Claude; через месяц, с выходом новой модели, обратно
0,5 года назад: отменю Claude code за $200, куплю GPT Pro
сегодня: если у меня нет подписки на Gemini/NanoBanana, Claude Code и GPT Pro, то я не могу нормально функционировать в личной жизни и профессионально.
Продукты становятся незаменимы, а мы становится все больше киборгами.
2,5 года назад: подписка за $20 на GPT это прикольно, не обязательно
1,5 года назад: отменю GPT, куплю Claude; через месяц, с выходом новой модели, обратно
0,5 года назад: отменю Claude code за $200, куплю GPT Pro
сегодня: если у меня нет подписки на Gemini/NanoBanana, Claude Code и GPT Pro, то я не могу нормально функционировать в личной жизни и профессионально.
Продукты становятся незаменимы, а мы становится все больше киборгами.
👍6
Forwarded from Femida
Uno Reverse из мира индийского скама
Стандартная схема: индус-скамер написал парню с просьбой оплаты доставки каких-то вещей (чтобы потом украсть данные его карты).
Но парень оказался не из простых и, поняв что это развод, он обратился к ChatGPT и попросил написать фейковый «платёжный шлюз», замаскированный под сканер qr-кодов, который при включении камеры фотографировал бы зашедшего на сайт пользователя и отправлял его местоположение.
Он скинул эту ссылку скамеру и попросил «отсканировать QR для ускорения оплаты». Сразу после этого создателю сайта пришла геопозиция и фото горе-скамера.😆
Пикрелейтед.
Стандартная схема: индус-скамер написал парню с просьбой оплаты доставки каких-то вещей (чтобы потом украсть данные его карты).
Но парень оказался не из простых и, поняв что это развод, он обратился к ChatGPT и попросил написать фейковый «платёжный шлюз», замаскированный под сканер qr-кодов, который при включении камеры фотографировал бы зашедшего на сайт пользователя и отправлял его местоположение.
Он скинул эту ссылку скамеру и попросил «отсканировать QR для ускорения оплаты». Сразу после этого создателю сайта пришла геопозиция и фото горе-скамера.
Пикрелейтед.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Google добавила в Gemini генератор веб-приложений Opal. Он помогает вайб-кодить внутри чат-бота, давая схему с готовыми шагами.
Также Opal доступен бесплатно на отдельном сайте, где есть визуальный конструктор
vc.ru/ai/2656482
Также Opal доступен бесплатно на отдельном сайте, где есть визуальный конструктор
vc.ru/ai/2656482
❤2
Forwarded from e/acc
Любопытный график сегодня скинули. Полтора года назад Сергей Брин вернулся в Google, став де-факто СЕО направления ИИ в компании. Вот результат, когда СЕО-фаундер-инженер руководит компанией.
👍3🤪2