Технозаметки Малышева – Telegram
Технозаметки Малышева
8.25K subscribers
3.72K photos
1.39K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Comfy-трансформация

Есть у нас свой макаронный монстр - ComfyUI.
Глядя на название, уже чувствуешь подвох с UI - в общем пакет сложный. Тем кто не нюхал пороха с Houdini, Nuke, Тач, разными Shader Graph или упасихоспади Natron, будет сложно.

Тут надо отметить, что прикручивание нодового интерфейса к генерациям - это не эксклюзив, этим занимаются Glif.app, florafauna.ai, даже InvokeAI лепит свой нетворк граф.

Но по степени низкоуровневости и опенсорсности альтернатив у Комфи нет.

Как и по степени сложности освоения.

И если раньше Комфи всегда ассоциировался как альтернатива почившему Автоматик1111 или полупочившему Forge для генерации картинок, то потом он превратился в комбайн для ЛОКАЛЬНОЙ работы с любыми моделями (видео, аудио, ллм).

Но вчера произошел тектонический сдвиг:

Теперь в комфи завезли 65 готовых API-нод, которые позволяют подключать разные облачные (платные или нет) модели — от Veo2 до GPT4o и даже до Flux Ultra.

Вот список моделей:
Black Forest Labs Flux 1.1[pro] Ultra, Flux .1[pro]

Kling 2.0, 1.6, 1.5 & Various Effects

Luma Photon, Ray2, Ray1.6

MiniMax Text-to-Video, Image-to-Video

PixVerse V4 & Effects

Recraft V3, V2 & Various Tools

Stability AI Stable Image Ultra, Stable Diffusion 3.5 Large

Google Veo2

Ideogram V3, V2, V1

OpenAI GPT4o image

Pika 2.2

Думаю, список будет расширяться.

Но почему я думаю, что это тектоника плит?

Комфи таким образом превращается в аггрегатор моделей, коммерческих в том числе. Ну то есть он одной ногой влезает на поляну, где топчутся Fal.ai или Replicate, а другой - на поляну где рядятся Krea и Freeplik и Флора.

Вот если бы кто-то ввалил им денег и они бы написать нормальную UI морду ПОВЕРХ макаронных изделий, что был бы хит (SwarmUI - это очень-очень плохо, как по замыслу, так и по исполнению).

В общем шаг исторический.

https://blog.comfy.org/p/comfyui-native-api-nodes

@cgevent
👍6
Media is too big
VIEW IN TELEGRAM
🤖 AgenticSeek: бесплатная локальная альтернатива Manus AI

AgenticSeek представляет собой 100% локальную альтернативу Manus AI — голосовой ИИ-ассистент, который просматривает веб, пишет код и планирует задачи, сохраняя все данные на вашем устройстве.

Ключевые преимущества:
🔒 Полностью локальный и приватный. Ваши файлы, беседы и поисковые запросы остаются у вас.

🌐 Умный веб-браузинг — AgenticSeek может самостоятельно просматривать интернет: искать, читать, извлекать информацию, заполнять веб-формы — всё без вашего участия.

💻 Автономный помощник для разработки — нужен код? Он может писать, отлаживать и запускать программы на Python, C, Go, Java и других языках.

🧠 Интеллектуальный выбор агентов — вы спрашиваете, он автоматически подбирает лучшего агента для задачи.

📋 Планирует и выполняет сложные задачи — от планирования поездок до комплексных проектов — может разбивать большие задачи на этапы и выполнять их с помощью нескольких ИИ-агентов.

🎙 С голосовым управлением — чистый, быстрый, футуристичный голос и распознавание речи, позволяющие разговаривать с ним как с вашим персональным ИИ из научно-фантастического фильма.

Технические особенности:
• Поддержка различных LLM-провайдеров: Ollama, lm-studio, OpenAI API и др.
• Работает с моделями от 7B до 70B+ (рекомендуется от 14B и выше)
• Распознавание и синтез речи работают полностью локально
• Поддержка нескольких языков
• Автоматический старт всех необходимых сервисов через Docker

Для работы требуется хотя бы GPU с 12 ГБ VRAM, но для полноценного использования рекомендуется 24+ ГБ.

Теперь бесплатный Манус есть у нас дома. :)

#AgenticSeek #LocalLLM #агенты #deepresearch
———
@tsingular
🔥11👍2🤯2🆒2
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Anthropic API теперь с веб-поиском для Claude

Anthropic запустил новую функцию веб-поиска в своем API — теперь Claude может получать доступ к текущей информации со всего интернета.

Это серьезно расширяет возможности для разработчиков, которые теперь могут создавать приложения с актуальными данными.

Когда Claude получает запрос, требующий актуальной информации или специализированных знаний, он использует свои способности рассуждения, чтобы сначала определить, поможет ли инструмент веб-поиска предоставить более точный ответ.

При необходимости модель генерирует поисковый запрос, анализирует результаты и предоставляет комплексный ответ со ссылками на источники.

Техническая начинка:
• Claude может работать как агент, проводя несколько последовательных поисков, используя ранние результаты для формирования последующих запросов

• Каждый ответ включает цитаты с материалами, позволяя пользователям проверять информацию
• Настраиваемые списки разрешенных и заблокированных доменов — можно указать, из каких источников Claude может получать информацию
• Управление функцией на уровне организации через админ-настройки

Практическое применение:
• Финансовые сервисы: анализ цен акций в реальном времени, рыночных трендов и нормативных обновлений
• Юридические исследования: доступ к недавним судебным решениям и правовым новостям
• Инструменты для разработчиков: использование последней документации API и технологических обновлений
• Повышение продуктивности аналитиков через доступ к последним отчетам и исследованиям

Функция веб-поиска также интегрирована в Claude Code, что особенно ценно при работе с новыми или быстро развивающимися фреймворками и библиотеками.

Важно: Сервис доступен для моделей Claude 3.7 Sonnet, обновленной Claude 3.5 Sonnet и Claude 3.5 Haiku по цене $10 за 1000 поисковых запросов ПОВЕРХ стандартной стоимость токенов моделей.

#Claude #API #поиск #агенты
———
@tsingular
🔥5
Media is too big
VIEW IN TELEGRAM
Удобно, конечно, что теперь результаты поиска можно представить сразу в виде приложения наглядного.

Gemini 2.5 pro preview 0506 - такое рисует за 95 секунд.

Код в комментарии.

#gemini #timeline
———
@tsingular
🔥511
Forwarded from AI Insider
Morgan Stanley прогнозирует, что к 2050 году в мире будет эксплуатироваться более 1 миллиарда человекоподобных роботов, что принесет совокупный доход около 5 триллионов долларов за следующие 25 лет.

В отчете прогнозируется, что к середине 2030-х годов число установленных устройств, в настоящее время исчисляемое десятками тысяч, вырастет до миллионов.

Для сравнения, Илон Маск считает, что к 2040 году в мире будет насчитываться не менее 10 миллиардов человекоподобных роботов, каждый из которых будет стоить от 20 000 до 25 000 долларов США 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4👾2🤨1
Forwarded from CodeCamp
Figma ночью устроили маленькую ИИ-революцию — теперь это уже не просто редактор интерфейсов, а конструктор сайтов, приложений и даже маркетинга.

Чуваки показали 4 интересных нейро-фичи, если в двух словах:

— Можно сгенерить сайт из шаблона, добавить анимации и прокрутку — и сразу опубликовать;
— Можно описать приложение промтом, а Claude соберёт прототип с редактируемым дизайном;
— Можно рисовать векторную графику прямо в Figma — кисти, текстуры, иллюстрации, мини-Illustrator у нас дома;
— А если вдруг вы маркетолог — для вас сделали генератор бренд-контента для соцсетей, презентаций и рассылок.

Судя по всему, Figma до последнего ждали, что их купит Adobe, и только теперь начинают релизить прикольные штуки 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15
Media is too big
VIEW IN TELEGRAM
Дженсен Хуан интересно так говорит, что - ИИ создает новый тип работы по созданию ПО, фундаментально меняя принципы его написания и работы.

И что следующая волна, это Фабрики ИИ.

«Одна фабрика ИИ мощностью 1 гигаватт может приносить 60 миллиардов долларов в год»

Такая вот простая математика станков по печатанию денег.
Гигаватты в миллиарды $.

#Jensen #Huang #newdev
———
@tsingular
5❤‍🔥3🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Heygen Avatar IV

Хейген под День Радио выпустил новую фичу, которая позволяет генерить естественные видео ролики просто по 1 фото и тексту.

Что он делает:
1. Берет текст и анализирует стиль, тон, ритм, эмоции
2. Создает детали движений - наклоны головы, естественные паузы, микродвижения мускулов, моргания и т.д.
3. На основе всего генерит абсолютно реалистичное видео озвучки текста.

С праздником :)

#heygen #avatariv
———
@tsingular
🔥29👍93🆒2
Изобретён метод обучения фотонного ИИ

Исследователи из Пенсильванского университета создали первый оптический нейроморфный процессор, способный обучать нейросети с помощью света, а не электричества.

Технология позволяет ускорить работу ИИ и снизить энергопотребление в 100 раз.

Потенциально это откроет путь к полностью оптическим вычислительным системам.

#PhotonComputing #Фотоны #кратко
------
@tsingular
🔥2311👍2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Управление камерой для генерации картинок в chatGPT.

Получается такой одновременный отлет и outpaint картинки.

Промпт: Представь себе вид с дрона с высоты 200 метров, смотрящего прямо вниз. Подумайте, сколько деталей ты увидишь с такой высоты. А теперь напиши промпт, который четко описывает эту сцену, и создай изображение.

Imagine a drone view from 500 feet above, looking straight down. Think of all the details you'd see from that height. Now, write a prompt that describes this scene clearly and create an image.

Можете попробовать другие виды камер\ракурсов вместо drone view.

Тут забрал

@cgevent
51
С Праздником! С 80 летием Великой Победы!

В школе у нас в кабинете истории был большой макет парка монумента Родина-Мать зовет.
И каждый май приходили ветераны ( это середина 90х, - многие еще были живы), рассказывали каким трудом и подвигом народа была достигнута победа и как мы должны беречь мир.

Вчера были в Парке победы на поклонной горе в Москве и там, оказывается, открылся огромный 3х этажный музей с историей войны прошлого века и современных событиях.
Если будет возможность на майских сходить, - рекомендую.
Сегодня, кстати, сказали там бесплатный вход везде.

Всем мира и с Праздником!

(В продолжение эстафеты Сергея с ИИ генерациями к Дню Победы)

#victoryday
———
@tsingular
🔥28👍11🎉65🕊1🤗1
NVIDIA открыла исходный код моделей Open Code Reasoning - 32B, 14B и 7B - лицензировано APACHE 2.0 🔥

> Превосходит O3 mini и O1 (низкий) на LiveCodeBench 😍

Модели в среднем на 30% эффективнее других эквивалентных моделей Reasoning.

Работает с llama.cpp, vLLM, transformers, TGI и другими — проверьте их сегодня!!


🟢Models
🟢Dataset
🟢Paper
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤‍🔥1👍1