Точки над ИИ – Telegram
Точки над ИИ
12.9K subscribers
622 photos
834 videos
3 files
871 links
• Учимся системной работе с AI
• Провожу консультации для бизнеса и команд
• В канале удобная навигация, любой AI-сервис в закрепленном посте

Автор: Ваня Юницкий – CEO VOIC LAB (voic.tech)

Реклама: @hello_voic

Чат канала: https://rb.gy/x2q2wx
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
На Маркете появился ИИ-агент. Конечно, я не удержался и протестировал его

Но! Вместо обычной просьбы "подбери подарок другу" я решил закрутить задачу посложнее. Дал ему ту самую классическую головоломку про родственные связи: когда нужно вычислить, кто кому приходится.

Удивительно, но многие модели до сих пор валятся на таких простых, казалось бы, задачках. ИИ-агент справился уверенно. Правильно вычислил персонажа и сразу предложил варианты подарков. В моем случае — получилась подходящая подборка шпионских подарков для моей гипотетической внучки 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
👍279🔥4🤝21
This media is not supported in your browser
VIEW IN TELEGRAM
Рубрика: ваши проекты.
(может нужна нам такая, как думаете?😏)

Классный кейс для повседневного использования.

Сергей прислал в чат, как он собирает для себя интерактивные учебники в Gemini 3.

Конкретно этот про этапы AI-native разработки, с тестами и пояснениями.

Потестить можно тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15💯433
This media is not supported in your browser
VIEW IN TELEGRAM
А вот легендарный апскейлер Topaz Labs теперь доступен в ComfyUI

(вообще странно, что только сейчас)

Видео апскейл 4K
- Astra: Diffusion Creative Upscale
- Starlight Fast: Диффузионный точный апскейл
- Аполлон: интерполяция кадров

Улучшение изображения 8K
- Bloom: увеличение изображения и улучшение лица

Ну а до 4K мне нравится апскейлить в новой Банане. Тем более гугл насыпал 300$ кредитов.

Пробовать тут.
Подробнее тут.

#imageEditing@TochkiNadAI #videoEditing@TochkiNadAI
12👍7🔥53
This media is not supported in your browser
VIEW IN TELEGRAM
У LTX появилась новая фича – Retake.

Она про пересмотр отдельных кадров после того, как они уже созданы. Причем это и про реальные кадры съемок и про сгенерированные видео.

Можно перефразировать диалоги, переосмыслять эмоции или действия и переосмыслять моменты, не переделывая всю сцену целиком.

Кстати, обратите внимание, как LTX начали становиться похожими на Хиггсфилд в подаче обновлений 🐹

#videoEditing@TochkiNadAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1896🔥1💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Не знаю как вас, а меня пугает ветка развития антропоморфных роботов.

Автоматизация рутинных дел и ,как следствие, потеря работы для некоторых профессий – это меньшее из зол.

Военная отрасль, силовые ведомства – вот где развернется настоящий киберпанк, вот где становится неуютно 💀

Ну а на видео двуногий робот MagicLab Z1, теперь он крутит сальто и восстанавливается после падений с человеческой скоростью.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯2213🤯6👍3👎1🔥1
«Прожарка» специалистов по машинному обучению от ChatGPT!

Это небольшой отрывок из подкаста «Криптонит говорит» об искусственном интеллекте и машинном обучении — ИИ задаёт неудобные вопросы и прогнозирует, когда он всех заменит.

📺 VK Видео
📺
YouTube
📺 Rutube
💬
Подкаст в телеграме
🎵 Яндекс.Музыка

Смотрите и подписывайтесь на подкаст «Криптонит говорит» — обсуждаем айти, искусственный интеллект, языки программирования и криптографию.

Реклама АО НПК «Криптонит» ИНН 9701115253 Erid: 2Vtzqvdp3kV
🤝4👍3👎2🤣21🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
😁4👍321🔥1
Media is too big
VIEW IN TELEGRAM
ИИ кино.

Kavan Cardoza снимает генерит довольно качественный стаф. Это один из эпизодов его работ, вот тут можно посмотреть остальные.

Смотрел бы я полный метр такого кино? Скорее пока нет. Не нашлось пока что сюжета, который поглотил бы настолько, что мне было бы интересно смотреть 2 часа сгенерированной истории. Но зато я прекрасно представляю себе подобные работы в рамках всяких Блэк Миррор и Любовь, смерть Роботах. Ну и в качестве игровых сюжетных вставок.

Много слышу споров (вы, наверняка, тоже), о том, будет ли ИИ-реклама / кино востребованным. Замечаю, что особенно увлеченно спорит сторона, чей бизнес / проекты завязаны на классический продакшен. Часто вижу за аргументами подсознательную защиту / страх нового / потерю контроля, абсолютно понимаю этих людей.

Еще есть популярное мнение о том, что ИИ-контент станет уделом "бедных" компаний, а классический продакшен будет подчеркивать статус бренда.

Лично я считаю, что классический продакшен практически не будет существовать без связи с ИИ. Это логично, так как есть масса инструментов, которые упрощают процесс на разных этапах, позволяют создавать быстрее и дешевле в формате комбинированных съемок, все, от раскадровок до монтажа, работы со светом, мокапы и т.д.

Не нужно бояться, но и не стоит закрываться. Использование ИИ в продакшене – это далеко не всегда про full-generative.
2👍17💯642👏1
Для тех, кто следит за прикладным ИИ

МЧС тестирует нейросеть, которая оформляет протокол осмотра места пожара за секунды вместо часа. ИИ анализирует фото с места происшествия, выделяет ключевые объекты и формирует описание — всё это на базе Yandex AI Studio.

Пока пилот идёт в Академии ГПС МЧС, но дальше — масштабирование по стране.
Технология может пригодиться и в других отраслях — например, в страховании или промышленной безопасности.
🤝2112🔥7👍2👎1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
Друзья, бежим срочно в Kimi

Там в Slides завезли Нану Банану Про бесплатно до конца выходных. Я сейчас генерю, как раз:

Сперва он генерит структуру, показывает вам все в текстовом виде с разделением на слайды.

Далее выбираете стиль (нужно выбрать первый, это и будет новая Банана).

Потом смотрите в течение 5 минут загрузочную анимацию на китайском, и редактор начнет вам показывать по 1-2 слайда по мере готовности (это, кстати, клево, для сдвгшников – рай).

Генерит со скоростью чуть дольше, чем Банана Про 4K в AI Studio.

Так как итоговая преза сгенерится цельными картинками с текстом на них – Kimi даст вам редактировать, но поверх презы.

Энджой!

#presentation@TochkiNadAI
👍14🔥5🤩332
А видели как клево новый Gemini умеет в юмор?

Помню, еще полгода назад SOTA-модели очень плохо умели шутить.

Для контекста: сегодня один клуб креативных директоров, за чатиком которого я подглядываю, собрался на встречу-тусовку в сеттинге тайных сообществ.

Так как я живу аж в другом полушарии – могу только картинки генерить, вместо встреч. Иду в Gemini+Banana.

Промпт супер простой:
сгенери страницу в стиле Википедии с юмором на тематику про тайный орден рекламщиков, (название отсылает к тендерам)


И вот он выдал это.

Обратите внимание, как он хорошо подружил несколько слоев – стайл Википедии, тематику тайных орденов и внутрянку топик-тем и шуток рекламной индустрии, и собрал все это в складную историю.

Но главное – как он красиво закончил описание идолом ИИ-генерации. К слову, в этом же чатике нередко разворачиваются обжигающие споры о том – отнимет/не отнимет ИИ работу, клиентов и душу у рекламной отрасли 🐶
Please open Telegram to view this post
VIEW IN TELEGRAM
130😁20🔥74👍2🤯1
Робот сочинит симфонию?

В Штатах обновили правила по AI-патентам. Наконец решили буквой закона вечный спор.

Теперь будет так. Если идею придумал человек, даже с помощью AI, патент принадлежит ему. AI считается не соавтором, а просто инструментом.

Патентуют не промпт, а изобретение. Раньше, при предыдущей версии правил, USPTO требовало анализировать, внес ли человек значительный вклад в каждый пункт формулы изобретения через критерии, определнные регламентом.

Сейчас эта схема в прошлом. Если человек сам сформулировал идею, не важно, пользовался он генеративным AI или нет.
👍21🔥104
This media is not supported in your browser
VIEW IN TELEGRAM
Manus Browser - еще один браузер с агентами

Напомню что это.

Это когда агенту на базе LLM дают доступ к браузеру со всеми логинами, куками и вкладками. Он двигает мышкой, скроллит, кликает кнопки, заполняет формы и собирает данные так, как сделал бы живой ассистент.

Плюс работает с теми же платными инструментами, что и вы: CRM, SEO-панели, рекламные кабинеты, личные кабинеты маркетплейсов, он заходит в уже авторизованные сессии или просит вас где нужно авторизоваться.

Я писал про свой опыт использования таких браузеров от OpenAI и Perplexity.

Сейчас использую только Comet.

Manus же обещают одноразовую авторизацию под задачу, лог всех действий и отсутствие отдельного хранения паролей, агент пользуется тем, что уже есть в профиле.

Но здравый смысл никто не отменял: критичные штуки вроде банков, root-аккаунтов облаков лучше держать в отдельном профиле или вообще другом браузере, а самому Manus отдавать рутину уровня CRM, отчетов и ресерча.

Устанавливаем тут.

#browser@TochkiNadAI #Agents@TochkiNadAI
14👍8🔥2😁11
This media is not supported in your browser
VIEW IN TELEGRAM
Люблю когда так оформляют итерации пайплайна.

Тут: Nano Banana Pro → Qwen Edit → Veo 3
👍24🔥107😍321
А что у нас тут? А это новый Gen-4.5 от Runway!

Качество подросло, теперь генерится более кинематографичное движение и свет, объекты и персонажи двигаются с естественным весом, реалистично реагируют на свет, отражения и тени. Это особенно заметно в сценах с динамикой, жидкостью и сложной физикой.

Модель точнее откликается на промпт и мультимодальные запросы.

По внутренним тестам (хехе) Gen-4.5 обходит другие модели в text-to-video и делает это без потери скорости или роста затрат.

#videoGenerative@TochkiNadAI
🔥9👍4🎉311
Небольшой гайд по API Gemini 3

Главные новые ручки в API две:
thinking_level и media_resolution.

Первая задает, насколько глубоко модель думает:
low – когда нужен просто быстрый и дешевый ответ
high – когда важно качество рассуждений и сложные задачи.

Вторая управляет тем, насколько подробно модель разбирает картинки и видео, можно экономить токены на простом видео или, наоборот, выкрутить качество для слайдов и PDF с мелким текстом.

Показывают примеры вызовов из Python/JS/cURL, работу с инструментами вроде google_search и url_context, а еще thoughtSignature, это скрытые подписи рассуждений, которые надо передавать дальше, чтобы длинные диалоги и function calling не теряли нить.

Отдельно советуют не мудрить с промптами, оставить температуру 1.0 и, если нужен болтливый стиль попросить об этом прямо. Плюс есть раздел, как переехать с Gemini 2.5 и в каких задачах пока логично держать старые модели.

С полным гайдом можно ознакомиться тут.

#LLM@TochkiNadAI #coding@TochkiNadAI
👍11🔥43
This media is not supported in your browser
VIEW IN TELEGRAM
Вот для вдохновения еще один вайбкод-проект на Gemini 3.

Очень симпатичный нодовый интерфейс. Даже не верится, что все это выдает одна модель.
👍16🔥73🤩2
Пополнение в рядах агентов

Yandex B2B Tech запустила AI Search, эта штука позволяет бизнесу создавать собственных ИИ-агентов на базе поиска Яндекса.

И теперь компании смогут настраивать помощников, которые ищут актуальные и проверенные данные как в инете, так и во внутренних документах – презентациях, PDF-ках, базах знаний.

Такие агенты подойдут для аналитики рынка, мониторинга новостей, маркетинговых исследований и любых других задач, где нужна точная информация.

Можно выбрать модель, задать промпт, настроить фильтры по региону и сайтам, задать приоритеты источников. ИИ будет не только отвечать, но и указывать ссылки на первоисточники.
👍7🤝6🤓321
Преступлением было бы не упомянуть новую модель от Kling, О1

O1 теперь умеет:

– удалять и заменять объекты в видео
– менять освещение, фон, погоду
– синхронить все с камерой и движением объектов
– генерить в Full HD

Гайд тут.

#imageEditing@TochkiNadAI
8🔥5👍3