Технозаметки Малышева – Telegram
Технозаметки Малышева
8.25K subscribers
3.72K photos
1.39K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Технотренды
Google выкатил 601 бизнес-идею с нейронкой внутри.

— Есть конкретные кейсы под любую сферу: торговля, логистика, медиа, кодинг, телеком, наука и т.д.
— Под все расписаны реальные примеры от топовых мировых компаний по интеграции ИИ-агентов в бизнес.
— Уникальная информация в одном месте, фактически сотни готовых бизнес-идей с ИИ.


Забираем — тут.

😇 Техно
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥104🆒3👍2
Преждевременные смерти китайских AI-учёных (2022-2025)

В SCMP (Alibaba) вышел материал про серию неожиданных смертей ученых в Китае, которые занимались исследованиями в области ИИ.

🧠 Индустриальный контекст
Интересен профессиональный профиль погибших — все работали в стратегически важных направлениях:

- Компьютерное зрение — ключевая технология для систем наблюдения и автономных транспортных средств

- Военные AI-приложения — критический компонент современных оборонных технологий

- Медицинский ИИ — высококонкурентная область с огромным коммерческим потенциалом

🔄 Факторы давления в китайской AI-индустрии

Сверхскоростной цикл разработки — идеи устаревают ещё до завершения экспериментов

Конкуренция на опережение — публикация результатов становится гонкой с нулевой суммой

Этические дилеммы — моральная ответственность за потенциальные социальные последствия

Геополитический контекст — стресс от восприятия работы как части технологической войны

Практический вывод для технологических компаний:

Необходимы программы профилактики выгорания сотрудников и регулярный мониторинг здоровья, особенно для ключевых разработчиков.

Всех в санатории у моря. Прогулки в сосновом бору между митапами.
И РЭБ.

#SCMP #Китай #стресс #выгорание
——-
@tsingular
👍8😢6🤯4
Unsloth выпустил руководство по датасетам для файнтюнинга языковых моделей

Создание качественного датасета — ключевой момент в успешном файн-тюне.
Правильно подготовленные данные определяют, насколько хорошо модель усвоит нужные навыки и специализацию.

Основные форматы данных

Четыре ключевых типа датасетов:

📝 Raw Corpus — необработанный текст для продолжения предобучения (CPT)
🎯 Instruct — инструкции и примеры ожидаемого результата для SFT
💬 Conversation — диалоги между пользователем и AI для SFT
🔄 RLHF — диалоги с ранжированием ответов для обучения с подкреплением

Подготовка перед форматированием
Определите цель датасета
- Адаптация модели к конкретной задаче (суммаризация, Q&A)
- Обучение для специфической области (медицина, финансы)
- Настройка на определенный стиль общения

Выберите стиль вывода

Формат: JSON, HTML, код, текст
Язык: испанский, английский, русский и т.д.

Найдите источники данных
- Hugging Face, Wikipedia для готовых наборов
- Специализированные CSV, PDF или веб-ресурсы
- Синтетически сгенерированные данные

Форматы данных под разные задачи
Для предобучения (CPT):

{
"text": "Pasta carbonara is a traditional Roman pasta dish. The sauce is made by mixing raw eggs with grated Pecorino Romano cheese and black pepper..."
}


Для инструкций (Alpaca style):
{
"Instruction": "Task we want the model to perform.",
"Input": "Optional user query.",
"Output": "The expected result."
}


Для диалогов (ChatML):
{
"conversations": [
{
"from": "human",
"value": "Can you help me make pasta carbonara?"
},
{
"from": "gpt",
"value": "Would you like the traditional Roman recipe..."
}
]
}


Hugging Face формат:
{
"messages": [
{
"role": "user",
"constant": "What is 1+1?"
},
{
"role": "assistant",
"value": "It's 2!"
}
]
}

Генерация синтетических данных
Используйте мощные LLM (Llama 3.3 70B, GPT-4.5) для создания дополнительных примеров. Это помогает:

- Расширить существующий датасет
- Диверсифицировать данные, предотвращая переобучение
- Автоматически структурировать данные в нужном формате

Особенности мультимодальных моделей
Для моделей с возможностью обработки изображений (например, Llama 3.2 Vision):
[
{
"role": "user",
"content": [
{"type": "text", "text": "You are an expert radiographer..."},
{"type": "image", "image": image_data}
]
},
{
"role": "assistant",
"content": [
{"type": "text", "text": "This radiograph shows..."}
]
}
]

Практические советы

📊 Минимальный размер датасета: 100+ записей, оптимально 1000+
🧠 Для моделей с рассуждением: включайте в ответы пошаговое объяснение
🔄 Многократный файн-тюнинг: лучше объединить все датасеты и обучить за один раз

Качественная подготовка данных — это 80% успеха файн-тюнинга.
Иначе количество попыток может уйти в бесконечность.

#Unsloth #finetuning #datasets
———
@tsingular
🔥311👍1😐1
Дорогой Дедушка Мороз!
Пишет тебе мальчик 45ти годиков...

:)

(Apple Mac Studio M3 Ultra 512GB/8TB (MU973FN/A-CPU32-GPU80-512GB-8TB))

#железо #юмор
———
@tsingular
👍11😁8🦄1
Media is too big
VIEW IN TELEGRAM
n8n выпустили в релиз 1.88

В релизе помимо MCP клиент-серверных нод и поддержки Milvus, добавили Think tool, который позволяет запустить гарантированные рассуждения в моделях.

Обновляемся.

#n8n #think #переводы
———
@tsingular
🔥5❤‍🔥31
Media is too big
VIEW IN TELEGRAM
Виртуальное сообщество: 1000 ИИ-агентов в экосистеме Minecraft

Исследователи поместили тысячу искусственных интеллектов в мир Minecraft для наблюдения за формированием цифрового сообщества.

Виртуальные агенты демонстрировали самоорганизацию, создавая структурированные поселения и развивая примитивную экономику обмена.

Наблюдалось спонтанное возникновение иерархий и специализаций среди ИИ-существ без прямого программирования такого поведения.

Некоторые агенты занимались добычей ресурсов, другие строительством, а третьи выполняли защитные функции.

Данное исследование открывает новые перспективы для понимания эволюции сложных социальных систем и моделирования человеческих сообществ.

Следующий шаг — создать цифровой двойник каждого государства и моделировать поведение общества для тестирования социальных и политических гипотез.

#Minecraft #social
———
@tsingular
👀7🔥6👍41👾1
Forwarded from Не баг, а фича
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 В Grok появился свой Canvas — нейронка теперь может запускать код прямо в браузере и кроме того коннектиться с Google Drive. Из фишек:

🔅Запускает ЛЮБОЙ код на Python, C++, JS, TS, Bash и HTML;
🔅Через Google Drive можно включить свои документы, таблицы и презентации;
🔅Функционал абсолютно БЕСПЛАТНЫЙ.

Пробуем тут.

🙂 Не баг, а фича
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒7
Forwarded from Denis Sexy IT 🤖
У гугла начали появляться странные вакансии – ищут ресечера на «Пост-АИ» фазу мира

То есть, ученого, который начнет изучать влияние АИ на общество, машинное сознание и траектории к достижению «Сверх Искусственного Интеллекта»

Кажется уже все верят, что АИ скоро

Feel the AGI moment
🔥5💯4👍1🤔1
🤖 OpenAI представляет свежие гайды по внедрению ИИ в бизнес

Что такое ИИ-агенты и когда их создавать
OpenAI определяет агентов как системы, которые могут самостоятельно выполнять многоэтапные задачи. По сути — это LLM с "руками" (API и функциями) и четкими инструкциями.

Самое важное здесь — агенты нужны там, где традиционная автоматизация не справляется:
• Сложные рабочие процессы с определёнными мелкими шагами
• Запутанные правила, которые сложно поддерживать
• Работа с неструктурированными данными
Технически это симбиоз трёх компонентов:
• Базовая модель (предлагают начинать с мощной, оптимизировать потом! Обычно все делают наоборот)
• Инструменты (API для получения данных и действий)
• Чёткие инструкции (пошаговые, без двусмысленностей)

Архитектура агентов
Разделяют два основных подхода:
• Single-agent: начинаем с одного агента, постепенно добавляем инструменты
• Multi-agent: когда становится сложно, подключаем либо центрального "Менеджера", либо децентрализованную систему передачи задач

Не забыли про защиту: OpenAI рекомендует многоуровневую оборону с классификаторами, фильтрами PII и триггерами для передачи задачи на контроль человеку.

Как найти применимость ИИ в бизнесе
OpenAI выделяет три главных направления:
• Автоматизация рутины (очевидно)
• Преодоление дефицита навыков (усиление возможностей существующих команд)
• Навигация в условиях неопределенности (катализатор идей и анализа)

И шесть базовых примитивов использования:
• Создание контента
• Исследования
• Стратегия/генерация идей
• Анализ данных
• Программирование
• Автоматизация

Приоритезация по матрице "Влияние/Усилия" — ничего нового, но работает.

Реальные уроки от компаний, уже внедривших ИИ
Собраны кейсы из опыта Morgan Stanley, Indeed, Klarna и других

Самое интересное: OpenAI сами поставили себе цели по автоматизации с ИИ во внутренних процессах.

В целом, с чего стоит начать:
1. Начинать с простых агентов для конкретных задач
2. Обязательно строить систему оценки и безопасности с самого начала
3. Отдавать инструменты в руки специалистам, а не изолировать в ИТ
4. Кастомизировать под свои данные

И самое главное — не бояться экспериментировать.

#Agents #Enterprise #OpenAI #кейсы
———
@tsingular
🔥7👍52
Forwarded from Machinelearning
🖥 OpenAi представлют новые модели o-серии (o3 и o4-mini)

OpenAI утверждает, что эти модели способны генерировать новые и полезные идеи.

Обе будут добавлены с сегодняшнего дня в ChatGPT и API.

Эти ризонинг модели стали лучше использовать внутренние инструменты для решения сложных задач.

Модель o3 установила новый рекорд на AIME 2025 с точностью 98.4%.

А вот o4-mini, набрала 99.5% — лучший результат среди всех моделей.

На Codeforces модели набирают более 2700 баллов, что помещает их в число 200 лучших программистов в мире!

На Humanity Last Exam её показатели находятся на уровне флагманской модели Deep Research.

API — о3 сильно дешевле о1: 10/40$ вместо 15/60$, а o4-mini будет доступна для БЕСПЛАТНЫХ пользователей

С помощью внутренних инструментов модель также умеет рассуждать и работать с изображениями (например, использовать Python для их преобразования).

Эти способности к рассуждению достигнуты благодаря масштабированию как во время обучения, так и во время инференса.

Трансляция: https://www.youtube.com/watch?v=sq8GBPUb3rk

@ai_machinelearning_big_data

#openai
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍2
о4-мини всё ещё хуже, чем Sonnet 3.7 в написании сонетов.

полный венок, - это epic fail.
оставлю в комментарии

#OpenAI #o4mini
———
@tsingular
❤‍🔥32🤔2😢1
Media is too big
VIEW IN TELEGRAM
Давайте сделаем наоборот.
я вот прямо сейчас по такому промпту

write a html with simulation of ultranova
must be physically as realistic as possible and visually stunning
use any necessary libraries, which would fit the best


генерю сверхновую в Gemini2.5-exp0325.

Кто сделает лучше с OpenAI новым или чем-то ещё - велкам с примерами в комменты.

мне о4-мини так ничего сносного не создала

#Gemini2-5-ep0325 #dev
———
@tsingular
🔥92
Media is too big
VIEW IN TELEGRAM
Sonnet 3.7 thinking

Достоин отдельного поста :)

#Sonnet #dev
———
@tsingular
🔥9😁61👍1
Forwarded from Tensor Banana
wan vace 1.3b video2video + depth + ghibli lora

- используется карта глубины для направления движения
- попросил chatgpt гиблифицировать несколько кадров для референса
- чтобы картинки-референсы лучше воспринимались, их композиция должна полностью совпадать композиции видео
- первый и последний кадр я тут не использовал, по причине того, что chatgpt меняет композицию картинки. Из-за этого движение будет не там где надо. Но можно заморочиться, сделать нужную композицию совпадающую с движением карты глубины. Будет лучше, особенно если еще и конечный кадр добавить.
- вместо depth anything можно попробовать другой контролнет, например openpose, но я не тестил
- чтобы карта глубины не слишком сильно влияла на конечное анимешное видео, я ее инвертирую и делаю меньшую контрастность (делаю белой). Если так не делать, в итоге будут люди из фильма, а не анимешные персонажи

vace также поддерживает маски.
- черный цвет - оставляет без изменений
- белый цвет - переделывает
- маски можно использовать, например, для сохранения исходного лица.
- для создания масок можно использовать segment anything (SAM2, не используется в этом воркфлоу, nsfw примеры есть тут: https://news.1rj.ru/str/tensor_art/410 )

Скорость на 3090:
81 кадр (5s) 640x480 20 шагов - 3 минуты
vram - 16 GB

1.3b поддерживает длину ролика до 81 кадров. Если длиннее, то будут визуальные артефакты (видно в первой сцене)

wan + vace ноды: https://github.com/kijai/ComfyUI-WanVideoWrapper
Depth-Anything ноды: https://github.com/DepthAnything/Depth-Anything-V2
ghibli lora 1.3b: https://civitai.com/models/1474964
workflow: https://github.com/Mozer/comfy_stuff/blob/main/workflows/wan_1_3B_VACE_v2v_with_depth_and_lora.json
👍1411
Добавляем в штатное расписание:

Chief postAGI Officer

Раньше футурологи смотрели на 100 лет вперёд и рассказывали фантастику.

Теперь для того же эффекта достаточно смотреть вперёд на 3-5 лет.
А это уже не футурология, а бизнес-планирование.

#futurology #мысли
------
@tsingular
👍12722🔥2
Forwarded from эйай ньюз
А вот и первые независимые бенчи o4-mini

Artificial Analysis уже протестили o4-mini и прямо сейчас тестят o3. Модель очень хорошо себя показывает на всех бенчах, но есть и отличия — по сравнению с данными OpenAI HLE заметно выше, а GPQA немного ниже. Но это нормально — результаты на бенчмарках всегда немного отличаются между разными прогонами, особенно когда сетап немного отличается.

В целом вышла очень хорошая модель — даже лучше чем o3 на визуальных тасках, судя по заявлениям сотрудников OpenAI. А теперь представьте что сможет полноценная o4.

@ai_newz
🔥6👍3
Forwarded from e/acc
IQ тест для моделей (тест можете сами попробовать пройти, посмотрим сможет ли кто-то из чата догнать о3)
Forwarded from EFEMERA: AI news
Дрон с ИИ впервые одержал победу над чемпионами в гонках

◯ Дрон с ИИ, разработанный Делфтским технологическим университетом, победил в конкурсе A2RL Grand Challenge
В турнире он обошёл 3 экс-чемпионов DCL, развив скорость до 95,8 км/ч
◯ Нейросеть управляла моторами дрона, минуя традиционные контроллеры
◯ Технология была разработана ESA для космических аппаратов
◯ Дрон функционировал с одной камерой и минимальными вычислительными ресурсами
◯ ИИ обучался методом проб и ошибок, что способствовало успеху
◯ Цель чемпионата - расширение возможностей и стимулирование исследований в области ИИ

@EF9MERA

Источник
👀1142👍2
ТРИЗбот!

А вот это интересно.

@trizchatgptbot - бот по ТРИЗ!

#боты #ТРИЗ
------
@tsingular
👏84💯3🆒1