Новые инструменты от Google
Google представил несколько интересных обновлений в сфере ИИ:
1. Jules – AI-агент для программистов
Подключается к GitHub, анализирует код с помощью Gemini 2.5 Pro, предлагает изменения и даже может кратко объяснить их в аудиоформате. Пока в бета-тесте – доступ через лист ожидания
2. Живой перевод в Google Meet с сохранением голоса
Пока работает только с английским и испанским, но скоро добавят итальянский, немецкий и португальский. Функция уже доступна платным подписчикам, а для бизнеса откроется к концу года
3. Veo 3 – генерация видео со звуком
Новая модель умеет создавать не только видео, но и звуки, музыку и даже диалоги. Пока доступна только в подписке Gemini Ultra ($250/мес)
4. Imagen 4 – улучшенная генерация изображений
Лучше рисует текст и детали. Доступна в приложении Gemini
5. Gemini 2.5 Pro с режимом Deep Think
Модель анализирует несколько вариантов ответа перед тем, как дать окончательный. Пока в тестировании – ждем релиза
Google представил несколько интересных обновлений в сфере ИИ:
1. Jules – AI-агент для программистов
Подключается к GitHub, анализирует код с помощью Gemini 2.5 Pro, предлагает изменения и даже может кратко объяснить их в аудиоформате. Пока в бета-тесте – доступ через лист ожидания
2. Живой перевод в Google Meet с сохранением голоса
Пока работает только с английским и испанским, но скоро добавят итальянский, немецкий и португальский. Функция уже доступна платным подписчикам, а для бизнеса откроется к концу года
3. Veo 3 – генерация видео со звуком
Новая модель умеет создавать не только видео, но и звуки, музыку и даже диалоги. Пока доступна только в подписке Gemini Ultra ($250/мес)
4. Imagen 4 – улучшенная генерация изображений
Лучше рисует текст и детали. Доступна в приложении Gemini
5. Gemini 2.5 Pro с режимом Deep Think
Модель анализирует несколько вариантов ответа перед тем, как дать окончательный. Пока в тестировании – ждем релиза
👍3🤯1
ИИ может писать код локально на вашем ПК
Французская компания Mistral AI выпустила новую языковую модель с открытым кодом Devstral, созданную для автоматизации задач программирования. Самое интересное - как сообщают разработчики, система способна функционировать даже на компьютерах с ограниченными ресурсами — например, на ПК с одной видеокартой Nvidia RTX 4090 или MacBook, оборудованном 32 ГБ оперативной памяти
Французская компания Mistral AI выпустила новую языковую модель с открытым кодом Devstral, созданную для автоматизации задач программирования. Самое интересное - как сообщают разработчики, система способна функционировать даже на компьютерах с ограниченными ресурсами — например, на ПК с одной видеокартой Nvidia RTX 4090 или MacBook, оборудованном 32 ГБ оперативной памяти
🔥3
Андрей Карпатый (сооснователь OpenAI) выложил чеклист по моделям — сохраняем, чтобы не тыкать наугад:
- o3 — для решения сложных задач
- 4o — повседневная рабочая лошадка
- 4.1 — топ для написания кода
- 4.5 — для креатива
- Deep Research — для исследований
Теперь вы тоже можете выбирать как профи
- o3 — для решения сложных задач
- 4o — повседневная рабочая лошадка
- 4.1 — топ для написания кода
- 4.5 — для креатива
- Deep Research — для исследований
Теперь вы тоже можете выбирать как профи
👍2❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Генератор видео Sora доступен бесплатно в Bing
Microsoft запустила Bing Video Creator на основе модели Sora от OpenAI.
Пока он доступен бесплатно в мобильном приложении Bing (Android/iOS), но не в браузере — поддержка десктопной версии ожидается в ближайшее время.
Microsoft запустила Bing Video Creator на основе модели Sora от OpenAI.
Пока он доступен бесплатно в мобильном приложении Bing (Android/iOS), но не в браузере — поддержка десктопной версии ожидается в ближайшее время.
🔥2👍1
Нейросеть, которая делает игры по текстовому запросу
Tencent представили модель Hunyuan-GameCraft
Ее обучили на куче геймплейных видео из топовых игр вроде Cyberpunk 2077 и Assassin’s Creed
Google и Microsoft тоже экспериментируют с подобным, но у Tencent есть серьёзный козырь — они сами гигант игровой индустрии (вспомним их доли в Epic, Riot и тд). Так что их AI выглядит особенно убедительно
Tencent представили модель Hunyuan-GameCraft
Ее обучили на куче геймплейных видео из топовых игр вроде Cyberpunk 2077 и Assassin’s Creed
Google и Microsoft тоже экспериментируют с подобным, но у Tencent есть серьёзный козырь — они сами гигант игровой индустрии (вспомним их доли в Epic, Riot и тд). Так что их AI выглядит особенно убедительно
🔥6❤1
Бесплатные AI-помощники для разработчиков
1. Google Gemini CLI
— Подключает AI к локальному коду
— Объясняет, исправляет и пишет код по запросу на естественном языке
— 60 запросов в минуту / 1000 в день (по словам Google, этого хватит с запасом)
2. Сбер GigaCode 2.0
— Генерирует до 40 подсказок в секунду
— Качество кода выросло в 2+ раза (65% vs 28% по LiveCodeBench)
— Поддержка 35 языков, включая Python, Java, C++
— Работает через GitVerse
1. Google Gemini CLI
— Подключает AI к локальному коду
— Объясняет, исправляет и пишет код по запросу на естественном языке
— 60 запросов в минуту / 1000 в день (по словам Google, этого хватит с запасом)
2. Сбер GigaCode 2.0
— Генерирует до 40 подсказок в секунду
— Качество кода выросло в 2+ раза (65% vs 28% по LiveCodeBench)
— Поддержка 35 языков, включая Python, Java, C++
— Работает через GitVerse
👍2
Читать научные статьи теперь просто
Бесплатная нейросеть Scholarcy может:
- Выделять главное в статьях
- Разбирать объемные работы и создавать карточки для запоминания
- Работать в браузере (есть расширения Chrome/Edge)
Бесплатная нейросеть Scholarcy может:
- Выделять главное в статьях
- Разбирать объемные работы и создавать карточки для запоминания
- Работать в браузере (есть расширения Chrome/Edge)
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen-VLo — бесплатный генератор изображений от Qwen.
- Поддерживает разные стили и редактирование (добавление/удаление объектов, смена деталей).
- Может наносить текст, но с кириллицей бывают ошибки.
Качество чуть ниже, чем у GPT-Images и Flux Kontext, зато работает быстро и без оплаты.
Попробовать можно в Qwen Chat
- Поддерживает разные стили и редактирование (добавление/удаление объектов, смена деталей).
- Может наносить текст, но с кириллицей бывают ошибки.
Качество чуть ниже, чем у GPT-Images и Flux Kontext, зато работает быстро и без оплаты.
Попробовать можно в Qwen Chat
👍4
ChatGPT тестирует режим учителя
Функция уже появилась у некоторых пользователей
Чат не даёт готовых ответов, а задаёт уточняющие вопросы, адаптирует сложность материала и стимулирует критическое мышление
Алгоритм также будет анализировать прогресс пользователя и возвращаться к сложным темам
Дата релиза пока неизвестна
Функция уже появилась у некоторых пользователей
Чат не даёт готовых ответов, а задаёт уточняющие вопросы, адаптирует сложность материала и стимулирует критическое мышление
Алгоритм также будет анализировать прогресс пользователя и возвращаться к сложным темам
Дата релиза пока неизвестна
🔥2😡1
Baidu выложила в открытый доступ свои ИИ-модели Ernie-4.5
Есть модели разного размера:
- Маленькая (0,3 млрд параметров)
- Мощная (300 млрд параметров)
- Умеющая работать с текстом и изображениями (424 млрд параметров)
Самые большие модели работают так же хорошо, как GPT-4.1 и DeepSeek-V3.
Модели доступны на Hugging Face, их можно скачать и использовать для обучения
Есть модели разного размера:
- Маленькая (0,3 млрд параметров)
- Мощная (300 млрд параметров)
- Умеющая работать с текстом и изображениями (424 млрд параметров)
Самые большие модели работают так же хорошо, как GPT-4.1 и DeepSeek-V3.
Модели доступны на Hugging Face, их можно скачать и использовать для обучения
👍4
Учёные разработали нейросеть, которая мыслит по-человечески
Вот как им это удалось:
— Взяли базовую модель LLaMa 3.1 и дообучили её на данных Psych‑101 — 10 млн решений 60 тысяч людей в 160 экспериментах (память, логика, внимание и др.);
— В результате получили Centaur — ИИ, чьи решения почти неотличимы от человеческих
Теперь у науки есть универсальный симулятор поведения: можно предсказывать реакцию на законы, моделировать психологические исследования или тестировать дизайн интерфейсов
Вот как им это удалось:
— Взяли базовую модель LLaMa 3.1 и дообучили её на данных Psych‑101 — 10 млн решений 60 тысяч людей в 160 экспериментах (память, логика, внимание и др.);
— В результате получили Centaur — ИИ, чьи решения почти неотличимы от человеческих
Теперь у науки есть универсальный симулятор поведения: можно предсказывать реакцию на законы, моделировать психологические исследования или тестировать дизайн интерфейсов
🔥3
MTVCraft — ИИ для генерации видео со звуком
Разработка принадлежит Пекинской академии ИИ. За обработку текстовых запросов отвечает Qwen3, а за озвучку — ElevenLabs. Затем нейросеть объединяет всё в готовый ролик.
Модель пока уступает Veo 3, но тенденция очевидна: наступила эра генераторов видео со звуком.
Протестировать модель можно бесплатно на Hugging Face. Время обработки — 8–10 минут на один запрос.
Разработка принадлежит Пекинской академии ИИ. За обработку текстовых запросов отвечает Qwen3, а за озвучку — ElevenLabs. Затем нейросеть объединяет всё в готовый ролик.
Модель пока уступает Veo 3, но тенденция очевидна: наступила эра генераторов видео со звуком.
Протестировать модель можно бесплатно на Hugging Face. Время обработки — 8–10 минут на один запрос.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Dolphin от ByteDance: умный PDF-конвертер с сохранением форматирования
Китайский гигант представил новый OCR-инструмент, который:
- Разбирает PDF на текст, таблицы, изображения
- Собирает документ Word без потери форматирования
Бесплатное демо
GitHub
Китайский гигант представил новый OCR-инструмент, который:
- Разбирает PDF на текст, таблицы, изображения
- Собирает документ Word без потери форматирования
Бесплатное демо
GitHub
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная новость для разработчиков: Компания Amazon представила свою новую ИИ-интегрированную среду разработки под названием Kiro
Это решение напоминает Cursor, но оснащено собственным движком и рядом интеллектуальных функций
Ключевые особенности:
- Спецификации проекта сохраняются в памяти нейросети, даже при переполнении контекста.
- Автоматическое обновление README при внесении изменений в код.
- Поддержка VS Code и кросс-платформенная работа.
Пока Kiro доступен бесплатно. Проект находится в стадии бета-тестирования
Это решение напоминает Cursor, но оснащено собственным движком и рядом интеллектуальных функций
Ключевые особенности:
- Спецификации проекта сохраняются в памяти нейросети, даже при переполнении контекста.
- Автоматическое обновление README при внесении изменений в код.
- Поддержка VS Code и кросс-платформенная работа.
Пока Kiro доступен бесплатно. Проект находится в стадии бета-тестирования
🔥2❤1
Kimi K2 — мощная и дешёвая альтернатива GPT-4 и Claude 4
Китайский стартап Moonshot AI выпустил Kimi K2 — модель с 1 трлн параметров (активируется 32 млрд на запрос).
Несколько преимуществ:
1. API в 3–5 раз экономичнее GPT-4 ($0.15 за вход, $2.5 за выход на 1 млн токенов).
2. Сильна в коде и математике: обгоняет GPT-4.1 в тестах на исправление багов (65.8% vs 54.6%).
3. Длинный контекст: 128K токенов — удобно для анализа больших документов.
Варианты использования:
- Бесплатно через веб-интерфейс (но функционал ограничен).
- Для разработки: API или локальный запуск (есть open-source версия)
Китайский стартап Moonshot AI выпустил Kimi K2 — модель с 1 трлн параметров (активируется 32 млрд на запрос).
Несколько преимуществ:
1. API в 3–5 раз экономичнее GPT-4 ($0.15 за вход, $2.5 за выход на 1 млн токенов).
2. Сильна в коде и математике: обгоняет GPT-4.1 в тестах на исправление багов (65.8% vs 54.6%).
3. Длинный контекст: 128K токенов — удобно для анализа больших документов.
Варианты использования:
- Бесплатно через веб-интерфейс (но функционал ограничен).
- Для разработки: API или локальный запуск (есть open-source версия)
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI анонсировали ChatGPT Agent — универсальный ИИ-ассистент
Он умеет:
- Полноценно работать в браузере
- Взаимодействовать с сайтами
- Выполнять команды в терминале
- Писать и редактировать код
- Обрабатывать таблицы и создавать презентации
В отличие от простых помощников, этот агент самостоятельно выбирает инструменты и оптимальный способ выполнения задачи.
Функция уже доступна для тестирования платным подписчикам в веб-версии
Он умеет:
- Полноценно работать в браузере
- Взаимодействовать с сайтами
- Выполнять команды в терминале
- Писать и редактировать код
- Обрабатывать таблицы и создавать презентации
В отличие от простых помощников, этот агент самостоятельно выбирает инструменты и оптимальный способ выполнения задачи.
Функция уже доступна для тестирования платным подписчикам в веб-версии
🔥4❤1