NEW BOT Телеграм, страница

Data, Stories and Languages

We ran over 600 image generations to compare AI models

https://latenitesoft.com/blog/evaluating-frontier-ai-image-generation-models/

Довольно интересный блогпост. Авторы работают над своим приложением для фото и их редактирования, и в ходе работы делали много экспериментов с тремя основными моделями: OpenAI (gpt-image-1), Gemini - gemini-2.5-flash-image (nanoBanana), Seedream (seedream-4-0-250828).

В блогпосте можно посмотреть много примеров и почитать про проблемы.

Общие выводы:
- Gemini отлично сохраняет детали и минимально галлюцинирует, но ценой этого являются частые отказы, особенно при запросах на редактирование фото людей. Нередко просто возвращает неизменённые картинки
- OpenAI часто изменяет детали фото (особенно в лицах людей), что является проблемой. И нередко добавляет оранжевый цвет (Hello Mexico :D). Но хорошо работает для креативных изменений.
- Seedream где-то посередине

#datascience

LateNiteSoft Blog

We ran over 600 image generations to compare AI models - LateNiteSoft Blog

We benchmarked OpenAI gpt-image-1, Google nanoBanana, and Seedream across 600+ real-world photo edits, see latency, cost, and quality by task

🔥3👍1

1.39K views07:36

Data, Stories and Languages

GPT-5.1: A smarter, more conversational ChatGPT

https://openai.com/index/gpt-5-1/

Никто не ждал, но вот новая версия подъехала! И не просто 5.1, а 5.1 Instant и 5.1 Thinking.

"""We heard clearly from users that great AI should not only be smart, but also enjoyable to talk to. GPT‑5.1 improves meaningfully on both intelligence and communication style.

We’re also making it easier for you to shape ChatGPT’s tone. Preferences on chat style vary—from person to person and even from conversation to conversation—so we’re introducing more intuitive and effective controls so ChatGPT can better match the tone you want in responses."""

Интересно, неужели вернули к спорному стилю, который был не так давно удалён?

"Earlier this year, we added preset options to tailor the tone of how ChatGPT responds. Today, we’re refining those options to better reflect the most common ways people use ChatGPT. Default, Friendly (formerly Listener), and Efficient (formerly Robot) remain (with updates), and we’re adding Professional, Candid, and Quirky. "
И дефолтные стили обновили

#datascience

😁4👍1🔥1

1.75K views19:28

Data, Stories and Languages

Lumine: Building Generalist Agents in 3D Open Worlds

Ресерчеры в Тиктоке, похоже, уже сделали всё что могли, осталось лишь развлекаться.

https://www.lumine-ai.org/

https://x.com/WeihaoTan64/status/1988853307587088616

Они натренировали агента для игры в... Genshin Impact. Полноценная трёхмерная игра с относительно открытым миром. Агент может пройти основную историю (которая занимает часов 5).

#datascience

X (formerly Twitter)

Weihao Tan (@WeihaoTan64) on X

🚀Introducing Lumine, a generalist AI agent trained within Genshin Impact that can perceive, reason, and act in real time, completing hours-long missions and following diverse instructions within complex 3D open-world environments.🎮

Website: https://t.co/UxSwNKGZml…

🔥6🤯2😁1

1.8K views09:34

Data, Stories and Languages

Study Mode в ChatGPT

Я вчера вспомнил, что в ChatGPT есть "study mode" и решил попробовать его. Впечатления пока смешанные. С одной стороны, он действительно помогает разобраться в некоторых вопросах. С другой стороны, он может слишком уж разжёвывать.

Один из вопросов, который я попробовал - "I want you to help me understand how to write code for calculating attention in pytorch".
Я сразу получил полную формулу, спорно, но окей. Пошли дальше.
И он стал давать такие "задачки", в которых я просто не вижу смысла.

Пример1:

ChatGPT:What line would you write for output = ... using torch.matmul(attnweights, V) to get shape (B, T, dk)?
Я: output = torch.matmul(attn_weights, V)
ChatGPT: Exactly right — that’s the clean and correct way

Следующий пример ещё веселее. Я попросил помочь с multihead-attention. "Диалог" можно увидеть на скриншоте.

Я использовал 5.1-Thinking.

Справедливости ради, если написать промпт получше (описать мои текущие знания, попросить двигаться по шагам, попросить не разжёвывать), результаты получаются более годными. И возможность задавать вопросы или попросить объяснить что-то по другому - очень удобно.

👍3😁2❤1

1.27K views09:32

Data, Stories and Languages

HunyuanImage 3.0 Technical Report

Очередная статья от Tencent. HunyuanImage 3.0 — это большой шаг вперёд в open-source T2I: natively multimodal модель на autoregressive архитектуре. В основе подхода аккуратная работа с данными, продвинутая архитектура с MoE (80B параметров, 13B активных на токен), собственная CoT-схема, multi-stage pre-training и post-training. По метрикам и человеческим оценкам модель выходит на уровень топовых closed-source решений.

Меня особенно впечатлило то, что в сумме получается почти 10 этапов обучения. На практике, чем больше этапов, тем легче что-то поломать, но вот у авторов это успешно получилось. И сами картинки получаются годными.

Paper
Code

Мои обзоры:
Personal blog
Medium
My DS Notes

#paperreview

🔥4🗿2❤1

1.41K views09:40

Data, Stories and Languages

Ревью статей для конференций выходит на новый уровень

😁5🤡5

1.54K views13:55

Data, Stories and Languages

Текущий стиль обсуждения AI vs non-AI

🤣34

1.56K views07:27

Data, Stories and Languages

Kaggle MCP

https://www.kaggle.com/docs/mcp

Вы когда-нибудь думали "было бы прикольно использовать Kaggle через агентов"?. Я - нет, а вот кто-то в Goggle об этом подумал. Теперь есть доступный MCP, чтобы работать с ноутбуками, соревнованиями и прочим.

#datascience

Kaggle

MCP Server Documentation

Power up your Agents and streamline development workflows using Kaggle's resources.

🔥6😁1

1.19K views07:20

Data, Stories and Languages

SAM 3: Segment Anything with Concepts

SAM 3 — это новое поколение Promptable Concept Segmentation: модель умеет по коротким фразам или image exemplars находить, сегментировать и трекать все объекты в изображениях и видео. Авторы собрали датасет на 4M уникальных концептов (включая hard negatives), архитектура объединяет image-level detector и memory-based video tracker на одном backbone. Отдельный presence head отделяет “что” от “где” и заметно улучшает распознавание. В итоге SAM 3 дает 2х прирост качества в PCS для изображений и видео и ощутимо превосходит предыдущие версии SAM в сегментации. 🔥

А ещё Мета выпустила модели для 3D.

Paper
Blogpost
Demo
Code and weights

Мой обзор на одну из прошлых версий - EfficientSAM.

Мои обзоры:
Personal blog
Medium
My DS Notes

#paperreview

🔥5❤1👍1

877 views08:45

Data, Stories and Languages

Modern problems have modern solutions -> Modern projects have modern problems

🤣8😢1

826 viewsedited 18:18

Data, Stories and Languages

Forwarded from Сиолошная

https://www.anthropic.com/news/claude-opus-4-5

Claude Opus 4.5 таки смог взять 80% на SWE-bench Verified!

Бонусом в модель добавили effort control — прямо как у OpenAI: high, medium, low, дольше думает = лучше решает.

На бенчмарках... ВНЕЗАПНО ждём, потому что цена упала до $5/$25 за миллион токенов (в 3 раза).

🔥5

523 views19:08

Data, Stories and Languages

Vibe... Writing

Какое-то время назад я стал GDE (в секции Kaggle) и могу слушать разные workshop и выступления для "внутренней аудитории". Вчера я послушал доклад, и у меня было дикое WTF.

Автор (раньше была разработчиком, теперь devrel) рассказала про свой MCP для VibeWriting: https://danicat.dev/posts/20250805-introducing-speedgrapher/

https://github.com/danicat/speedgrapher

Мол, когда начинаешь писать текст, у тебя много мыслей в голове, которые можно потерять. Плюс, совсем не хочется думать о грамматике, структуре предложений и прочем. В результате она создала систему промптов для полуавтоматического написания блогпостов.

Workflow получается такой:
• Агент в режиме интервью задаёт тебе вопросы типа "о чём хочешь написать блогпост".
• Команда outline генерит общую структуру документа
• Команда voice добавляет в модель alignment на твои прошлые тексты
• Команда expand пишет сам текст
• Команда review проверяет соответствует ли текст заранее написанным guidelines
• Дальше можно провести пару циклов итераций для улучшения - и публиковать

Что главное: изначально я предположил, что получаемые посты - унылый ai slop, но я пролистал несколько блогпостов - и они выглядят в целом неплохо (если смотреть поверхностно, я не вчитывался). Наверное так себя чувствовали люди, когда видели первые примеры vibe coding.

danicat.dev

Introducing Speedgrapher: An MCP Server for Vibe Writing

The story of Speedgrapher, a custom MCP server for ‘vibe writing.’ It details the journey of turning a personal collection of prompts into a portable, AI-powered toolkit to automate and structure the creative process.

😱6🔥4👍1👎1

1.1K views07:43

Data, Stories and Languages

Book Review: Deep Learning Math Workbook

Я получил очередную книжку от издательства Packt на ревью - “Deep Learning Math Workbook” by Prof. Tom Yeh.

Я ожидал что угодно, но это оказался реально workbookn - никаких объявнений, только задачки. Предполагаю, что есть другая книжка - с детальными пояснениями.

Но в целом это прикольно и полезно для практики. Покупать бы сам я вряд ли стал, но вдруг кому будет полезно.

https://packt.link/RgoMy

#books

👍2👎1

1.44K views09:30

Data, Stories and Languages

В наше время даже цену на комнаты в отеле не могут предсказать без агентов

😁13❤1

1.1K views10:29

Data, Stories and Languages

Gemini app downloads are catching up to ChatGPT

https://www.ft.com/content/8881062d-ff4f-4454-8e9d-d992e8e2c4e3

Судя по статистике, Gemini начинает догонять ChatGPT по количеству скачиваний. Но лишь по ежемесячному количеству скачиваний, не по общему.

Ещё любопытно, что perplexity потихоньку растёт.

🔥9

927 views15:43

Data, Stories and Languages

https://bun.com/blog/bun-joins-anthropic

🤣10

884 views07:17

Data, Stories and Languages

https://docs.neptune.ai/transition_hub/

Неожиданное приобретение. Неужели OpenAI не может нормально трекать тренировку своих моделей?

🔥3

876 views10:11

Data, Stories and Languages

https://x.com/xai/status/1997875236415676619

xAI организовали какой-то ивент типа хакатона и представили разные проекты. Один из них - встраивание рекламы в фильмы. Посмотрел, выглядит совершенно не естественно и не особо к месту.

Мемный вариант подобного был намного лучше - Star Wars + Cristal: https://x.com/EuroWynner/status/1998021007425360079 :)

Но, к сожалению, наверное, встраивание подобной рекламы в фильмы - вопрос времени. Остаётся лишь надеяться, что подобное будет запрещено на государственном уровне.

X (formerly Twitter)

xAI (@xai) on X

Halftime: Dynamically weaves AI-generated ads into the scenes you’re watching, so breaks feel like part of the story instead of interruptions.
@krishgarg09 @yuviecodes @lohanipravin

🔥3

537 views03:08

Data, Stories and Languages

Anthropic Interviewer

Несколько дней назад я открыл Claude и увидел предложение пройти мини-интервью о моём опыте использования AI-инструментов с чат-ботом. Это было любопытно - он задавал общие вопросы, уточнял мои ответы, возвращался к предыдущим шагам, когда было релевантно. Потом оказалось, что уже есть блогпост про это: https://www.anthropic.com/research/anthropic-interviewer

В чём суть проекта? Анализ чатов даёт понимание того, что происходит в процессе общения, но не даёт информацию о том, как люди используют сгенеренный текст, что они думают про него, что они чувствуют в отношении AI и так далее. Созданный инструмент даёт возможность узнать больше про это и заскейлить вместо того, чтобы с каждым человеком общаться по отдельности.

В сумме в таких интервью поучаствовало 1250 людей (125 учёных, 125 креативщиков, 1000 прочих). Транскрипты доступны публично (по согласию участников).

В статье много выводов и размышлений, рекомендую почитать. Что мне показалось интересным:

• Люди хотят продолжать делать интересные вещи сами и делегировать рутинные задачи моделям
• Учёные хотели бы использовать AI для исследований (формулировка гипотез и дизайн экспериментов), но пока не доверяют качеству
• Люди часто понимают, когда получают тексты написанные AI, и тогда испытывают негатив к отправителю - мол, он был слишком ленив, чтобы самостоятельно написать что-то персонализированное
• Креативщики нередко используют AI для генерации идей, но не дают ему активную роль в творчестве - ибо ему то не хватает нюансов, то он просто не может драйвить историю
• Большинство людей (65%) всё же довольны использованием AI и для 86% он экономит время
• При этом большинство (69%) ощущают социальную стигму от использования AI и стараются не палиться перед коллегами
• Из забавного: в результате интервью оценивались 6 эмоций, которые демонстрировали люди - надежда, раздражение, облегчение, доверие, удовлетворение, беспокойство. Так вот, из креативщиков 3 из 6 профессий продемонстрировали абсолютное недоверие к AI - дизайнеры, создатели фильмов и разработчики игр
• А из учёных, только Data Scientists продемонстрировали полное недоверие. Возможно потому, что мы слишком многое знаем об этом

Но вообще, я думаю, что главное в этом опросе - не конкретные результаты, а сама технология. Anthropic смогли разработать годный подход к масштабируемому опросу юзеров. Теперь они смогут это использовать для других групп юзеров, опрашивать выборку больших размеров, использовать его и для других целей. Это очень ценный инструмент.

Кстати, если хотите сами попробовать, вот ссылка https://claude.ai/interviewer

#datascience

Anthropic

Introducing Anthropic Interviewer

What 1,250 professionals told us about working with AI

❤2👍2🔥1

545 views04:52

Data, Stories and Languages

RIP JetBrains Fleet

https://blog.jetbrains.com/fleet/2025/12/the-future-of-fleet/

"Starting December 22, 2025, Fleet will no longer be available for download. We are now building a new product focused on agentic development."

Помню как я попробовал использовать его пару лет назад и не особо понял его пользу.

The JetBrains Blog

The Future of Fleet | The Fleet Blog

TL;DR Fleet started as our attempt to explore a new generation of JetBrains IDEs, developed in parallel with those based on the IntelliJ Platform. Over time, we learned that having two general-purpose

🫡3🤨1

624 views12:38

About

Blog

Apps

Platform