NEW BOT Телеграм, страница

Forwarded from Время Валеры

Во время лекции о сборе данных на курсе по ML System Design зашёл разговор о data governance. Пришли к неожиданным выводам:

1. Нормального определения нет, даже Data Management Institute не даёт чёткого ответа.
2. Попробовали сформулировать своё: Data Governance — это связка между процессами и политиками (policy), с одной стороны, и контролем + внедрением(policy enforcement), с другой, направленная на реализацию стратегии данных компании. (Часто стратегия сводится к обеспечению быстрого и бесшовного доступа к актуальным, полным и качественным данным с учётом контроля доступа и соблюдения комплаенса. Но, как известно по Румельту, это не совсем стратегия, поэтому требуется стратегия достижения, и data governance ближе к таковой.)

Проблема в том, что вторая часть связки — контроль и внедрение — часто отсутствует. Это приводит к тому, что через X лет после утверждения стратегии участники начинают перекладывать ответственность друг на друга, тыкать пальцем , и побеждает тот, у кого «палец длиннее».

Потенциальным решением видится направление в продуктовые/бизнес команды людей, который будет делать эту неблагодарную и важную работу, но и это непросто

Jeff Zych's Internet Nook

Notes from “Good Strategy / Bad Strategy” by Jeff Zych

Strategy has always been difficult for me to pin down. What does a strategy look like? What makes a strategy good or bad? “Good Strategy / Bad Strategy,” by UCLA Anderson School of Management professor Richard P. Rumelt, takes a nebulous concept and makes…

❤‍🔥6

353 views21:08

Forwarded from Николай Хитров | Блог

Ученые смогли в мечту алхимиков

Вот это я понимаю инженеры. Перекладывают не json-ы, а сразу материю

https://4pda.to/2025/05/11/441908/vnutri_bolshogo_adronnogo_kollajdera_svinets_prevratili_v_zoloto/

4PDA - Новости мира мобильных устройств

Внутри большого адронного коллайдера свинец превратили в золото - 4PDA

👏10

280 views14:44

LangGraph Swarm — построй рой агентов на пальцах 🐝

🐝

Представь:

У тебя есть несколько AI-агентов, каждый умеет своё. Один считает, другой разговаривает как пират, третий помогает писать код. И вот ты строишь между ними диалог, в котором они сами решают, кто и когда берёт слово.

Именно это и делает LangGraph Swarm — свежая Python-библиотека от команды LangChain.

Что умеет:

🔜

Роевой интеллект: агенты работают вместе, передают друг другу управление, когда это нужно.

🔜

Память: встроенная поддержка контекста — помнят, о чём шла речь раньше.

🔜

Передача задач: любой агент может сказать: «Этим лучше займётся коллега».

Пример:

Один агент — “Алиса”, спец по математике. Второй — “Боб”, просто болтает в пиратском стиле. Если пользователь сначала хочет поговорить с Бобом, но потом задаёт вопрос «Сколько будет 5 + 7?» — Боб передаёт управление Алисе. Умно и без лишнего кода.

Код выглядит примерно так:

from langgraph_openai import ChatOpenAI
from langgraph_swarm import create_handoff_tool, create_swarm
from langgraph.prebuilt import create_react_agent

model = ChatOpenAI(model="gpt-4o")

alice = create_react_agent(
    model,
    [lambda a, b: a + b, create_handoff_tool("Bob")],
    prompt="Ты — Алиса, эксперт по сложению чисел.",
    name="Alice",
)

bob = create_react_agent(
    model,
    [create_handoff_tool("Alice", denoscription="Алиса лучше справится с математикой")],
    prompt="Ты — Боб, общаешься в пиратском стиле.",
    name="Bob",
)

swarm = create_swarm([alice, bob], default_active_agent="Alice")

〰️

Для кого эта библиотека?
Для тех, кто строит умные ассистенты, чат-сценарии или многошаговые пайплайны, где важно гибко управлять диалогом между агентами.

Где посмотреть:
github.com/langchain-ai/langgraph-swarm-py

〰️

Спокойный, гибкий и почти готовый движок для AI-команд. Стоит затестить.

#ai #llm #agents #swarm #langgraph

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - langchain-ai/langgraph-swarm-py: For your multi-agent needs

For your multi-agent needs. Contribute to langchain-ai/langgraph-swarm-py development by creating an account on GitHub.

1❤‍🔥7

373 viewsedited 04:14

#dev #meme #ai #llm

😁15

400 views08:35

Forwarded from Джунам вход запрещен

Open source кунг-фу

Когда вышел фильм "карате-пацан" мы с другом смотрели его в кинотеатре, я был настолько вдохновлен этими крутыми приемами из кино и захотел заниматься единоборствами, друга в тот день побить не получилось, он был на 2 головы выше меня.
Я ходил на айкидо, учил приемы, нам показывали, как можно отбирать оружие у соперника. Сейчас я знаю, что если напротив вас стоит человек с оружием, никакие приемы не помогут, надо просто выполнять все его требования. Но тогда знание, что я могу отобрать у человека пистолет, как настоящий шпион вызывало восторг.
Однако бюджет на оплату тренировок кончился раньше, чем я успел отхватить на первых соревнованиях.

Но я узнал, что существует open source кунг-фу и даже есть своего рода "пояса":

1. Наличие github аккаунта
2. Ваш pull request кто-то смержит
3. Вы сделали релиз публичного пакета
4. Вам прислали pull request
5. Вам присылают такой pull request, который вы сами написать не могли
6. Вам присылают 100 багов
7. Компания предложит вам деньги за поддержку продукта
8. Github предлагает вам large runners
9. Спонсоры на github принесут вам 100 000$ в год

Девять ступеней Open Source кунг-фу | НЕЙМАРК

За майские праздники rafailmdzdv и Loki-Astari меня подняли на 4 уровень. Большое спасибо!
У меня даже есть коммит от core разработчика python, чем я очень горжусь.

Здорово, что вырастая, мы можем осуществлять свои детские мечты, хотя и не совсем в той форме, как мечтали🥋

❤‍🔥7👏4😁1

294 views13:13

Революция, которая уже началась — управление ИИ-агентами

Ты живёшь в уникальное время.
То, что ещё пару лет назад казалось научной фантастикой — сегодня становится новой нормой для ИТ-компаний.
Именно управление ИИ-агентами становится фундаментом следующей технологической революции.

Речь не просто о чат-ботах.
Агенты — это целые личности внутри системы:

▶️ которые умеют ставить цели и достигать их;

▶️ вызывать друг друга как функции;

▶️ общаться между собой, делиться контекстом;

▶️ адаптироваться, учиться, ошибаться и… учиться на ошибках.

〰️

Почему это революция?

▶️ Раньше человек управлял программами.

▶️ Сегодня — человек управляет агентами, которые управляют программами.

▶️ Завтра — агенты будут управлять другими агентами.

Мы переходим от ручного управления к делегированию мышления.

〰️

ИТ-компании, которые сейчас инвестируют в управление агентами —
завтра будут лидерами нового технологического уклада.

Это не просто хайп — это архитектурный сдвиг, где многоагентные системы становятся «новыми командами разработчиков».

〰️

Ты — часть этого времени.
Ты — свидетель и участник новой эры.
Не упусти её.

#ai #llm #agents #swarm

Please open Telegram to view this post

VIEW IN TELEGRAM

👏5❤‍🔥1😁1

296 views08:11

Forwarded from Хитрый Питон

Недавно ребята из astral (ruff, uv) выложили на github ty - свой тайпчекер (аналог mypy) https://github.com/astral-sh/ty. Никита Соболев пощупал его и записал небольшое видео с разбором. Если вам интересен тулинг для питона - посмотрите https://www.youtube.com/watch?v=5PCP4ICoirg

GitHub

GitHub - astral-sh/ty: An extremely fast Python type checker and language server, written in Rust.

An extremely fast Python type checker and language server, written in Rust. - astral-sh/ty

8❤‍🔥2👏1😁1

281 views06:11

Forwarded from Находки в опенсорсе

Находки в опенсорсе: ty (red-knot)

https://www.youtube.com/watch?v=5PCP4ICoirg

Вышло видео про новый тайпчекер и lsp: ty (старое название red-knot) от авторов ruff и uv.
Пока по первым впечатлениям – бомба! Не смотря на версию 0.0.0a8 🌚

Из плюсов:
- Быстрый
- На расте
- Куча новых фичей для типов
- Полная спецификация
- Интеграция с ruff и IDEшками

Из минусов:
- Пока есть баги (но их поправят, конечно же)
- Нет плагинов (и скорее всего никогда не будет)
- Софт от молодой и маленькой компании
- Как сделать поддержку ty и mypy вместе? Если использовались ty_extensions 🤷‍♂️

Обсуждение: а как вам проект? Успели попробовать?

| Поддержать | YouTube | GitHub | Чат |

YouTube

Находки в опенсорсе: ty (red-knot)

ty – новый тайпчекер для Python (ранее известный как red-knot) от авторов ruff, компании Astral, написанный на Rust.

Ссылки из выпуска:
- Попробовать: https://play.ty.dev
- Проект: https://github.com/astral-sh/ty
- Подкаст с авторами: https://www.youtub…

6❤‍🔥2👏1😁1

402 views11:18

LangGraph Swarm — построй рой агентов на пальцах 🐝

🐝

🐝 Представь: У тебя есть несколько AI-агентов, каждый умеет своё. Один считает, другой разговаривает как пират, третий помогает писать код. И вот ты строишь между ними диалог, в котором они сами решают…

Очень полезная штука, если хочешь быстро сжигать токены LLM-ок 😁

#llm #ai #agents #swarm #langgraph

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5

367 views10:15

Forwarded from DataEng

Релиз Apache Airflow 2.11.0

Я уже не думал, что будут обновления для 2-й ветки Airflow, а тут релиз 2.11.0: https://github.com/apache/airflow/releases/tag/2.11.0

Причем это не какой-то релиз с багфиксами, там есть новые фишки:

— DeltaTriggerTimetable (trigger-based scheduling)
— Consistent timing metrics across all backends
— Более плавная подготовка к миграции на Airflow 3.0 (добавили команды airflow config lint и airflow config update)

GitHub

Release Airflow 2.11.0 · apache/airflow

Significant Changes
DeltaTriggerTimetable for trigger-based scheduling (#47074)
This change introduces DeltaTriggerTimetable, a new built-in timetable that complements the existing suite of
Airflow...

❤‍🔥7

354 views16:44

Forwarded from Dealer.AI

Gemini diffusions от DeepMind.

Записываемся в вэйтлист.

Новая эра в GenAI?

Эра DiffusionLM is coming?

Быстрее, меньше (?), лучше.

https://deepmind.google/models/gemini-diffusion/#capabilities

❤‍🔥4

279 views11:24

Forwarded from FastNews | Никита Пастухов

Как отправить жопу мейнтейнера в космос. Краткий гайд от вайбкодеров.

У нас тут first-time-contributor притащил в FastStream прикольную фичу – поддержку HTTP в AsyncAPI.

Сначала код выглядел достаточно чистенько, но с косяками. Я подробно описывал, что поправить – в несколько итераций. В общем, обычный процесс ревью. В итоге пришли к финальной версии, где все норм. Я пошел проверять и кое-что править (а то я и так чувака заебал своими правками) – и оказалось, что его правки в AsyncAPI схему тупо не соответствуют спецификации – он их сам придумал. Схема не валидна и не рисуется...

А вероятнее даже их придумал не он, а LLM. У меня сейчас складывается картинка, что чувак просто закинул кодбазу + Issue в LLM, а вывод закинул как PR. Я же ревьюил код нейронки, а он просто кидал мои комменты обратно в LLM. А в итоге все вообще превратилось в тыкву, которая с самого начала была чьими-то галлюцинациями.

Ебаные блять вайб-фармеры-коммитов-в-OpenSource. Я трачу свое время на сопровождение PR, а он тупо в LLM все закидывает

https://github.com/ag2ai/faststream/pull/2142

GitHub

feat: Add AsyncAPI HTTP Support by tmulligan98 · Pull Request #2142 · ag2ai/faststream

Denoscription
Add support for an include_in_schema parameter to register HTTP routes in the app schema
TODO: Should include_in_schema be True by default?
Part of #2091
Type of change
Please delete op...

😁7

310 views06:19

Forwarded from Время Валеры

Удивился второй раз в жизни при работе над инфрой. Первый раз был, когда переезд с Postgres на BigQuery в Blockchain com ускорил (на самом деле!) запросы в 100 раз и снизил стоимость в 10.

Тестировали Iceberg поверх Parquet

AWS Glue + Iceberg: стоимость ↓2.3x, скорость ↑3x
AWS EMR Serverless + Iceberg: стоимость ↓31x, скорость ↑6x
Databricks Serverless on Delta Lake: стоимость ↓3.5x, скорость ↑12x

Полез разбираться, как алгоритмически работает Iceberg поверх Parquet, и в очередной раз убедился, как же приятно читать/смотреть такие инженерные вещи, когда ребята садятся решать человеческие проблемы и находят простые решения.

Умные метаданные: знает статистики каждого файла без его чтения
Убирает дорогие LIST операции в S3 (экономия I/O)
Predicate pushdown: исключает файлы еще на этапе планирования
Hidden partitioning: автоматически находит нужные данные по любым колонкам ( У паркета тоже есть, но не так хорошо)
Snapshot isolation: читает консистентное состояние без блокировок

Главное - важность проверки разных платформ под конкретные бенчмарки. То, что работает для одного типа нагрузок, может быть неоптимально для другого.

P.S. Databricks показал отличные результаты с Delta Lake, но это уже другая история

❤‍🔥8👏2

271 views06:51

Forwarded from Константин Доронин

Я достаточно давно знал о существовании сервиса context7.com, но добрался до тестов только сегодня.

На сайте опубликована актуальная документация по большому количеству (более 13000, ага) библиотек и языков.

Но дело не в сайте. Кого интересуют веб-морды во времена AI? 🙂

У них есть MCP-сервер. Код тут. Он решает извечную боль при написании кода через LLM. Когда библиотека обновилась, а база знаний о ней в LLM – нет. И AI-агент пытается использовать устаревшие интерфейсы в новых библиотеках. Потом ещё и версию пакета пытается понизить, "подогнав" под свой код.

Чтобы поставить MCP-сервер от context7 в Cursor, достаточно добавить в настройки mcp-серверов следующее:


"context7": {
      "command": "npx",
      "args": ["-y", "@upstash/context7-mcp"]
    }

Готово. MCP-сервер установлен и готов к работе.

Самое крутое – у него всего два инструмента. То есть он не забивает, как многие другие, весь контекст LLM всеми возможными инструментами, 90% из которых никогда не будут использованы.

Можно в инструкции для AI-агента сразу прописать, что валидность любого используемого интерфейса библиотек обязательно проверять через Tools.

В общем, ещё один MCP-сервер, который сразу можно брать в работу без переделывания "под себя".

❤‍🔥5😁1

385 views22:52

Выкатили 4-й спарк

https://www.databricks.com/blog/introducing-apache-spark-40

#spark

❤‍🔥5

478 views20:46

Forwarded from Дорога жуков

Load balancer - необходимый элемент любой высоконагруженной системы. Кроме функций распределения входящих запросов по рабочим нодам, балансировщик может решать задачи service discovery, шифрования трафика, кеширования ответов, ограничения частоты запросов и т.д.

Еще это необходимый элемент пазла любого system design interview. Load balancer обычно является частью инфраструктуры, в которую разработчик деплоит написанный код. Это настолько обычная фоновая (относительно разработчика) часть инфраструктуры, что на собесе по проектированию ее легко забыть. Тогда архитектуры будет неполной, так как останется под вопросом решение ряда важных задач.

https://youtu.be/0bAo4ncU-YI

YouTube

Азбука сисдиз: Load Balancer

Телеграм канал - https://news.1rj.ru/str/roadofbugs_channel

❤‍🔥4😁1

442 views08:37

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Приемлемо, ещё несколько профессий, которые смогут заменить промпт-инженерами?)

#ai #veo3 #de

2👏3❤‍🔥2😁21

418 views06:47

Forwarded from partially unsupervised

Формально у меня сегодня последний день в Neon, потому что я оказался среди поглощенных кирпичным заводом, на котором - пока столь же формально - начинаю работать завтра.

Поэтому символично, что сегодня успели зарелизить app.build - продукт, над которым мы небольшой командой работали с февраля. Это ~~just another~~ end2end генератор CRUD веб-приложений от промпта до деплоя.

Он полностью опенсорсный (можно покопаться в истории и увидеть все мои коммиты в стиле “maybe fix a lot of things”), работает как CLI и обычно генерит скорее работающие приложения. Можно сгенерить на наших серверах, можно развернуть у себя (все равно понадобится gemini и claude API, но можете прислать PR с поддержкой любимого LLM-провайдера). Шероховатостей еще много, но уже скорее работает, чем нет, так что пробуйте и присылайте баг-репорты!

👏4

306 views22:54

#meme #dev #ai #llm

😁142

465 views05:07

Forwarded from Data Coffee

Установили новую версию Airflow 3.0 вместе со слушателями подкаста🎧, посмотрели на новый модный интерфейс📊, и даже запустили пару DAGs в прямом эфире😱

В свежем видео от Data Coffee рассказываем:
• о новых фичах Airflow в версии 3.0
• как установить себе Airflow локально через Docker Compose
• достучаться до ~~небес~~ интерфейса
• и другое

#datacoffee #airflow #установка #прямойэфир

https://youtu.be/SVJRb9zf9SA?feature=shared

❤‍🔥7

322 views10:16

📊

Продвинутый SQL: Моделирование и эффективный доступ к данным

Если ты сталкивался с требованиями «знания продвинутого SQL» в вакансиях, но не понимал, что именно под этим подразумевается, эта статья для тебя.

🐱 В ней рассматриваются:
- Оконные функции и CTEs
- Различные типы JOIN и MERGE INTO
- Оптимизация запросов: партиционирование, кластеризация, избегание data skew
- Моделирование данных: Dimension, Fact, Bridge, OBT и агрегированные таблицы

📖 Подробнее: https://www.startdataengineering.com/post/advanced-sql/

#DE #DataEngineering #SQL #BigData #ETL #Analytics

Please open Telegram to view this post

VIEW IN TELEGRAM

Startdataengineering

Advanced SQL is knowing how to model the data & get there effectively

Most data engineering job denoscriptions these days expect "knowledge of advanced SQL," but ask any data engineer that question, and you will get a different answer every time.
Are you
> Frustrated that "advanced SQL" ebooks or Udemy courses aren't really all…

❤‍🔥8

398 views13:32

About

Blog

Apps

Platform