NEW BOT Телеграм, страница

gonzo-обзоры ML статей

Just in case, вдруг кто не видел

https://www.youtube.com/watch?v=_cZa_7KaQ3c

Я сначала не узнал дока...

Детали соревнования тут:
https://ai.google.dev/competition

YouTube

Join the Gemini API Developer Competition, win prizes

Do you have what it takes to create the most impactful, creative apps powered by the Gemini API? Let Christopher Lloyd, Hollywood legend and hacker extraordinaire, guide you through Google’s Gemini API competition. Enter your app for a chance to win cash…

🔥14❤6👏3

5.25K views21:43

gonzo-обзоры ML статей

Официально анонсировали Llama 3.1, версии 8B, 70B и 405B.

Тулы, мультиязычность, контекст 128k

Сайт: https://llama.meta.com
Пост: https://ai.meta.com/blog/meta-llama-3-1/
Статья: https://ai.meta.com/research/publications/the-llama-3-herd-of-models/

Industry Leading, Open-Source AI | Llama

Discover Llama 4's class-leading AI models, Scout and Maverick. Experience top performance, multimodality, low costs, and unparalleled efficiency.

❤14👌2👍1

4.73K viewsedited 15:12

gonzo-обзоры ML статей

❤1

5.2K views15:14

gonzo-обзоры ML статей

5.44K views15:14

gonzo-обзоры ML статей

🔥7

5.15K views15:28

gonzo-обзоры ML статей

Теперь у нас есть две хорошие модели с мультиязычностью и function calling (писал про эту комбинацию тут https://news.1rj.ru/str/gonzo_ML/2821), Mistral NeMo и Llama 3.1. Ожидаю интересных развитий и решений!

gonzo-обзоры ML статей

Я думаю, что следующий большой шаг в демократизации LLM случится, когда кто-то опубликует открытую модель среднего размера (скажем, 20-50B, но хорошо если и маленькие тоже, до 10B) со следующими свойствами:

1. Мультиязычность by design. Идеально с поддержкой…

💯13👍9🔥6❤1

5.26K viewsedited 15:51

gonzo-обзоры ML статей

Прикольный формат саммари от unsloth

🔥39😨14🤮7👻6😁3⚡2🦄2🤔1

7.03K views19:35

gonzo-обзоры ML статей

"Пробка в Лиссабоне, вызванная остановившимся трамваем", 2015.

❤53⚡5👍3

7K viewsedited 19:37

gonzo-обзоры ML статей

Как давно это было... 9 лет назад появился deepdream, наверное, первый большой шаг к нейросетевому GenAI. Вскоре через месяц-другой будет style transfer Леона Гатиса, затем быстрое развитие уже существующих GAN, ... и вот мы в мире трансформеров и диффузионок.

❤69👍9⚡6

6.49K views19:37

gonzo-обзоры ML статей

DeepMind продолжают в математику

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

AlphaProof доказывает математические утверждения на языке Lean (https://lean-lang.org/). Зафайнтюненная Gemini переводит описание с человеческого языка на Lean, а дальше RL механизм на базе AlphaZero ищет шаги доказательства.

AlphaGeometry 2 обучена на гораздо большем объеме задач, чем её предшественница и имеет на два порядка более быстрый символьный движок.

Сообща эти две системы решили 4 из 6 задач математический олимпиады этого года, получив результат на уровне серебряного медалиста.

Google DeepMind

AI achieves silver-medal standard solving International Mathematical Olympiad problems

Breakthrough models AlphaProof and AlphaGeometry 2 solve advanced reasoning problems in mathematics

🔥36👍10🤯3

7.96K viewsedited 17:13

gonzo-обзоры ML статей

🔥3

7.08K views17:15

gonzo-обзоры ML статей

6.66K views17:15

gonzo-обзоры ML статей

Вот и поисковик от OpenAI пожаловал :)

https://openai.com/index/searchgpt-prototype/

Надо сказать, я ждал его дольше, чем хотелось :) (https://news.1rj.ru/str/gonzo_ML/1140)

Openai

SearchGPT is a prototype of new AI search features

We’re testing SearchGPT, a temporary prototype of new search features that give you fast and timely answers with clear and relevant sources.

👍13🔥5😱2

8.05K viewsedited 21:16

gonzo-обзоры ML статей

Какой прикольный проект — gpu.cpp!

https://github.com/AnswerDotAI/gpu.cpp
https://gpucpp.answer.ai/
https://x.com/austinvhuang/status/1816141044540739642

Можно использовать GPU, не заморачиваясь написанием отдельного кода под CUDA, AMD, Mac, Intel GPUs. Спасибо WebGPU, который не только про веб (https://www.youtube.com/watch?v=qHrx41aOTUQ).

GitHub

GitHub - AnswerDotAI/gpu.cpp: A lightweight library for portable low-level GPU computation using WebGPU.

A lightweight library for portable low-level GPU computation using WebGPU. - GitHub - AnswerDotAI/gpu.cpp: A lightweight library for portable low-level GPU computation using WebGPU.

👍39🥰7❤3🤔2👀2

9.51K views22:35

gonzo-обзоры ML статей

❤34🔥10🥴2👍1

10.4K views22:46

gonzo-обзоры ML статей

Тем временем на lmsys arena новый лидер, гугловая экспериментальная Gemini 1.5 Pro Experimental 0801 в статусе превью.

🤔25🤯9🔥4🐳2

6.08K views17:49

gonzo-обзоры ML статей

Ещё из свежих новостей — это новая Gemma 2 2B. Похоже, что на редкость неплохая

https://developers.googleblog.com/en/smaller-safer-more-transparent-advancing-responsible-ai-with-gemma/

Googleblog

Google for Developers Blog - News about Web, Mobile, AI and Cloud

ShieldGemma is a suite of safety content classifiers models built upon Gemma2 designed to keep users safe. GemmaScope is a new model interpretability tool that offers unparalleled insight into our models' inner workings.

👍10

6.27K views20:41

gonzo-обзоры ML статей

👍14🔥3

5.93K views20:41

gonzo-обзоры ML статей

Интересный кейс про отказ от LLM/агентского фреймворка (здесь LangChain), когда абстракции фреймворка не помогают, а скорее тормозят:
https://www.octomind.dev/blog/why-we-no-longer-use-langchain-for-building-our-ai-agents

Обсуждение на Hacker News:
https://news.ycombinator.com/item?id=40739982

У меня от LangChain изначально примерно такие же ощущения были, что для прототипов это ок быстро нафигачить, а для прода проще самим написать на более низкоуровневых абстракциях, чем в недра фреймворка по любому чиху лезть. А там для прода обычно много чего надо от правильного логгирования и мониторинга до навешивания на какую-нибудь очередь типа кафки. LangChain вроде туда как-то пошёл со своим LangSmith, но как-то невнятно для меня до сих пор.

Сейчас у меня скорее в более положительную сторону ощущение поменялось, но всё равно основная ценность LangChain для меня лично сосредоточена больше в районе каких-то базовых вещей типа интеграций с LLM и шаблонизации запросов. Остальное проще самому контролировать.

Есть LangGraph ещё, из когорты мультиагентных фреймворков. Он мне в целом понравился среди того, что я пробовал (а это ещё CrewAI и AutoGen). LangGraph вроде как достаточно низкоуровневый с базовыми примитивами для сборки графа воркфлоу.

CrewAI для меня оказался аналогично LangChain из статьи выше — слишком высокие абстракции, чтобы применить к куче задач, где я хотел бы его попробовать. Например, я сходу не нашёл, как его эффективно использовать для задач с открытой постановкой, где цель изначально не задана чётко, а определяется из общения с пользователем. Могу ошибаться, но, кажется, годится в основном для кейсов с чётко определённой целью, которую агенты потенциально могут выполнить автономно. Ну и всё равно не уверен, что это подходит для прода, потому что опять же куча всего спрятана внутри и не факт, что это можно стабильно использовать за пределами прототипов.

AutoGen кажется наиболее близок к разумному срединному пути между LangGraph и CrewAI. Есть концепция группового чата, где можно собирать довольно открытые диалоги с пользователем. Можно автономных агентов и воркфлоу с переходами между состояниями делать. Мне лично не хватает коллбэков в разных местах, но можно дописать, наверное.

Но вообще в интересное время живём. Прямо сейчас определяются контуры будущего и пока ещё непонятно куда конкретно всё вырулит с этими агентами и мультиагентами.

А вы какими фреймворками пользуетесь (или не пользуетесь) и почему?

octomind.dev

Why we no longer use LangChain for building our AI agents

When abstractions do more harm than good - lessons learned using LangChain in production and what we should’ve done instead

👍32❤10🔥5⚡1

7.04K views12:49

gonzo-обзоры ML статей

Вдогонку к посту про агентные и мультиагентные фреймворки, немного ссылок для тех, кто хочет их изучить.

#1. Спасибо Andrew Ng, на DeepLearning.ai есть открытые и бесплатные мини-курсы по всем основным фреймворкам:

LangChain:

LangChain for LLM Application Development
https://www.deeplearning.ai/short-courses/langchain-for-llm-application-development/

LangChain: Chat with Your Data
https://www.deeplearning.ai/short-courses/langchain-chat-with-your-data/

Functions, Tools and Agents with LangChain
https://www.deeplearning.ai/short-courses/functions-tools-agents-langchain/

Build LLM Apps with LangChain.js
https://www.deeplearning.ai/short-courses/build-llm-apps-with-langchain-js/

Semantic Kernel (альтернатива LangChain от MS -- мне, кстати, понравился, https://learn.microsoft.com/en-us/semantic-kernel/overview/):

How Business Thinkers Can Start Building AI Plugins With Semantic Kernel
https://www.deeplearning.ai/short-courses/microsoft-semantic-kernel/

LangGraph:

AI Agents in LangGraph
https://www.deeplearning.ai/short-courses/ai-agents-in-langgraph/

AutoGen:

AI Agentic Design Patterns with AutoGen
https://www.deeplearning.ai/short-courses/ai-agentic-design-patterns-with-autogen/

CrewAI:

Multi AI Agent Systems with CrewAI
https://www.deeplearning.ai/short-courses/multi-ai-agent-systems-with-crewai/

Есть там и много всего другого про LLM, промпт-инжиниринг, RAG, LlamaIndex и прочее.

#2. Книги

Я уже их упоминал, у Manning в стадии написания (и доступные для чтения по ходу процесса) есть две тематические книги:

AI Agents in Action
https://www.manning.com/books/ai-agents-in-action

Multi-Agent Systems with AutoGen
https://www.manning.com/books/multi-agent-systems-with-autogen

#3. YouTube, документация, блоги и прочее

Тут ничего писать не буду, много всего, а блог Виктора Дибиа я уже советовал (https://news.1rj.ru/str/gonzo_ML/2859)

Порог на вход сейчас низок как никогда.

DeepLearning.AI - Learning Platform

LangChain for LLM Application Development

Use the powerful and extensible LangChain framework, using prompts, parsing, memory, chains, question answering, and agents.

👍41🔥9❤3

12.4K views14:36

gonzo-обзоры ML статей

Извинити, пока не до статей...

😁141🤣26❤11😎11🔥6⚡2👍1

11.3K views19:28