DataWorkshop - AI & ML – Telegram
DataWorkshop - AI & ML
1.91K subscribers
204 photos
22 videos
13 files
150 links
Онлайн-обучение от европейской компании DataWorkshop.

Курсы по: Статистике, SQL, Python, Data Science, Нейронным сетям, Time Series, NLP.

Корпоративное обучение.

Помогаем внедрять машинное обучение в бизнес.

Сайт:
https://dataworkshop.ru
Download Telegram
Обещал рассказать про одну книгу, которую стоит прочитать (мне ее кстати жена подарила 🙂, хороший подарок).


Книга тонкая, но она больше про подумать и проверить. Книга о том как смотришь на мир и что о нем думаешь, то и происходит. Можно сказать это не про ML, но это не так. Я понимаю что у меня ML это уже профессиональная деформация и я уже везде вижу ML. Например, эта книга про эксперименты, когда у тебя нет уверенности в чем либо, но есть гипотеза которую нужно проверить (с нейтральным подходом).

Вообщем крутая книга, ждешь чтобы написал больше?


#книга
👍271
Вчера выступал в Nvidia (за спиной офис).

Рассказывал, как можно запускать большие языковые модели (LLM). Говоря простым языком — как запустить ChatGPT на своем сервере, используя открытые модели, например, Llama.

Доклад получился весьма насыщенным. Делился своим опытом. Сам лично немало намучился, пока структурировал информацию. Тема новая, очень разрозненная. Обычно есть две крайности: либо люди слишком глубоко сидят в своей нише, либо совсем не в теме.

Поэтому, когда хочешь погрузиться в вопрос и осознанно принять решение, это не всегда просто.

Для себя я выделил такой алгоритм, состоящий как минимум из 5 шагов:

1. Hardware (GPU от Nvidia и другие)
2. Software (инструменты для inference)
3. Модель LLM
4. Оптимизация
5. API

Хочешь узнать больше о запуске LLM? Ставь реакцию 🔥

P.S. Помню про книгу, напишу отдельным постом.

#llm
🔥37
Оставлю ещё один слайд, чтобы поработать с Твоим воображение и лучше понять, о чём идёт речь 👆 и на что можем повлиять.

Если смотреть с перспективы моего алгоритма, то, используя готовое решение (например, API OpeanAI или любое другое), я отметил, что на что мы влияем (только на выбор модели, да и то в ограниченом ввиде), а что решают за нас. И дальше как обычно в жизни, когда кто-то решает за Тебя, то это комфортная... ловушка 🙂Пока все хорошо - то хорошо, но как только...

Далее по порядку выбираем, где хотим остановиться. Если проходим все шаги, то как бонус получаем контроль над всем процессом — иногда это критически важно.

#llm
🔥12
Ребята, не хватает времени регулярно писать здесь, но расскажу последние новости. Сейчас, помимо обычных ML-проектов (с использованием классических подходов), я всё больше вовлечён в проекты, связанные с LLM. Речь идёт не просто о том, чтобы взять ChatGPT — это хайповое время, к счастью, уже проходит, и горячие головы бегут искать новую модную тему. Суеты становится меньше, и можно спокойно заниматься делом.

Сейчас я консультирую или напрямую веду три LLM-проекта. Назову их условно (названия компаний пока не могу раскрыть, так как это запрещено контрактами, особенно в условиях текущей конкурентной борьбы):
- менторство (помощник который будет помогать развиваться),
- helpdesk (телеком, куча вопросов и разных проблем которые нужно решать),
- экзамен (профилировнная тема в которой нужно сдать экзамен).

Я специально погрузился в реальные проекты, чтобы отшлифовать навыки, которые ранее спокойно развивал, экспериментируя локально. Большинство знаний, которые сейчас циркулируют в интернете, не основаны на реальном опыте, а представляют собой «обезьянничество» — копируют, что говорят другие, и делают вид, что разбираются. Например, популярная библиотека LangChain или агентов CrewAI — их сейчас обсуждают всё чаще. Сразу скажу: не рекомендую использовать их в "продакшене", иначе появится куча проблем.

Недавно записывал подкаст на эту тему, где объяснял, почему так часто говорю "нет, нет и нет". Главная мысль в том, что инструменты — это всего лишь инструменты, и даже если они популярны, они всё равно не решают проблемы. А зачастую наоборот: там, где много маркетинга, меньше "дела".

У меня уже созрел план поделиться опытом, как стоит работать с LLM. Поэтому сразу вопрос: насколько для тебя актуально погрузиться в практический мир LLM? Именно научиться создавать проекты, за которые не будет потом стыдно (а не просто изучать инструменты, которые, скорее всего, не пригодятся).

Пример. Предположим, ты хочешь найти работу в data-сфере (например, аналитиком данных или в области ML, или чем-то смежным). Что можно сделать? Например, проанализировать рынок вакансий и понять, что требуется. Я, кстати, даже собрал такие данные. Но здесь есть загвоздка: вакансии содержат много текста, где каждая компания описывает требования по-своему, и это не так просто анализировать. Тут возникает идея: что, если с помощью LLM мы приведём неструктурированные данные в структурированный вид? Это поможет легче понять и анализировать информацию. Вот так, между прочим, можно создать такого помощника. Интересно?

#llm #project
14
В наших странах красивая осень. Вид на океан мне очень нравится, как и теплая погода зимой. Но осень здесь крутая 😎


Пишу, чтобы обратить внимание, когда будешь идти домой :)

Что касается курса LLM, благодарю за обратную связь. Думаю тогда запустить и на русском в этом году, если группа будет. Для первого потока сделаю супер условия. Это будет практический курс. Буду рассказывать про свой опыт и то важное о чем точно хочешь знать :)

Ждешь? Ставь реакцию 🔥 , это мотивирует писать и наставлять приоритеты
🔥263
This media is not supported in your browser
VIEW IN TELEGRAM
Напишу еще текстом, больше конкретики
🔥9
Вернулся на океан 👆


Практическому курсу по LLM быть, но перед этим стоит прояснить несколько важных моментов. На этой неделе завершил один проект по LLM для компании, которую, думаю, их знаешь — они раньше выпускали телефоны, а сейчас больше занимаются оборудованием (больше, к сожалению, рассказать не могу). В их случае задача заключалась в создании решения, которое помогало бы находить ответы, когда что-то не работает. Интересно то, что у них в компании есть специализированные команды по Data Science, которые пошли по популярному, но неверному пути, используя модные библиотеки. Конечно, так можно сделать — ведь это упрощает работу и позволяет быстро создать прототип, но на продуктив это решение не подходит, так как оно слишком непредсказуемое и не поддается улучшению (когда информация делится на маленькие кусочки — chunks, и потом ищется похожие кусочки). Я же помогал их команде, больше со стороны IT (не DS/ML), но по факту у них получилось наибольшее приближение к production-ready решению. Кстати, моя помощь — это секрет, поэтому тихо 🤫, так как между командами идет негласное соревнование за лидерство.

Что же они сделали? С одной стороны — простые вещи, логичные и основанные на здравом смысле. С точки зрения бизнеса, инструменты — это всегда лишь инструменты, и важно сосредоточиться на том, что действительно нужно бизнесу, на процессе. Сначала постараться сделать всё вручную, чтобы понять суть происходящего, а затем частично передавать ответственность на LLM, но хитрым образом — не ожидать от LLM слишком многого. Нужно продумать за нее возможные пути и сценарии. Да-да, думать всё ещё нужно — так называемый ИИ плохо умеет это делать. Но если правильно спланировать систему, LLM, как поезд, будет четко двигаться по рельсам и станет более предсказуемым. Чтобы это реализовать, есть много нюансов, но саму идею я постарался описать простым языком. Звучит просто и разумно, правда? Вопрос в том, как это сделать.

В принципе, когда "увидишь" как, все станет понятно. Конечно, сейчас большая часть информации ведет не в ту сторону, так как практиков мало, и каждый копирует за другим. Поэтому столько шума.

Напишу еще... раз так хорошо идет 🙂

#llm #course #usecase
🔥15
7 ключевых моментов, которые наглядно и практично показывают ценность курса:


Этот курс точно подойдет Тебе если хотя бы пару пунктов отзываются:

1️⃣Хочешь создавать продукционные решения на основе LLM, которые реально влияют на бизнес — не теоретические эксперименты, а работающие внедрения, приносящие ценность.

2️⃣Для Тебя важна простота и эффективность — на практике изучишь принцип "бритвы Оккама" и научишься упрощать сложные задачи до работающих решений.

3️⃣Нужны проверенные проектные шаблоны — получишь готовые схемы, чек-листы и карты знаний, которые помогут избежать типичных ловушек в проектах LLM.

4️⃣Ищешь практические знания, а не тренды — фокусируемся на том, что действительно работает в продакшене, игнорируя краткосрочные моды и маркетинг.

5️⃣Хочешь объединить LLM с классическим ML — научишься эффективно сочетать эти технологии и поймешь, когда использовать каждую из них.

6️⃣Нужны крепкие основы — познакомишься с универсальными принципами и методологиями, которые будут актуальны независимо от изменений в библиотеках и инструментах.

7️⃣Ценишь практический подход — получишь конкретные примеры из "поля боя", код с подробным разбором и возможность самостоятельных упражнений.

Как оцениваешь такое представление ключевых ценностей курса? Резонирует? 🔥🔥🔥

На данный момент в моей программе созрело 5 модулей и еще множество дополнительных, но после долгих раздумий и улучшений я решил не делать курс слишком большим, а просто разделить его на два. Например, локальный AI, то есть запуск собственной модели, будет отдельным курсом, чтобы сразу сосредоточиться именно на том, что важно — научиться использовать модели и проектировать системы. Кстати, над чем я сейчас работаю: хочу подключить тебя к нашей внутренней системе, благодаря чему ты сможешь легко тестировать множество моделей (как закрытых, например OpenAI и Anthropic, так и открытых, таких как Llama, Mistral и другие). Думаю, будет доступно пару десятков моделей — это значит, что для тебя будет легко проводить качественные эксперименты.

#llm #course
🔥18
Вчера выступал на встрече Google Developer Group.

Рассказывал про LLM: где мы сейчас находимся и чего ожидать в будущем. Делился своим опытом.

Удалось пообщаться с интересными людьми, которые раньше знали меня только виртуально. Такие встречи немного смущают, особенно когда возникает атмосфера возвышения. Все мы люди, ходим по одной земле.

Кстати лайфак - заранее пиши и договаривайся о встречах, чтобы успеть пообщаться. Идешь на конференцию, заранее посмотри, с кем хочешь поговорить. Это заметно увеличивает шансы на полезные контакты.

А сейчас — снова в поезд и на консультацию. На этот раз для компании из сферы HR, одного из лидеров индустрии. Будем помогать совершенствовать их лидерские качества.

#conf #llm
9👍4
Время подводить итоги года.

Но я не буду делать это как обычно. Этот год, особенно его вторая половина, был более интенсивным — я создавал практический курс по LLM.
Здесь нужно пояснить. Когда мы в DataWorkshop ведем проекты с компаниями, с разной степенью вовлеченности — от консалтинга до непосредственной реализации, — это, конечно, непросто, но более понятно.

При создании курса у меня включается механизм: выжать максимум из того, что я уже знаю, чтобы передать как можно больше практического опыта. А это сложно. Гораздо проще научиться самому, чем научить кого-то. Кстати, существует большая корреляция: когда обучаешь других, еще лучше оттачиваешь свои навыки. (К слову, я активно рекомендую такой подход. Правда, мало кто им пользуется, потому что учить других действительно сложно — это понятно.)

LLM сейчас очень горячая тема. У меня большая часть материалов на польском языке (в том числе подкасты). В этом году я активно рассказывал, почему «модный AI» — это тупиковая ветвь, но при этом есть решения, которые работают.
Есть ощущение, что все больше людей это замечают, хотя, скорее всего, должно пройти время. Это нормальный цикл: сейчас все «плывет с хайпа» в сторону «разочарования».

С ML я работаю уже более 10 лет. Поэтому привык, что иногда тема становится популярной, возникает много шума, а потом интерес падает. Тогда можно спокойно двигаться вперед, не нужно «кричать».

Что такое практический LLM?
Что реально можно делать? Как правильно реализовать RAG? Есть ли будущее у AI-агентов? И если да, то как это сделать?
И, в целом, на какого «коня» поставить?

Пишу это сообщение и понимаю, что текстом сложно передать смысл. Отсюда появилась идея — показать на практике.

Давай соберемся перед Новым годом, посмотрим на реальные возможности LLM, и вы поймете, что возможно, и куда стоит развиваться.

Как идея? Поддержите! Если соберем 50 «огоньков» 🔥, я проведу практическое мероприятие еще в этом году!

#llm #rag #data #production
🔥36
This media is not supported in your browser
VIEW IN TELEGRAM
С (наступающим) Новым Годом!🎉


50 🔥нет, но у меня родилась еще лучшая идея 💡. Проведу тренинг который делал в Польше за ок. 200 евро, где объясню возможности и ограничения LLM, главные заблуждения массы и в чем преувеличивают возможности свежие эксперты, а где упускают главные возможности. Да, такой парадокс.


Формат - закрытая рабочая группа (трансляции онлайн не будет!), где после моей презентации можно задать вопросы и пообщаться о том что важно!


Не пропусти запись, завтра утром ее открою. Вот и проверим для кого важен ML 🥳

С Новым Годом!

Новые возможности ждут, действуй!

P.S. Для первых семи запись будет моим подарком ❤️.

P.P.S. Елку украсила жена, сын сделал поезд 🥳 Красиво
13
Новый год — отличный момент для старта, ведь это время, когда появляется новый стимул делать то, что давно хотелось, но не хватало времени. Так что давай начнем с малого, постепенно двигаясь вперед.

Для этого я организую закрытый тренинг, который пройдет онлайн, но без открытой трансляции. Мы сосредоточимся на практических аспектах работы с LLM и управлении их результатами, что даст тебе уверенность в работе с моделями LLM и поможет избежать распространенных ошибок.

🗓 Когда?
3 января с 12:00 до 14:00 (Минск, Москва) или 11:00 до 13:00 (Варшава, Киев, Берлин).

Это твой шанс начать новый год с полезных знаний, которые помогут тебе двигаться вперед с уверенностью!

Что будет?
1️⃣ Что такое "галлюцинации" LLM? Узнай, как управлять ошибками, которые могут возникать в процессе работы с большими языковыми моделями.
2️⃣ Как отличить ошибки от полезных "мечт" модели? Важно понимать, как LLM генерирует текст и как это может повлиять на результат.
3️⃣ Как избежать ошибок при внедрении LLM в продакшн? Получи знания о том, как управлять неопределенностью модели и исправлять ошибки без поломки системы.
4️⃣ Как подготовиться к реальным вызовам (а не только играться)? Понимание механизма "галлюцинаций" критично для внедрения LLM в бизнес-процессы.
5️⃣ Не только теория, но и практика! Я покажу тебе код, а также концептуальные подходы к работе с LLM и управлению их результатами.
6️⃣ Будущее за LLM, но нужен контроль! Научись планировать и проектировать решения с использованием LLM, понимая их ограничения.
7️⃣ Это начало чего-то большего! Присоединяйся, чтобы узнать, как создавать ассистентов и агентов с использованием LLM.

Не упусти шанс! 3 января с 12:00 до 14:00 — закрытый онлайн-тренинг, который откроет тебе новые горизонты в применении LLM.

Присоединяйся к тренингу и начни контролировать свои LLM-проекты уже сегодня!

Сейчас опубликую временую ссылку. Внимание!
🔥 Для первых 7 тренинг достается в подарок.
🔥11
🔥Закрытый тренинг = Введение в практический LLM

Группа сформирована — отлично!


Если ещё не успел записаться, не переживай — тренинг, возможно, повторится. Те, кто уже зарегистрировались, первыми получат доступ к новым анонсам и материалам.

Ключевые даты:

2 января: Утром на email придёт инструкция с деталями.
3 января: Встречаемся на двухчасовой сессии.



Что будет:
За 2 часа — всё самое главное о LLM.

Разберём основы, которые кажутся простыми, но...
Тот, кто пытался разобраться самостоятельно, знает, как легко запутаться в хаосе информации. Помогу увидеть главное и начать думать о LLM просто и системно.

Практика:
Реальные примеры, ключевые принципы и типичные ошибки, которые легко избежать.

Дискуссия и ответы на вопросы:
В конце тренинга — время для вопросов и дополнительных инсайтов, чтобы закрепить знания.


Почему это важно?
В 2023-2024 году удалось собрать разный опыт работы с LLM, выделить главное и понять, что действительно работает. Всё это — без лишних сложностей и "граблей". Уже часть проектов реализованы, еще часть в процессе, поэтому делюсь самыми свежими идеями которые работают! Кстати, большинство идей не рабоатет (поэтому если что-то кажется логично это одно, а логично и работает это совсем друга ценность).


Начинай 2025 с DataWorkshop и увереным прокачиванием себя с DataWorkshop. Практический подход, дает практический результат.

Успел записаться и стать частью закрытого тренинга? Поздравляю и давай уверенно двигаться вперёд!
🔥8
Завтра стартует закрытый тренинг. Пока поделюсь важным направлением (прям как компас), которое имеет значение в мире ML.
👆 Неважно, 2024, 2025 или 2030 год – в машинном обучении одно правило остаётся неизменным. Какое? 🤔
Качество данных. Казалось бы, очевидно, но, парадоксально, ситуация лучше не становится. 😅

Из моего опыта: если в компании нет выделенного человека (или команды), отвечающего за качество данных для ML, готовьтесь к трудностям. С этим можно жить, но это технический долг, который всё равно придётся погасить. Причём это тот тип долга, который не приносит мгновенной выгоды. Результаты появятся позже, когда данные начнут использоваться.

Да, картинка получается жёсткая, но… в мире модных лозунгов об ИИ легко забыть про фундамент – данные. Не поймите неправильно, AI-агенты и RAG – это важно. Но что толку, если данные, на которых они работают, низкого качества?

Примеры:

1️⃣ Шум в данных
Ошибочные данные могут поступать из разных источников. Например, система мониторинга загрязнения воздуха в Кракове несколько дней показывала уровень PM2.5 в 5000 µg/m³ вместо 50 µg/m³ из-за сбоя датчика. Это приводило к ложным тревогам и неверным прогнозам модели.

2️⃣ Неактуальные данные
Модели на старых данных не учитывают изменения. Например, модель прогнозирования запросов в клиентскую поддержку может не заметить роста запросов после запуска нового продукта.

3️⃣ Смещение в данных
Данные, собранные в одном контексте, могут быть нерелевантны в другом. Например, AI-модель для найма в IT может отдавать предпочтение мужчинам, если исторические данные содержат преимущественно их.

4️⃣ Недостаток данных
Отсутствие части данных приводит к неполным анализам. Например, модель прогнозирования сбоев в энергосети не имела данных с некоторых старых подстанций, что снижало точность.

5️⃣ Понимание контекста
В марте 2020 года число транзакций картами в продуктовых магазинах резко выросло (контекст – пандемия). Контекст всегда сложно учитывать!

6️⃣ Изменение характеристик данных во времени
Данные меняются, и модели устаревают. Например, модель прогнозирования предпочтений потребителей становится менее точной, если меняются рыночные тренды.

7️⃣ Неправильное представление данных
Данные должны быть преобразованы для корректного анализа. Например, если данные о продажах записаны в разных валютах (доллары и евро), это может запутать модель.

... этот список можно продолжать!

Резонирует? 🔥
🔥11👍1😍1
Шлифую презентацию на завтра, уже почти 100 слайдов (97 штук!) 🙈 Время еще есть, может, что-то добавлю, так много хочется сказать и показать!

Цель, которую ставлю перед собой — объяснить на пальцах, что с одной стороны AI/ML — это не магия, с другой стороны, на самом деле много шума, и очень сложно уловить, что самое важное, и с третьей стороны, по-человечески объяснить, что с этим делать.

Кроме презентации, есть еще блок с кодом, настоящими примерами — будем анализировать реальные финансовые документы.

Видимся уже завтра! Будет очень интенсивно, приготовься к тому, что мы будем много практических знаний давать, тем более если только начинаешь. Но даже если ты по уши в теме, думаю, тоже будешь удивлен!
😍9👍3
Жду завтра и рестартую мозг, а то закипел немного 🙂
👍7