DataWorkshop - AI & ML – Telegram
DataWorkshop - AI & ML
1.91K subscribers
204 photos
22 videos
13 files
150 links
Онлайн-обучение от европейской компании DataWorkshop.

Курсы по: Статистике, SQL, Python, Data Science, Нейронным сетям, Time Series, NLP.

Корпоративное обучение.

Помогаем внедрять машинное обучение в бизнес.

Сайт:
https://dataworkshop.ru
Download Telegram
Знаешь, в чем разница между многорукими бандитами и A/B тестами?
Anonymous Poll
13%
Да, я прошел (а) курс по статистике 😎
84%
Нет, но хочу узнать 🤓
2%
Нет разницы 🙄
🎰 Многорукие бандиты против A/B-тестирования: разница в подходе и оптимизации! 🧪

Сегодня я хочу более детально раскрыть отличия между многорукими бандитами и A/B-тестированием. Давай разберемся, как эти методы подходят для различных ситуаций и как они обеспечивают оптимизацию решений. 🤓

A/B-тестирование, вероятно, Тебе уже знакомо. Оно основано на сравнении двух вариантов (A и B - с целью выявления лучшего. Например, в маркетинге можно проводить A/B-тестирование, чтобы определить, какой заголовок в рекламном объявлении привлекает больше кликов.

Многорукие бандиты представляют собой более сложный и гибкий подход к оптимизации решений. Вместо сравнения только двух вариантов, они позволяют нам исследовать и выбирать из множества вариантов, называемых "руками".

В каждой "руке" находится определенная стратегия или вариант, и алгоритм многорукого бандита распределяет трафик или ресурсы между этими руками, чтобы найти оптимальное решение.

Для лучшего понимания рассмотрим пример в области контент-платформ. Предположим, у нас есть несколько вариантов заголовков статьи, и нужно определить, какой из них привлекает больше читателей. В A/B-тестировании Ты бы разделил(а) трафик на две группы, где одной показывал(а) бы заголовок A, а другой - заголовок B.

Однако, если у Тебя есть много заголовков, многорукие бандиты позволят распределить трафик между ними с учетом производительности каждого заголовка, и тем самым, оптимизировать привлечение читателей.

Главное отличие между многорукими бандитами и A/B-тестированием заключается в возможности оптимизировать выбор из множества вариантов, учитывая их эффективность.
Многорукие бандиты позволяют находить более оптимальные решения в условиях неопределенности, где есть больше чем два варианта для сравнения.
И еще - в A/B “коней на переправе не меняют”, т.е. ждешь окончания эксперимента и потом делаешь выводы.

Во многоруких бандитах если видишь что какая-то стратегия идет лучше, даешь ей все больше и больше шансов, тем самым минимизируешь потери слабых стратегий ( бизнесу это подход очень нравится, если все правильно делать 😎).

Интересно, правда? Многорукие бандиты и A/B-тестирование - это мощные инструменты выбора и оптимизации в различных областях. Важно выбирать подход, который лучше соответствует Твоим целям и специфике проблемы, с которой сталкиваешься.

Но, как показывает мой опыт - теория без практики абсолютно бесполезна. Нельзя стать крутым водителем, если выучить только правила дорожного движения. Поэтому приглашаю Тебя на мой практический курс по статистике. Уже с первых уроков будем писать код и применять полученные знания на практике 🧠💪 .

#статистика
👍4🔥21
Теперь понятно отличие между многорукими бандитами и A/B тестом?
Anonymous Poll
37%
Да 👍
63%
Теперь надо попробовать еще на практике 😎
0%
Я и так знал(а) отличие 🙂
Сегодня у меня важные новости 💥

🌟 С момента запуска моего авторского курса по статистике он был доступен в качестве бонуса для всех участников закрытого клуба. Многие уже воспользовались этой возможностью и успешно освоили курс, позволяющий мастерски работать с данными. 💪

Однако, я рад сообщить, что у Тебя все еще есть шанс стать участником DWClub и получить курс по статистике в подарок! 🎁Вместе мы будем осваивать методы, необходимые для анализа данных и принятия обоснованных решений. 📊

Однако, учти, что с 25 июня курс по статистике будет доступен только отдельно по цене 150 евро. Он больше не будет предоставляться в качестве бонуса. Поэтому, если Ты все еще размышляешь о присоединении к клубу и получении этого ценного курса в подарок, то есть еще немного времени! ⌛️

Почему статистика так важна? Потому что она является неотъемлемой базой для качественной работы с данными. Именно с ней можно преобразовать массу информации в ценные и практические знания.

А мой курс построен на основе десятков прочитанных книг и тысяч часов практики в области статистики.
Что делает этот курс особенным? Мы сразу переходим к практике! С первых уроков будешь применять статистические методы, писать код и работать с реальными данными. Забудь о теоретической сухости и запоминании формул - мы идем прямо к делу!

Я осознал, что сложные концепции не всегда легко понять, поэтому я постарался объяснить их наиболее простым и доступным языком. Вместе мы преодолеем все преграды и освоим ключевые принципы статистики.

Получить курс по статистике 💥


#статистика
👍62🎉2
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня нам нужна Твоя помощь и обратная связь 🙂
Ответь, пожалуйста, на вопрос ниже - будем очень благодарны 🙏.
3
Насколько Тебе важна помощь в трудоустройстве после завершения наших курсов?
Anonymous Poll
65%
Очень важна
24%
Я не ищу пока новую работу
2%
Я владелец своего бизнеса
9%
Надо подумать
3💯2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥52👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Кстати в курсе, что Python - это язык, который хочешь изучить?

Я работал с разными языками программирования (в случае ML/DS - прежде всего Python), и должен признать, что Python очень классный язык, и не только для работы с данными. А как у Тебя дела с Питоном?
3👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 Крутые новости в мире ML!

Контекст. Главное на видео, что модель Falcon40B запустили в демо чип AMD  и даже ничего не сломалось - стишок получился.

Предыстория. В мае 2023 года Nvidia стала первым производителем микросхем, стоимость которых превысила 1 трлн долларов.

И вот тут новость… Анонс чипа AMD (это конкурент NVidia) MI300X это может стать качественной альтернативой для карточки Nvidia H100.

AMD также пробует сделать так, чтобы мы могли этот чип использовать - уже пилят, PyTorch 2.0 и тюнят модели на Hugging Face.

Возможно, это разрушение монополии Nvidia (но это не точно 😂).


Кстати, так уже получилось, что сейчас все больше моего фокуса тоже в  LLM. Давай соберем хотя бы 50 огоньков 🔥, тогда пришлю крутую шпаргалку про LLM (можно сказать мой конспект, который делаю по утрам - структурирую бешенный поток информации в этой теме). Хочешь?
🔥50
Вижу, что уже скоро будет 50+ огоньков 🔥, это хорошо - собираем дальше (шпаргалка тюнится). Ну пока собирается, сегодня попалась на глаза статья о том, как GPT-4 покоряет самые сложные математические, электротехнические и компьютерные курсы МИТа (крутой универ в Америке).

Представь себе алгоритм ИИ, который справляется с 4550 вопросами из 30 ключевых математических и компьютерных курсов МИТа, незатронутый никакими учебными данными.. Для сравнения прогресса GPT-3.5 была точность 33%, чистый GPT-4: 90% + еще немного танцев с бубном и получилось 100%


Вообщем держись крепче и помни, что мир меняется быстрее , чем думаешь!

Как обычно, жду от Тебя реакцию 🔥 - тогда будет еще больше информации.
🔥262👍1
Завтра, 19 июня, стартует наш курс по Data Science.

💥 На нашем курсе Ты окунешься в захватывающий мир машинного обучения, который откроет перед Тобой безграничные возможности. Ты узнаешь, как преобразовать огромные объемы данных в ценную информацию и делать предсказания, которые могут изменить игру в любой отрасли.

💥 Мы создали курс таким образом, чтобы он был практичным и применимым уже с первого занятия. Ты не только поймешь основы моделей машинного обучения, но и сразу начнешь строить свои собственные модели на реальных данных. Это уникальная возможность применить полученные знания на практике и увидеть результаты своей работы.

💥 Я с радостью поделюсь с Тобой своими секретами и лучшими практиками в машинном обучении. Ты будешь обучаться в поддерживающей и вдохновляющей обстановке, где творчество и исследования встречаются с конкретными реальными задачами.

💥 Участие в нашем курсе даст Тебе значительное преимущество на рынке труда. Машинное обучение - это одна из самых востребованных и быстроразвивающихся областей, и умение работать с данными и создавать модели будет являться Твоим сильным конкурентным преимуществом.

Не упусти возможность стать частью увлекательного мира машинного обучения и освоить навыки, которые сегодня определяют будущее. Присоединяйся к нам на нашем курсе и открой двери к бесконечным возможностям машинного обучения!

А еще, только в этом потоке мы дарим персональное сопровождение с HR после завершения курса. Это точно для Тебя, если планируешь сразу строить свою карьеру в сфере Data Science.

🔴 Присоединиться к курсу 🔴
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍31😁1
Сегодня я хотел бы поговорить о том, почему специалисты в Data Science становятся настолько востребованы в нашем современном мире. 🌍💻

1️⃣ Век больших данных: Мы живем в эпоху информационного бума, где каждая компания, организация и даже частное лицо собирает огромные объемы данных. Data Science позволяет извлекать ценные знания из этих данных, делая их полезными и понятными.

2️⃣ Информационная конкуренция: В условиях стремительного развития технологий и глобального рынка, компании понимают, что данные - это их конкурентное преимущество. Data Science помогает обрабатывать и анализировать данные, выявлять тренды и закономерности, что помогает компаниям принимать более обоснованные стратегические решения.

3️⃣ Автоматизация и оптимизация: Специалисты в Data Science разрабатывают алгоритмы и модели, которые помогают автоматизировать множество процессов в различных сферах: от медицины до финансов. Это увеличивает эффективность работы и позволяет сократить затраты компаний.

4️⃣ Инновации и предсказания: Data Science позволяет предсказывать будущие тенденции, моделировать ситуации и прогнозировать результаты. Это особенно ценно для бизнеса, так как позволяет выйти вперед и адаптироваться к изменениям рынка.

5️⃣ Множество областей применения: Data Science имеет широкий спектр применения во многих отраслях, таких как медицина, финансы, маркетинг, транспорт и многие другие. Для себя можно выбрать направление, которое наиболее интересно и в которое можешь внести наибольший вклад.

Так что, если интересуешься анализом данных, статистикой, машинным обучением и программированием, то специальность в Data Science может стать Твоим идеальным выбором! 🚀💡

Еще можно присоединиться к нашему курсу по Data Science, который сегодня стартовал.
👍41👌1
Интересуешься ChatGPT и LLM в целом?
Крутая новость из мира открытых LLM - OpenLLaMA 13B, репродукция языковой модели LLaMA от Meta AI.

Модели OpenLLaMA (3B, 7B i 13B) также обучались на 1T токенах.

Что крутого внутри?
🔸 Интеграция с фреймворком EasyLM
🔸 Предварительно обученные веса PyTorch и JAX
🔸 Производительность, сравнимая с оригинальными LLaMA

Процесс создания:
🔹 Обучение на наборе данных RedPajama (1,2 Т токенов)
🔹 Сохранение гиперпараметров из исследовательской работы по LLaMA
🔹 Использование конвейера обработки JAX из EasyLM
🔹 Баланс между пропускной способностью и использованием памяти

После тестирования с помощью инструмента lm-evaluation-harness, OpenLLaMA показала сравнимую производительность с оригинальными LLaMA и GPT-J!

@data_work
👍21🔥1
Давай погрузимся в мир языковых моделей и рассмотрим важность токенов в контексте больших языковых моделей (LLM).

Токены - это строительные блоки текста, используемые языковыми моделями, такими как ChatGPT. В своей сути, токен представляет собой небольшой фрагмент текста, который может быть словом, символом или даже подсловом.

При подаче текста на вход языковой модели он разбивается на токены для последующей обработки.
Важно понимать, что языковые модели оперируют на уровне токенов, а не слов.

Это означает, что одно слово может быть разделено на несколько токенов. Например, слово "чатботы" может быть разбито на два токена: "чат" и "##боты". Префикс "##" указывает на то, что это продолжение предыдущего токена.

Токены играют важную роль в определении размера входных данных и вычислительных требований модели. У языковых моделей есть ограничение на максимальное количество токенов, которое они могут обработать за один раз.

Более длинные тексты требуют большего числа токенов, что может повлиять на производительность модели и время отклика.

Токенизация является неотъемлемым этапом в задачах обработки естественного языка. Путем разбиения текста на токены языковая модель может анализировать и понимать структуру, грамматику и смысл ввода.

Токены помогают модели анализировать контекст, улавливать закономерности и генерировать логичные ответы 🚀

#llm
👍6🔥21
🔠 Что означает языковая модель LLM? 🔠

LLM (Language Model) - это тип искусственного интеллекта, который обучается на больших объемах текстовых данных для генерации и понимания естественного языка. Одним из наиболее известных примеров является модель GPT-3/GPT-4 (Generative Pre-trained Transformer 3, 4), разработанная OpenAI.

LLM использует глубокое обучение и нейронные сети для обработки и анализа языка. Она учится на огромном количестве текстов и строит внутреннюю структуру языка, что позволяет ей предсказывать и генерировать последующие слова или фразы на основе предыдущего контекста.

Эти языковые модели способны создавать связные и грамматически правильные тексты, а также имитировать стиль и содержание текстов, сходные с теми, на которых они были обучены. Они также могут выполнять задачи, связанные с переводом, ответами на вопросы, составлением диалогов и многими другими.

LLM имеет широкий спектр применений в различных областях, включая разработку чат-ботов, автоматизацию текстовой генерации, улучшение систем машинного перевода, создание интерактивных ассистентов и многое другое. Её возможности продолжают расширяться, а ее использование становится все более распространенным в сфере искусственного интеллекта и обработки языка.

🌟 LLM - это инновационная технология, которая открывает новые горизонты для создания, понимания и генерации естественного языка. 🌟

#llm

@data_work
👍4🔥21