DataWorkshop - AI & ML – Telegram
DataWorkshop - AI & ML
1.91K subscribers
204 photos
22 videos
13 files
150 links
Онлайн-обучение от европейской компании DataWorkshop.

Курсы по: Статистике, SQL, Python, Data Science, Нейронным сетям, Time Series, NLP.

Корпоративное обучение.

Помогаем внедрять машинное обучение в бизнес.

Сайт:
https://dataworkshop.ru
Download Telegram
🔥 Мир найма переживает быстрые изменения, поскольку искусственный интеллект широко внедряется в различные отрасли.

Согласно недавнему опросу, проведенному американской компанией Resume Builder и описанному в Fox Business, уже 10% компаний используют AI-собеседования при отборе кандидатов.

Однако, что еще более удивительно, ожидается, что к 2024 году этот показатель значительно вырастет и составит более 43% компаний.

🤖 Но прежде чем Ты подумаешь, что придется сталкиваться только с ботами на собеседованиях, стоит отметить, что компании не планируют полностью передать решение о приеме на плечи искусственного интеллекта.

Согласно тому же отчету, 80% AI-собеседований используются для предварительного отбора кандидатов, а всего 15% оказывают влияние на окончательное решение.


Цель использования AI-собеседований заключается в повышении эффективности и оптимизации всего процесса подбора персонала. Как известно всем, кто проходил через процесс собеседования, компании могут различаться по эффективности этапов отбора.

Еще одной причиной, почему искусственный интеллект не займет весь процесс, является опасение возможных предвзятостей.

А по ссылке ниже можно посмотреть ответ на вопрос - сколько нужно учиться на Data Scientist-a 🙂 https://youtu.be/MVPAt7I09U4

@data_work
🔥31👍1
Большие данные = большие неопределенности (НЕ большая ценность) 🤔.

До сих пор существует большой миф о ценности, которую можно извлечь из больших данных. Давай лучше разберемся, почему это обычно действительно сложно и приносит больше затрат, чем пользы.

Во-первых, нужно помнить, что одна из самых больших проблем при работе с данными - это неопределенность. В бизнесе (даже при выручке в 100 тыс. долл.) неопределенностей очень много.

Несмотря на то что "золотые" данные могут помочь найти ценные сведения и способствовать принятию более эффективных решений, переизбыток собранных данных зачастую порождает больше неопределенности (в результате чего возникает двусмысленность, когда соответствующая информация имеется, но общий смысл остается неизвестным), чем ясности. Но почему?

Краткий ответ:
GIGO (англ. garbage in, garbage out «мусор на входе — мусор на выходе»)

Что дальше?
Существует еще один миф и гонка за сбором "правильных" данных. Почему плохо собирать правильные данные 🤔?

На самом деле правильные данные - это не плохо, но... проблема заключается в том, чтобы понять, для кого они "правильные"? Как расставить приоритеты: какие данные "правильные", а какие нет? Как определить, какие данные работают лучше без предварительного тестирования моделей (а какие применять модели ML, они ведь все время улучшались)?

Почему проблема заключается лишь в том, чтобы время от времени добавлять "очередные нужные данные"? Например, сегодня Ты собираешь данные A и B, а завтра выясняется, что Тебе нужны еще и данные C.

Где проблема? Проблема во времени. Когда начинаешь собирать данные, у Тебя всегда есть начальная точка (иногда можно попытаться найти исторические данные каким-либо способом, но такой подход полон ошибок и подводных камней).

Поэтому, чтобы извлечь из них максимальную пользу (использовать ML-модель и т.д.), обычно необходимо иметь исторические данные.
👍2
Каково же решение?
1. Осознай, что просто сбор большого количества данных (так называемых больших данных) обычно порождает больше неопределенностей (и это нормально, это просто факт, мы не используем их в качестве исходных данных в производстве)...

2. Можешь собрать много данных. Но важным шагом является построение процесса дистилляции больших данных в золотые данные, которым можно доверять (в DataWorkshop мы называем их Trusted Data, дело не в размере). Этот процесс - самая большая проблема (кстати, с привлечением ML, а не только человеческого мышления, и это не только про обычный "шум").

3. Думай про это как про итерационный процесс: пробуй, терпи неудачи, учись и продолжай двигаться вперед.
👍62🔥1
🏦 Как машинное обучение (ML) меняет банковскую сферу? 🤖💼

🌐 В наше время банковская сфера сталкивается с огромными объемами данных, сложными регуляторными требованиями и постоянно меняющимися потребностями клиентов.

В таких условиях машинное обучение становится незаменимым инструментом для банков, помогающим преодолеть вызовы и сделать множество процессов более эффективными и точными. 👩‍💻📊

Как ML изменяет банковскую индустрию?
1️⃣ Кредитный скоринг и решение о выдаче кредитов: Машинное обучение позволяет банкам анализировать большие объемы данных и создавать модели, которые могут более точно оценить кредитоспособность клиентов и принимать решения о выдаче кредитов.

2️⃣ Обнаружение мошенничества: Машинное обучение помогает банкам выявлять аномалии и подозрительные события в данных, что позволяет оперативно реагировать на потенциальные мошеннические действия и обеспечивать безопасность клиентов.

3️⃣ Персонализированное обслуживание: С помощью машинного обучения банки могут анализировать данные клиентов и предлагать индивидуальные рекомендации и услуги, соответствующие их потребностям и предпочтениям. Это помогает повысить удовлетворенность клиентов и улучшить клиентский опыт.

4️⃣ Автоматизация процессов: Машинное обучение позволяет банкам автоматизировать рутинные и повторяющиеся задачи, такие как обработка документов, снижая риск ошибок и улучшая оперативность.

5️⃣ Прогнозирование и управление рисками: Машинное обучение помогает банкам проводить анализ данных и создавать модели для прогнозирования рисков и оптимизации управления портфелем, что способствует принятию более обоснованных решений.

💡 ML становится сильным союзником банков, позволяя им преодолеть сложности и получить преимущество в современной конкурентной среде. Это всего лишь некоторые примеры того, как банки используют машинное обучение для трансформации своей деятельности.

А в этом видео отвечаю на вопрос - на каких курсах обучаться ML для работника в финансовой сфере (и не только в финансовой сфере ).
5👍1👌1
📊 Начало пути в Data Science 📚
Если хочешь погрузиться в мир Data Science, начать учиться и достичь впечатляющих результатов, вот несколько ключевых шагов:

1️⃣ Познакомься со статистикой. Она является основой многих алгоритмов в Data Science. В DataWorkshop есть отдельный курс по статистике.

2️⃣ Освой программирование: Начните с Python, он наиболее распространен в сообществе Data Science. Изучи основные библиотеки для анализа данных, такие как Pandas, Numpy, и Matplotlib. В DataWorkshop есть отдельный курс по Python.

3️⃣ Познакомься с алгоритмами машинного обучения: изучи различные типы алгоритмов, такие как регрессия, классификация, кластеризация и нейронные сети. Понимание их принципов поможет эффективно применять их на практике. В DataWorkshop это можно изучить на курсе по Data Science и нейронным сетям.

4️⃣ Применяй на практике: Работай с реальными данными, участвуй в проектах и соревнованиях по анализу данных, таких как Kaggle. Практика поможет закрепить теорию и позволит Тебе развиваться как специалисту. В DataWorkshop практику можно получить как на курсах (при работе с реальными данными), так и в клубе 💪

5️⃣ Общайся с сообществом: Присоединяйся к сообществу DataWorkshop, где обсуждаются темы Data Science.

Не забывай, что Data Science - это постоянный процесс обучения и развития. Ставь перед собой конкретные цели, стремись к ним и не бойся испытывать новые подходы.

А здесь в коротком видео отвечаю на вопрос, относящийся к этой теме 🙂

@data_work
👍7🔥43
А так выглядит мой новый офис (сегодня 😂).

На самом деле очень удобно, когда офис перемещается вместе с тобой (как и твоя работа). Хоть в шалаше можно ее делать, самое важное и так просходит в голове.

Поставь огонек 🔥 и будут тоже иногда посты про лайфаки и про жизнь.

P.S.  Кстати, чтобы было понятно, это место где начинает ML работать и давать прибыль нашим партнерам и даже большие LLM модели - тюнятся весьма хорошо. 😎
🔥251😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Переменная — это символическое имя, которое используется для хранения данных в программировании. Она представляет собой область памяти, в которой можно хранить различные значения, такие как:
- числа,
- строки,
- булевы значения.

Переменные позволяют Data Scientist-ам/разработчикам оперировать и манипулировать данными, делая код более гибким и удобочитаемым.

Сравнение объявления переменных на разных языках приведено в gif-ке выше.

Даже на таком небольшом примере. как объявление переменных, заметно, что язык программирования Python делает это проще всего. При помощи Python создается чистый и лаконичный код.

И это одна из главных причин - почему Python - это язык № 1 в Data Science и популярность этого языка только растет. Про другие причины рассказал в этом коротком видео.

@data_work
👍41👨‍💻1
Кстати, знаешь/помнишь какие есть ограничения при создании переменной?
Anonymous Poll
16%
Нет, не помню 🙄
8%
Нет, не знаю 😬
76%
Знаю, но лучше напомни 😁
👍5
Требования к объявлению переменной на языке Python:

1️⃣ Имя переменной не может начинаться с цифры

2️⃣ В имени переменной должны использоваться только латинские буквы a-z, A-Z, цифры и символ нижнего подчеркивания (_)

3️⃣ Python — это язык, чувствительный к регистру. Переменная my_var и My_var — это две совершенно разные переменные. Для присвоения имени переменных принято использовать стиль lower_case_with_underscores (слова из маленьких букв с подчеркиваниями).

@data_work
🔥7👍32
This media is not supported in your browser
VIEW IN TELEGRAM
🔥42👍1
Media is too big
VIEW IN TELEGRAM
Запускаем ламу 2 локально, хочешь узнать больше поддержи огоньком 🔥
🔥27👍1🎉1
Тест на знания основ статистики
👍10😁52
В наше время много говорят о галлюцинациях LLM, но что насчет галлюцинаций компьютерного зрения? 😂

#computervision
😁10🔥2👍1
Тут недавно в одном чате был опрос и нужно было выбрать таблетку (условно): синюю или красную.

А какую выберешь?


Я потом напишу более подробно, поэтому смело выбирай что хочешь (сразу подскажу, неправильных ответов нет)
🤔4👍2🔥1
Какую таблетка?
Anonymous Poll
45%
Красная
55%
Синяя
🤔3🤩2
Хочешь услышать, что общего между этой задачей (опросом)👆, машинным обучением, почему в этом опросе есть классическая ошибка, в чем именно оно заключается да и вообще что именно измеряет этот опрос и как это может быть полезно для Тебя?  И есть ли хорошие люди (роботы) или… (да все-таки или, только или что?)

Тема очень интересная, напишу. Думаю написать больше, а может даже и вебинар сделаю. Но для начала приготовлю длинный пост (уже почти готов, вчера не мог уснуть - думал и сегодня вот написал). Поделюсь опытом, если это интересно. Сколько собираем огоньков. Штук 50 соберем? 🔥


P. S.   в последнее время больше активничал https://www.instagram.com/dataworkshop.ml/ (уже со мной?), записывал много разных историй в формате сторис. В телеграмме сторис вроде есть, но здесь текст вроде более “съедобный”. Надо будет перенести на текст, иногда как найдет волна поделиться идеями, а пальцы не успевают так быстро писать 😎️️️.
🔥15
Насчет эксперимента с таблетками (писал выше - про красную и синюю). Тема очень интересная и более глубокая, чем кажется.
Конкретно в этом эксперименте было сделано, как минимум, одно важное упущение - это контекст.

Хотя там и прозвучало слово статистика (что сразу делает все более серьезнее), но назвать это экспериментом в научном смысле нельзя (и тем более делать какие-либо выводы). Это можно легко проверить, запустив тот же самый эксперимент, результат будет другой - т.е. повторяемости нет.

Это классическая ошибка у тех, кто НЕ занимается анализом данным более глубоко, поэтому такое часто происходит. Мое внимание привлекла другая история, где случайно или нет, была затронута очень интересная и глубокая тема. Поделюсь мыслями, может кому-то будет интересно :)

Что не так с этим экспериментом? Потому что важен контекст и, в зависимости от него, могут быть две крайности. Сейчас объясню о двух крайних сценариях (которые в нашей природе не существуют - мы всегда находимся где-то между).

1️⃣ Сценарий первый - мир рай. В этом сценарии есть изобилие всего, отсутствует 100% конкуренция или борьба за что-либо (ресурсы - деньги, внимание и т.д.).

2️⃣ Сценарий второй - мир ад, полная противоположность первого сценария, очень жесткая конкуренция, все друг друга обманывают, большой дефицит ресурсов и т.д.


В зависимости от контекста (сценария), люди будут вести себя по-разному. У каждого человека есть своя точка “кипения”. К нашему счастью, большинство из нас никогда в ней не окажутся, и именно поэтому гораздо проще про себя думать хорошо (и это правильно, иначе психика человека слетит с катушек).


Если мы проведем эксперимент в рамках первого сценария, то большинство (ок. 100%) будут друг друга поддерживать, т.к. там нет риска и переживаний.

Во втором же сценарии, тот же самый эксперимент будет с обратным результатом. Каждый будет грести в свою сторону т.к. включается режим - “C волками жить по волчьи выть”. Кстати, есть так называемая дилемма заключенного. Вот она как раз-таки больше про сценарий 2.

Еще интересный вопрос - что было измерено в этом эксперименте? По сути в этом эксперименте был измерен “контекст”, в котором находятся люди. Раз большинство выбрало второй сценарий - это прежде всего говорит о тревожности и неопределенности, иными словами люди находятся ближе ко 2 сценарию, чем к первому.

Вообще, по-хорошему это даже не про людей, это про закон Природы (Архитекта, Бога - выбери, что больше нравится).

(Часть 1)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1