🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
470 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
Закончил Физтех, а значит если вижу годноту от физтехов, то делюсь ей.

А еще мне вот такие носки пообещали, поэтому ловите пост про стартапы.
👎59🔥8😁8👍3
Начни свое лето жарко!!!!
Всем !Всем!

Кто интересуется темой стартапа приглашаем на ежегодное мероприятие от Кафедры РВК "Прожарку технологических проектов".

Что тебя ждёт?
- питч проектов от студентов МФТИ, которые прошли марафон «Прожарка технологических проектов» или выбрали в качестве факультатива майнор «Стартап с 0: от идеи до выхода на рынок»
- feedforward от экспертного совета
- награждение победителей, специальный приз от спонсора ПАО «Газпром нефть» и партнёров
- возможность пилотного запуска своего проекта
- неформальная часть мероприятия

Примеры нескольких проектов:
👁 SVET - инновационный способ проверки здоровья глаз в очках виртуальной реальности
👩‍💻 Souldev Hacks - платформа для проведения хакатонов
💸 Креаточка - сервис для помощи предпринимателям из сферы креативных индустрий
🎛 DJ Replacer - приложение, которое создает персонализированный DJ сет с помощью AI
🏥МедСкор - система цифрового медицинского скоринга
🏗СityGIS - аналитическая система для тех кто строит комфортные города
🥋Salex s1 - Система ухода за одеждой

В качестве членов жюри приглашены представители:
- Руководства МФТИ
- Российской венчурной компании
- Кафедры РВК «Управление технологическими проектами»
- Венчурных и инвестиционных фондов (ФРИИ, ТилТех Капитал и др)
- Корпоративных акселерационных программ (МТС, X5 Retail Group, др)
- Руководитель направления Департамента технологических партнерств и импортозамещения ПАО "Газпром нефть и других технологических компаний

🗓8 июня
17:00
📍Физтех, корпус «Цифра», аудитория 4.18

Ждем тебя 💜
Please open Telegram to view this post
VIEW IN TELEGRAM
👎18🔥10👍31
🙈 ~70% всего спама в телеграм это арбитраж черед крипту. Change my mind!

🤔 Кто вообще на это ведется!? В основном так ищут дропов для вывода, а это прямой путь в разборки с налоговой.

🧠 В последний год наступил прям буст такого вида спама. Пришлось даже свой небольшой классификатор написать, чтоб банил. Агрессивные встроенные фильтры и ручные боты не спасали. По 20 разнообразных сообщений в сутки на паблик в 5к человек. Инста тоже обильно плодит схожую рекламу.

Если вы давно думали какой пет по ML сделать, то присмотритесь к этой проблеме!
👍27👎24
Сейчас сэкономлю вам кучу времени.

🤔 Мне тут на работе выпало делать голосового помощника. И если вы делаете что-то похожее или просто хотите поднять себе собственную бесплатную chatGPT, то этот пост для вас.

👨‍💻 Первое, что вам придется сделать, это понять, какого качества LLM'а вас устроить. Моделей сейчас хватает, vicuna, llama, alpaca, koala, dodo - целый зоопарк. Чтоб лишний раз не мучать этих милых животных и не потратить свои драгоценные недели дни на выкачивание и запуск моделей ради экспериментов, можно взять вот этот крутецкий сайт. Где за вас подняли все chatGPT-like модели. Поиграться с каждой из них в риалтайме и кайфануть.

🚀 А чтоб быстрее сойтись и прийти к оптимальной модели под ваши задачи, можно еще на вот эту статью обратить внимание. Тут chatGPT принят за эталон, а другие модели оценили относительно его. Скрин в посте из нее. Сам сперва пробовал развернуть на своих серверах LLAMA 13b, но по итогу реально хорошо себя показала Vicuna 13b. Обе модели без какой-либо квантилизации уместил на двух GPU по 16 гигов.

Ваши прОдукты/тимлиды офигеют, как быстро и точно вы определи нужную модель для прода. Единственное, что обратите внимание на наличие лицензии)

#DevOps_это_боль
#но_уже_не_для_вас
🔥67👍15👎83
This media is not supported in your browser
VIEW IN TELEGRAM
🔥21👎17👍7😁21
🏆 Data Feeling | AI
Сейчас сэкономлю вам кучу времени. 🤔 Мне тут на работе выпало делать голосового помощника. И если вы делаете что-то похожее или просто хотите поднять себе собственную бесплатную chatGPT, то этот пост для вас. 👨‍💻 Первое, что вам придется сделать, это понять…
Вижу, как зашла тема с MLOps, буду стараться чаще про это писать. Кстати, тут намечается релевантная DS конференция...

Большой DS-митап о персонализации от СберМаркет Tech🔥

Встречаемся на Data Science Meetup 5 июля в 19:00 в московском офисе СберМаркета или на онлайн-трансляции.

В программе:

🟡 Как мы делали проект по персональному ML-ранжированию каталога и почему из этого ничего не получилось, а потом внезапно каааааак получилось // Антонина Горячева, и.о. директора по анализу данных в СберМаркете.

🟡 ML-персонализация для карьерной платформы: о продукте, что для него делали, какие проблемы были и как их решали // Петр Чуйков, DS Team Lead, HeadHunter.

🟡 Кросс-категорийные рекомендации в Авито: зачем они нужны, как добавляли и что из этого вышло // Михаил Каменщиков, Recommendations Unit Lead Авито.

🟡 Персональный тарифный план для новой базы: key learnings после запусков пилотов, как и почему реальность разошлась с ожиданиями и что с этим делаем // Дарья Шатько, Data Science Teamlead Мегафон BigData.

После каждого доклада дарим подарки за лучший вопрос 🎁

Регистрируйся по ссылке и до встречи на митапе!
👎56👍25😁4🤔21
This media is not supported in your browser
VIEW IN TELEGRAM
🔥23👎11👍2😁21
🏆 Data Feeling | AI
Video message
Это вам анонс нового формата выпусков по DS. В этот раз с Ваней Максимовым из Яндекс.Лавки, который лидирует DS команду и решает реальные боли бизнеса.

#TeamLeadTalks
Ждите!
👎52👍34🔥16
Слишком много дизов, а если я вам покажу кусочек видео с очень сочной картинкой?
🔥31👎20👍2
Forwarded from Aleron Milenkin
This media is not supported in your browser
VIEW IN TELEGRAM
👍58👎31🔥7
Алерончик, как дела?! Делюсь новостями.

Последний месяц выдался очень насыщенным.

🦤 Лидирование ML команды в DoDo Brands требует фокуса над задачами. А задач сейчас много. Тащим в прод рекомендашки, возвращаем Upsell корзины, статичную цену на доставку делаем динамической, а еще делаем голосового заказчика. В Dodo Brands дел реально хватает, но меня это все изрядно драйвит. Уж очень бодрая тима и достаточно ресурсов.

✈️ Мой курс вышел в автономный режим шлифовки. Рад, что курсец успешно помогает многим вкатиться в соревновательный ML быстрее. Удалось сделать целое открытое комьюнити с периодическими вебинарами. Разбираем текущие чемпионаты. Люди делятся своими приемами и дают друг другу мотивации участвовать систематичнее. В эту пятницу будем снова разбирать Protein Function Prediction. Недавно наконец-то разослали участникам фирменный мерч за успехи в рамках курса 👕.

🤖 Мир AI бежит вперед в бешеном тема. Утром выпускается новая SOTA модель, а вечером уже ее убийца с качеством в 10 раз лучше. Поэтому тоже не хочется отставать. Используем LLM'а модели в Dodo Brands, а еще решил запустить курсец по LLM'ам моделям и фреймворкам для работы с ними. Все что сейчас есть в русском мире - моей команде соавторов не нравится - будем задавать уровень.

🎬 Возобновил выпуски с интересными ребятами, но уже не в формате мок-интервью, а скорее более ламповый. Где люди могут поделиться какими-то откровенными вещами из своей карьеры. Анонс вы видели выше.
👍33🔥9👎73😁1
This media is not supported in your browser
VIEW IN TELEGRAM
👎16👍75🔥4
А го сделаем аукцион за набор мерча?

Правила: Стартовая цена за фирменный мерч 100 рублей. Шаг новой цены 100 рублей. Если последний час цена не перебивается, то мерч уходить победителю.

Мерч = футболка и набор стикеров + бонус сверху.

Итоговую сумму тоже разыграем)
👎51👍14😁5🤔53
На прошлых выходных проглотил несколько новых курсов от Andrew Ng. В целом, я уже давно играюсь с prompt engineering'ом LLM моделей, но нашлось несколько трюков, которые мне понравились

Итак, вот несколько выводов, которые мне больше всего запомнились.

⛓️ LangChain for LLM Application Development
-
LangChain это новый "pandas", но не для таблиц, а для дизайна промптов LLM моделей.
- Слово Chain тут не зря. Оказывается, заставить LLM плясать под твою дудку можно не одним промптом, а цепочкой из нескольких.
- Зачем выбирать подходящий промпт, если можно попросить LLM выбрать подходящий промп самой среди предложенных с пояснениями?!
- Не можешь пихнуть нужную инфу в промпт - просто отфильтрую нужный фрагмент с помощью similarity search и проблема решится.
- Чтоб LLM не фантазировала и не тупила при подсчетах - скорми ей специальную базу знаний.
- LLM это не база данных, это штука, которая умеет делать выводы, если ей верно подсовывать актуальную информацию.
- Как оценить качество ответа модели? Дать сделать ей это самой.

📀 LangChain Chat with Your Data
-
LangChain может распарсить почти любой фрагмент данных и превратить его в базу знаний. Будь это Ютуб, Ноушен или тупо набор PDF файлов.
- Как впихнуть невпихуемое? Сделать сперва по БЗ предварительный similarity search
- Что если БЗ не хватает для ответа на вопрос? - Подгружаем ей внешние БЗ + добавляем силу GPT и тогда качество вполне себе ок.
- Чаты в LangChain позволяют сплитить диалог хоть по сообщениям, хоть по токенам и тп. Оптимальнее всего тянуть именно сумаризированный диалог.

👨‍💻 ChatGPT Prompt Engineering for Developers
-
Если тебе кажется, что LLM тебя не понимает, значит ты не шаришь, как ей это объяснить.
- Если LLM сильно тупит, дай ей несколько примеров из БЗ. Почти всегда качество сильно выше.
- LLM могут все равно отклоняться от намеченных указаний, лучше подстраховаться пост процессингом .

Прохожу курсы вместе вас, не благодарите!

Говорят, скоро курсы сделают платными. Оно и понятно, считай за бесплатно дают подергать ChatGPT API.
👍53🔥9👎86
🍕 Побывал сегодня на 11-м съезде партнеров DoDo Brands.

👨‍💻->👩‍💻 Федор Овчинников больше не CEO DoDo Brands. Уже даже знаю, кто займет этот пост. Пред-история нового СЕО Алены Тиховой - вдохновляющая. Скоро расскажу, если накидайете 🔥

💪🤖 Утром в прод вышла первая моделька под моим лидированием. Еще две на подходе.

📦 Одноразовые коробки скоро заменятся многоразовыми боксами (см фото).

🐳 Старбакс sucks по сравнению с Дринкит

#1.5k_pizzerias
#150k🍋
#50%_market
#3.5_years
#DODOX2
🔥95👍10👎72🤔2
Media is too big
VIEW IN TELEGRAM
😝 В прошлом году, я проводил марафон по фармингу в онлайне. В этом году я пошел дальше и реализовал мечту замутить офлайн кемп. (Пока ковид)

🤫 Суть в кемпа в том, чтоб собираться по выходным и вместе фармить в компании опытных ребят с разношерстным бэкграундом.

🤔 Запустились на месяц. Посмотрим, сколько новых медалистов появится. Взяли самых активных участников курса, чтоб эффективнее их прокачивать.
👍54👎27🔥16
🧘‍♀️ «Выкатывай фичу в прод медленно, откатывай быстро».

😉👌 Аргумент на случай, если ваш руководитель недоволен скоростью
Please open Telegram to view this post
VIEW IN TELEGRAM
😁29👍11👎2
Если уж так вышло, что вы вкатываетесь в DS или в IT в солидном возврасте (40±5 лет), то вам, как вы возможно заметили, сложнее попасть на открытую позицию. Вот несколько моих советов в помощь:

Больше профессионального нетворкинга (конференции, сходки, кемпы).
Почти после любой конфы можно тет-а-тет поболтать с докладчиками из компаний, которые, как правило, могут искать в команду отвественных талантов. Нанимать намного легче человека, с которым общался вживую или видел, как человек при тебе кодил на хакатоне.

Курсы и комьюнити.
- Преподаватели курсов - это часто работающие в сфере люди. Не раз замечал, как мои коллеги в онлайн школах систематически хантили к себе новичков. Как и кого? - Например, когда на новых курсах давались зубодробительные или необкатанные домашки. Если находилсь студенты, которые несмотря на сложности справлялись с решением, да еще и приносили фидбек по улучшниям материалла, то хантились такие на раз-два.
- Комьюнити - это не всегда новички, это могут быть матерые спецы, которые пришли на курс еще немного прокачаться. Пользуйтесь этим. Пообщайтесь, узнайте нет ли у них открытых позиций или даже просто желания нанять кого-то еще. Если да, то вполне себе могут рефернуть вас, в обход воронки с HH.ru.

А зачем вам вообще найм? Есть же фриланс!
Набить опыт и получить крутые кейсы можно не только на курсах, но и получая небольшие заказы от людей, которым для решених их проблемы\идеи\задачи не нужен человек в штате, а вполне достаточно человека со сдельной систематической оплатой по часам.

Kaggle и хакатоны
Тут и говорить нечего, способ сложнее, но тоже рабочий. Есть чемпионаты, которые вовсе проводят лишь с целью познакомить будущих сотрудников с задачей с последующим хантингом в компанию для решения это самой задачи. И вообще, чемпионаты по Data Science это социальный лифт. Плевать какой у тебя возвраст и какой опыт у твоих аппонентов, перед задачей все равны. А выиграв или просто зайдя в обозримый топ лидерборда - ты становишься мишенью для HR’ов.

Пользуйтесь!
👍62🔥11👎8
🍕 Тут на Kaggle идет интересный чемпионат - ICR.

🍕 Много кто хейтит его за потенциальный сильный шейк-ап на привате, но я бы все же посоветовал смотреть на него иначе.

🍕 Если это лотерея - то почему бы не взять лотерейный билетик? Советую сделать одну простую модель и еще одну с небольшим шумом поверх.

🍕 И вот вы уже имеете шанс при сильном шейкапе попасть в медальную зону с вероятностью ±10%

🍕 Посмотрим, не выбросить ли нас из золота в этот раз 🙈🥇. Редкий чемпионат, где участвует почти 6.5к участников
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24👎7😁32🔥2
Решил узнать, а что вообще обо мне знает YandexGPT

Мдам-с, инфа не сотка, но зато быстро 😂
😁40👎10🏆72
🏆 Data Feeling | AI
🍕 Тут на Kaggle идет интересный чемпионат - ICR. 🍕 Много кто хейтит его за потенциальный сильный шейк-ап на привате, но я бы все же посоветовал смотреть на него иначе. 🍕 Если это лотерея - то почему бы не взять лотерейный билетик? Советую сделать одну…
В комментариях пожаловались, что слишком поздно предложил идею вытянуть лотерейный билет в ICR.

✔️ Исправлюсь и как альтернативу предлагаю текущих CommonLit. Это классических NLP чемпионат, который по механике борьбы очень похож на табличные чемпионаты.

🙈 Очень плотный лидерборд. Конкуренты массово и агрессивно файн-тюнят языковые модели. Просто напросто слизывают все вкусноту с HuggingFace и далее это все усредняют.

🧠 Что круто, теперь в опенсорс вышло много LLM архитектур по типу Ламы, Вайкуны, Альпаки и других зверей. Есть где разгуляться. Запросто можно обойти других какой-нибудь новенькой архитектурой.

😝Медленно, но уверенно идем к титулу мастера. Участвуйте!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32👎93