Aleron Backstage – Telegram
Aleron Backstage
792 subscribers
325 photos
53 videos
2 files
92 links
Секретное комьюнити Data Scientist’а маминой подруги

🦤 ML Team Lead
🧑‍💻 Head Data Feeling School
🐼 Part-time blogger @datafeeling
🦄 Part-time traveler
🤖 IT entrepreneur & investor

@Ale_v2
Download Telegram
Aleron Backstage
💡 Не хватает ML курсов, которые помимо снижения порога входа по знаниям предлагают еще и снижение порога входа по вычислительным мощностям для обучения на время прохождения курса.
😇 Теперь есть еще один курс, где эта проблема решается)

🍽 В общем, запарились и собрали сервак, чтоб давать своим юниорам больше преимуществ в чемпионатах.

😵‍💫 Сами помним, какого это страдать, когда у тебя либо данные в память не лезут, либо не можешь их локально или на гугл диска скачать, либо когда слабая GPU карточка считает не за пару часов, а за несколько дней.

🧐 Такое удовольствие обойдется нам в 25к+ в месяц на 3-4 человека.

🫥 Честно сказать, эту идею я подсмотрел, пока преподавал в Otus, где студентам на MLOps курсе выдают купоны к облачным сервисам Яндекса. (не реклама)
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆9🔥4
Не пытайтесь меня спасти. Мне уже ничто не поможет...
😁20🔥8👍3
🧠 Уже пару месяцев вынашиваю эту идею и все не могу решиться.

😳 Видел как это делают другие блогеры из других сфер, но сам тоже хочу попробовать.

💡 Идея иногда рассказывать про свой небольшой пет проектик по автоматической генерации контента в соцсетях. Хочу вывести его в окупаемость за год.

🤫 Сейчас сетки и опенсорс решения так скаканули вперед, что можно делать магию и никто даже не разгадает.

👫 В общем, пока только я успел собрать команду под этот проект. Разделить доли от потенциального успеха и разбить задачи. Есть бек, два DS-а и контент менеджер👩‍💼. Ну и 300к собственных инвестиций на старте.

🏷️ Эта серия постов будет рандомной, но с тегом #do_startup_not_job
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29
Aleron Backstage
🧠 Уже пару месяцев вынашиваю эту идею и все не могу решиться. 😳 Видел как это делают другие блогеры из других сфер, но сам тоже хочу попробовать. 💡 Идея иногда рассказывать про свой небольшой пет проектик по автоматической генерации контента в соцсетях.…
This media is not supported in your browser
VIEW IN TELEGRAM
КАК ПЕРЕВОДИТСЯ ФРАЗА "NEVER CEASE TO AMAZE ME"

NEVER CEASE TO AMAZE ME -
nevə siːs tuː əˈmeɪz miː - никогда не перестаешь удивлять

▪️ Humans never cease to amaze me. Люди никогда не перестанут меня удивлять.

▪️ My darling, You never cease to amaze me. Дорогая, ты не перестаешь удивлять меня.

▪️ By the way, you young people never cease to amaze me. Кстати, вы, молодёжь, не перестаёте меня изумлять.
6
Aleron Backstage
КАК ПЕРЕВОДИТСЯ ФРАЗА "NEVER CEASE TO AMAZE ME" NEVER CEASE TO AMAZE ME - nevə siːs tuː əˈmeɪz miː - никогда не перестаешь удивлять ▪️ Humans never cease to amaze me. Люди никогда не перестанут меня удивлять. ▪️ My darling, You never cease to amaze…
🫣 Пост выше сгенерирован тремя опенсорс решениями + python magic 🪄

🤫 Это вам пример, чтоб вы понимали уровень текущих технологий:)
🤯13😨3
Реверсинг рекомендательного ранжирования или миллионы выручки в месяц.

🧠 Кто-то зарабатывает, занимая позицию Data Scientist'а и настраивая системы рекомендаций, ранжирования и поиска.
А кто-то, зная, как это все работает, делает системы, которые укрощают системы ранжирования и поднимают людей в топ.

🤔 В зависимости от того, какую сторону баррикад вы занимаете, такие решения на основе понимания работы алгоритмов ранжирования можно назвать "фродом" или кнопкой "бабло". На острове, часто встречаю умных ребят. Есть такие, кто давно уже "прохавал, как жить эту жизнь" и не кисло так зарабатывает на решениях реверса ранжирования.

🍏 И нет, это не продажа гайдов по тому, как продвигаться в инсте через рилсы. Есть ребята, которые делают вещи умнее.

🎃🤟 Как и что они делают? Возьмем в качестве примера продажу на маркетплейсах. Там есть система ранжирования карточек при поиске.

🧩 Карточки в топе поиска, это карточки, которые:
1) Имеют историю покупок
2) Норм отзывы
3) Часто добавляются в корзину
4) другое ...

🍽 Что делать с этой инфой? Решение такое. Заводим 100 профилей пользователей. В идеале еще и 100 смартфонов под них завести в разных уголках города/страны.
Далее скупаем с части этих профилей свой товар. Оставляем положительные отзывы. Остальной частью этой армии все время имитируем изучение вашего товара с добавлением его в корзину. Как итог, спустя всего один цикл переобучения ранжирующей системы ваша карточка зависает в топе. (как правило реакция back loop'а в MLOps такой системы происходит раз в неделю, ну две). Если все правильно сделать, то как бы не старались конкуренты вашего домена, скинуть вниз вашу карточку будет непросто.

👨‍🔧 Вы скажите, что это все хрень, такая система не окупит себя, или ее быстро снесут. Увы, я бы так не думал 😅

😵‍💫 А теперь представьте, такие системы применимы в огромном числе сервисом ..., какое это поле для деятельности?! Недвижка, сервисы услуг экспертов, продажа товаров, соц.сети, приложения для водителей и много чего еще
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯11👍93😭3🔥2🗿1
Заходишь такой на встречу, а тут ...
🤯7👌6
🤔 А вы знали, что термин «Грэнд мастер» используется не только в рамках Kaggle?!

🚀 Один из смыслов этого титула - это персона, которая может наладить процесс, уйти, а процесс продолжит успешно функционировать и развиваться.

💭 Так вот пример, где одна из мох групп в тг летит сама без какого-либо маркетинга или пиара.

🧠 Все построено чисто на профитной механике комутиникации участников между собой. Как правило, комьюнити, где участники вносят вклад в «общее» и при этом сами в плюсе, развивается и расширяется органичным путем.
👍19
👨‍🎤 Генеративные модели это конечно круто, но смотрите как можно одним только BERT’ом намутить тему темскую.

🤔 Допустим, вы хотите автоматически генерить для своих пользователей вот такие «фразочки со смыслом» (см. скрин). Для этого можно нанять контент мейкера на hh.ru, а можно схантить себе берта на hugging face.


✈️ Допустим вы не хотите платить зп и берете второй вариант. Как заставить берт делать эту креативную работу вместо «кожаного мешка»? Вот алгоритм.

Выкачиваем датасет текстов статей с како-го нибудь иностранного сайта, где женщины пишут ванильные статьи для других женщин. Для старта хватит штук 10 пожирнее. В идеале из тематики отношений или карьерных советов.

Берем готовую модельку с 🤗, натравленную на сумаризацию текста.
Размечаем предложения в статьях по скору важности. Выбираем все, которые попадают в группу выше второго квартиля и с нормальной длинной.
Все. Теперь постим по одному рандомному предложению из списка, отрисовав красивым шрифтом на белом фоне.
Живем свою лучшую жизнь и ждем, пока соц сеть сама распиарить вашу группу с уникальным контентом.
Продаем рекламу.

Почему работает? А кто его знает!? Однако, люди любят рефлексировать над рандомными мыслями вне контекста, которые отражают их состояние/идеи/чувства в моменте.

#do_statrup_not_job
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥6🗿41
Forwarded from Deleted Account
This media is not supported in your browser
VIEW IN TELEGRAM
👍20😁1
Реализовали сегодня в DoDo MVP фичу для заказ пиццы голосом через chatGPT 🍕

Собрали из оперсорса и задеплоили за день 😅
🤗15🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
😁6👍2
😐 Недавно узнал, сколько денег тратится на облачные сервисы для аналитиков…

👨‍💻 Понял, почему иногда выгоднее закупить железа и нанять под это отдельного MLOps’а. Будет все равно выгоднее в раза два.

👨‍👩‍👧‍👦 Вероятно любые факты тут это NDA, поэтому цифры не рискну назвать, но это примерно 3-4 ставки DS’а по рынку на команду в 10-12 человек.

🤑 Вот вам официальные цены гугла + NVIDIA. Пцц какой-то
https://console.cloud.google.com/marketplace/product/nvidia/nvidia-ai-enterprise-vmi?pli=1&project=midyear-precept-363222&flow=gcp

🤒 Кстати, для курса по соревновательному DS мы как раз сами и собрали сервак. Сервак с картинки обошелся нам 18к в месяц
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯9👍4
Aleron Backstage
😐 Недавно узнал, сколько денег тратится на облачные сервисы для аналитиков… 👨‍💻 Понял, почему иногда выгоднее закупить железа и нанять под это отдельного MLOps’а. Будет все равно выгоднее в раза два. 👨‍👩‍👧‍👦 Вероятно любые факты тут это NDA, поэтому цифры…
То есть 1/3 зп спеца может уходить на инфру для него же самого. А ведь DS’ы часто могут еще и не приносить прибыли в чистом виде.

В общем, начинаешь задумываться о таком, когда встает вопрос окупаемости команды.
This media is not supported in your browser
VIEW IN TELEGRAM
🔥7😁2🤯2👍1
Скоро мысль напишу, но пока вот видосик один
This media is not supported in your browser
VIEW IN TELEGRAM
🔥5👎3
Aleron Backstage
Скоро мысль напишу, но пока вот видосик один
В общем. Мой выход в DoDo произошел перед днем рождения сети.

Празднует DoDo свой др с размахом. Со всей страны съезжаются сотрудники, снимается большое пространство, организуется всякие развлечения, выступления в том числе Федора Овчинникова и тп. Выше фрагмент, как это выглядит в моменте.

😳 ДоДо уже 12 лет и за это время было открыто 950+ пиццерий. Для сравнения, Doмино’с Пицца за первые 12 лет, открыло примерно 150 пиццерий.

А еще Додо представлена в 17 странах мира, в том числе в Дубае. (В Таиланде пока нет, но я двигаю тему 🤫)

Из того, что сильнее всего вдохновило, это некоторые мысли Федора. К примеру, на вопрос «А что дальше?» ведь уже и так сделано достаточно и можно просто пожимать плоды успешно работающей сети, Федор отвечает «Все только начинается».

И вот правда же, с каждым этапом развития какой-угодно компании всегда будут появляться новые челленджи. Челленджи, после которых ты скажешь себе «Такого раньше еще не было» или «Даже подумать не мог, что такое возможно». Скучно проживать жизнь, остановившись, видя далее примерно одно и тоже. Надо просто понять, что круто кайфовать от процесса развития, а не достижения конкретной точки.

В общем, классно, что в России есть такие «неугомонные люди», которым всегда не сидится на месте. За такими подсознательно хочется следовать.

😜 Что ж, будем разгонять тут ML экспертизу. Данных много
31🔥7🤪2
Еще один фрагментик 🧩