Data Brew – Telegram
Data Brew
1.03K subscribers
121 photos
34 videos
3 files
83 links
Пишу про рынок, собесы и заметки общего содержания.

Ютуб:https://www.youtube.com/@echemenev
Сотрудничество:@echemenev
Download Telegram
В этот раз мемов не так много набралось. Но я очень постарался найти хоть сколько нибудь годные.

Покидайте плиз в коменты с чего орали. А то прям не густо
5🔥3👌2😱1
Моя рабочая лошадка🐎

Пару недель работаю на маке все не могу привыкнуть к тому как же зарядка сильно магнититься.

Я тяну за провод и все боюсь что он порвется однажды.

Type-C лучше бы зашел конечно. Ну или круглая зарядка как на других ноутах.

А у вас какая сейчас техника рабочая?)

Upd: такую зарядку нужно «отламывать»
4🔥3👌2
Снова пятница, время очередной байки про собесы.

Ходил в этот раз в проект на рынке рекрутинга.

Здесь процесс начался через рефельную систему этой компании. Я написал чуваку и мое резюме закинули в кадры.

Вот такую ос получил:
Егор, привет!

Возвращаюсь с обратной связью, прости, что так долго, у нас затянули процессы
Прежде всего, спасибо тебе за проявленный интерес, нашу коммуникацию и пройденные этапы.
К сожалению, по итогам интервью, мы не готовы продолжить процесс, на текущие позиции нам не хватило уровня АБ(

Спасибо тебе ещё раз!
Давай оставаться на связи, надеюсь в будущем мы еще сможем пообщаться, а на данном этапе - удачи в поиске работы мечты!


Из того что запомнилось.
С помощью sql нужно было найти максимальное количество юзеров на платформе зараз.
Есть логи начала и окончания сессии. Я прикурил от этой задачи, с помощью подсказок я конечно дошел до решения, но первый раз такую задачу вообще получил, было интересно

Питон какой то базовый был, ничего не запомнилось.

И дальше была секция по Аб. Нужно было рассказать про свой дизайн и придумать для какой то фичи новый дизайн.

А дальше начали про методы снижения дисперсии, ну вы знаете вот они слева направо:
Бакетизация, CUPED, дельта-метод. Про них на уверенном я не смог сказать, это меня и подвело)

А ещё я упомянул про стратификацию🤗 начались вопросы и я себя закопал.

Каждый метод советую изучить. Я пока вроде немного понял про дельта метод и бакетизацию. Но вот cuped и стратификация в процессе.

Upd: дельта метод не снижает дисперсию. Хотел написать про линеризацию😳

UPD2:Проще: с дельта-метод нельзя применить CUPED, с линеаризацией можно
Please open Telegram to view this post
VIEW IN TELEGRAM
👍105🌚3🔥2😱2🤩1
Плавно дрейфуем в формат баек у костра. Ну а что, я все в поиске формата который будет и мне и вам интересен.

Факт от которого я все не могу придти в себя.
Все мы знаем порядок выполнения sql запроса и в каком порядке нужно указывать операторы в запросе.

По обыкновению пишу запрос в бд ( это MSSql) в таком формате
Select *
From table
Limit 100

А мне раз, ошибку. Пошел гуглить, в общем все и всё указывало что я прав)), но почему тогда запрос падает.

Потыкался и в итоге ничего не нашел кроме как написать у лс чуваку. Он рассказал что надо было вот так:
Select top 100 *
From table


Я думал меня уже не удивить, но вот такая ФИШКА подловила меня на ошибке 👦


Ну а у вас какие ФИШЕЧКИ встречались?)

Ps:
Ну ещё помню что однажды в версии бд не было оконных функций потому что стояла какая то древня версия все того же MSSql
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9😱8👌5👍2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
На что способен SQL
Ну вот игры можно делать: https://cedardb.com/blog/doomql/

Вы наверное заметили что я обожаю игру Doom, но я фанат последних игр после 2016 года. И тут я натыкаюсь на то что есть разные запуски doom на sql.👍

DOOMQL это DOOM, полностью в SQL на CedarDB. жаль не clickhouse

🤨А как: shell-скрипт запускает SQL-файл ~30 раз в секунду

🎁при разрешении 128×64 примерно будет 30 FPS,

🫡 код можно попробовать локально через Docker
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8🔥54😱1🤝1
N причин моей ненависти

Тебя бесят Дейли?

Я уже рассказал вам про то на сколько и почему мне не нравится разметка.

Решил продолжить серию постов про то что вызывает у меня ненависть🤬

На этот раз daily
Оу, бой. Как же я ненавижу Дейли…..
Были на Дейли? Нет?? Сейчас я расскажу как это выглядит в среднем у всех.

В календаре стоит встреча с 10:00 до 10:30, подключаешься в 10:00 и первые пару минут вы с коллегами общаетесь(смол ток), затем когда все собрались менеджер или тим лид проходится по задачам в джире в статусе "в работе" и спрашивает: ну че там? успеваешь? стоперы? блокеры?
и так по очереди все отвечают, кто то обязательно расскажет кучу контекста который только ему и важен пока эта задача в процессе, но слушать приходится всем.

Когда речь дойдет до тебя ты все рассказываешь за 2-3 минуты( потому что ты умный и не ждешь дейли если где то застрял),
В 10:30 +- 5 минут дейли заканчивается, но если к тебе были вопросы или ты нужен зачем то, то тебя просят остаться еще на минут 10-15.

И так каждый день, где то agile ритуалы отличаются, но глобально планерка/синк будет такой.

А теперь вопрос знатокам:
А ПОЧЕМУ ЭТО НЕ ТЕКСТОМ РЕШИТЬ? А ВРЕМЯ ДЕЙЛИ ТРАТИТЬ НА ТЕХ КОМУ ЭТО НУЖНО?

Я не знаю почему нельзя отписывать текстом к 10:00 в тред, и если какой то трабл говорить кто нужен и зачем.
Please open Telegram to view this post
VIEW IN TELEGRAM
10💯10🤝5😁2🤬1🙈1
Удобный агрегат в pandas

Ты выбираешь группировку или сводную таблицу?

В начале своей карьеры я как-то попался на особеность пандас, что нельзя передать в agg({'column_name':''max,'column_name':'min'}), вернется только один агрегат. Поэтому приходилось говнокодить и джойнить таблицы с разными агрегатами одного столбца. Я почему то не догодался, поискать как же все таки иначе можно сделать.

Поэтому решил помочь всем кто только так сказать начинает свои первые агрегаты собирать)

вот два способа как можно разные агрегаты для одного столбца посчитать:

df.groupby('group_name').agg(
col_mean=('column_name', 'mean'),
col_median=('column_name', 'median'),
col_min=('column_name', 'min'),
col_max=('column_name', 'max'),
col_count=('column_name', 'count'))



df.groupby('group').agg({
'value': ['min', 'max', 'mean']
})


пользуйтесь и делитесь !
197🫡6👍2🙈1
N+1 причин моей ненависти

А тебе как задачи ставят?

В этот раз про задачи в переписке/звонке.

Я терпеть не могу когда приходят с задачей не описанной в тикете и просто начинают тебе транслировать все что с ней связано. Потом спрашивают все ли понятно и когда она будет готова.

Ну и задачи которые ставятся в переписке тоже мало чем отличаются в лучшую сторону.

Я не говорю про задачи которые требуют 10 минут. А про полноценную работу.

Все это выливается в то, что на куче мелких задач ты теряешь время и фокус, не успевая сделать то что было в спринте.

Я конечно стараюсь каждый раз всех вести через тикет, но это не каждый раз получается.

Иллюзий что я буду жить в идеальном мире где все делается как надо у меня нет.

Но мой идеальный мир это:
Понятно и однозначно описанная задача и целевой результат. По пунктам распивать не нужно. Но постановка не должна содержать слов, которые непонятны или противоречивых требований.
Такой флоу:
Тикет>уточнение если нужно>план решения задачи>выполнение задачи>результат в тикет
(Да это выглядит как промт для ллм-агента)

Я не менеджер и не знаю как на самом деле должна выглядеть задача и ее постановка. А вы знаете?
👌65🌚4
Есть Крутая идея которая давно уже проситься для реализации

ФИЛЬРАЦИЯ ПО ПОЛЯМ В SELECT

Сейчас можно это сделать поместив все в подзапрос или CTE, но куда удобнее было бы сделать фильтр на пример:postwhere

Чтобы не так:
WITH ranked AS (
SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY date DESC) AS rn
FROM logins
)
SELECT *
FROM ranked
WHERE rn = 1


А вот так:
SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY date DESC) AS rn
FROM logins
Postwhere rn=1



Мне кажется фильтрация финального селекта уже назрела и сильно бы упростила жизнь.

Upd: Для этого есть qualify ) но не везде 😁
7👍5😱3🫡2
Про накрутчиков опыта слышали?


Вот идея для борьбы

Всем привет! Сообщества рекрутеров запускает флешмоб чистки от накрутчиков опыта. И чаще всего, лжекандидаты указывают крупные компании, поэтому сразу пишу к вам, чтобы передали вашим HR на обсуждение. Есть функции на самих job-site, которыми забыли пользоваться: пожаловаться на профиль. Эта функция есть и на hh, и на Хабре, и на Ln. Для первого этапа чистки нам нужно сначала найти всех, кто указал вашу компанию, и по факту не работал по ТК, ГПХ или ИП. Да, понадобиться слаженная работа всего HR. Но если у вас фриз найма, лучше поработать на будущее. Нужно прислать от компании официальное письмо на hh, habr career, ln о том, что данный данный сотрудник у вас не работал. На Хабре это делать удобнее (как в фото), плюс вы в профиле своей компании можете увидеть всех, кто указал вашу компанию. На hh можно сразу прислать весь список в службу поддержки. Это самый удобный способ без шеринга персональных данных, и массово мы можем сильно обрушить рынок волчат.


Мнения?
🤣165🫡3😱1
Где мемы лебовски ?

Ты любишь мемы?!

Завел отдельный канал для мемесов

https://news.1rj.ru/str/data_brew_memes

Только мемы которые я нашел быстро поднял и ушел.

Отбираю их лично из всех источников.

Немного мемов я уже выложил, тысячи в отложном лежат. Так что заходите.
🫡6😱3👌2👎1