Продолжаем нашу серию переводов про ценность измерения показателей для бизнеса на примере Амазон.
Татьяна сделала еще один перевод статьи про Amazon подход - Одержимость контролируемыми входными метриками
Поставьте лайки и поддержите комментом.
Таня сейчас бизнес/продуктовый аналитик в ДомКлике от Сбербанка, планирует развиваться в продуктовой аналитике и data science. Верит в большой потенциал у этого направления.
Она из химической технологии и науки перешла в Анализ данных, любит математику!! Но не Олимпиадница)))
Вот ее прошлая статья - Как Амазон измеряет эффективность. Обе эти статья помогут вам лучше понять роль аналитики в эффективности бизнеса и принятии бизнес решений.
Татьяна сделала еще один перевод статьи про Amazon подход - Одержимость контролируемыми входными метриками
Поставьте лайки и поддержите комментом.
Таня сейчас бизнес/продуктовый аналитик в ДомКлике от Сбербанка, планирует развиваться в продуктовой аналитике и data science. Верит в большой потенциал у этого направления.
Она из химической технологии и науки перешла в Анализ данных, любит математику!! Но не Олимпиадница)))
Вот ее прошлая статья - Как Амазон измеряет эффективность. Обе эти статья помогут вам лучше понять роль аналитики в эффективности бизнеса и принятии бизнес решений.
Хабр
Одержимость контролируемыми входными метриками
Этот перевод создан для телеграм-канала Инжиниринг Данных . И, так как, одной из задач создателей телеграм-канала и аналитического курса DataLearn является популяризация грамотной...
В среду 27 октября в 20:00 по мск вебинар.
Тема: Введение в Airflow
Ссылка: https://youtu.be/cVDIbEsCTow
Тема: Введение в Airflow
Ссылка: https://youtu.be/cVDIbEsCTow
YouTube
ВВЕДЕНИЕ В AIRFLOW / ПОНЯТИЕ DAG'а / НАСТРОЙКА DAG'а В AIRFLOW
Познакомимся с инструментом Airflow. Разберем что такое DAG и как его настраивать.
Ссылка на спикера: https://www.linkedin.com/in/dmitry-brazhenko/
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь…
Ссылка на спикера: https://www.linkedin.com/in/dmitry-brazhenko/
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь…
У Harvard есть много бесплатных онлайн курсов на Edx от лучших преподов мира, вот некоторые из них:
Самый популярный курс по Computer Science CS50 и его дополнительны стримы:
CS50's Introduction to Computer Science (единственный курс, который я частично смотрел, очень приятный)
CS50's Web Programming with Python and JavaScript
CS50's Introduction to Artificial Intelligence with Python
CS50's Introduction to Game Development
CS50's Understanding Technology
CS50's Mobile App Development with React Native
Даже есть для не технических пользователей:
CS50's Computer Science for Business Professionals
Есть и для Data Science:
Data Science: R Basics
Data Science: Machine Learning
Data Science: Wrangling
Data Science: Productivity Tools
Data Science: Linear Regression
Data Science: Visualization
Data Science: Probability
Data Science: Inference and Modeling
Есть Leadership:
Exercising Leadership: Foundational Principles
Remote Work Revolution for Everyone
PS Если вы выбираете специализацию, то уже стоит денюшку.
Самый популярный курс по Computer Science CS50 и его дополнительны стримы:
CS50's Introduction to Computer Science (единственный курс, который я частично смотрел, очень приятный)
CS50's Web Programming with Python and JavaScript
CS50's Introduction to Artificial Intelligence with Python
CS50's Introduction to Game Development
CS50's Understanding Technology
CS50's Mobile App Development with React Native
Даже есть для не технических пользователей:
CS50's Computer Science for Business Professionals
Есть и для Data Science:
Data Science: R Basics
Data Science: Machine Learning
Data Science: Wrangling
Data Science: Productivity Tools
Data Science: Linear Regression
Data Science: Visualization
Data Science: Probability
Data Science: Inference and Modeling
Есть Leadership:
Exercising Leadership: Foundational Principles
Remote Work Revolution for Everyone
PS Если вы выбираете специализацию, то уже стоит денюшку.
edX
HarvardX: CS50's Introduction to Computer Science | edX
An introduction to the intellectual enterprises of computer science and the art of programming.
Зато у Harward нету программы по data engineering. Но не беда, если вы в Бостоне Кембридже, вы можете проехать пару станций на метро и на реке Черльз красуется MIT.
Всего за 7000US$ и 6 месяцав, 20 часов в неделю, к сожалению онлайн вас научат как быть Инженером данных - Professional Certificate in Data Engineering
"Data engineering really is a core component of today’s data infrastructure. And because organizations can’t function without data, it’s also a career with a great deal of opportunity and incredibly interesting work as well."
– Abel Sanchez, Research Scientist and Executive Director of MIT’s Geospatial Data Center
Как сказал Абель, без инжиниринга не будет даты, а без даты все организации умрут. То есть это хороший deal, за 7т спастизагнивающие западные корпорации😜
Давайте посмотрим чему вас научат:
Секция 1:
Модуль 1-3: Python, NumPy и Pandas (они не хотили копировать data learn и решили сделать наоборот, сначало посложней Python, а потом полегче - SQL🙅♂️)
Модуль 4-6: SQL от простого до Advanced (это наверно Window функции)
Модуль 7-8: Проектики
Секция 2:
Модуль 9: Python кейс в IDE (заинтриговали!)
Модуль 10-12: SDE скилы (git, CLI, CI/CD - расскажут про необходимость + Agile💃)
Модуль 13-15: Базы данных (вы узнаете, что данные хранятся в базах данных в таблицах, и вы поймете, зачем было столько SQL!)
Модуль 16: Data Wrangling (все время путаю с фирмой джинсов Wrangler)
Секция 3:
Модуль 17-18: Хранилище данных (скажут, что это база даннных, но БОЛЬШАЯ)
Модуль 19-20: BigData (расскажут вам история hadoop, и намекнут, что слоник то on fire🐘)
Модуль 21-22: Streaming и Distributed Computing (наверно покажут вам Kafka и Spark)
Модуль 23-24: Введение в AI и ML (наверно дадут билет на метро до Harward, чтобы вы обратно проехали 2 остановки и поучили AI и ML, а лучше слетать к Анастасии Риццо на Мальту или посмотреть ее онлайн курс про введение в DS&ML101).
После завершения у вас будет сертификат, вы можете перейти дорогу и поймать за рукав HR Amazon, а лучше стоять с сертификатом у офиса Амазон! Помимо сертификата, скорей всего, у вас будет кредит на 7000 долларов в добавок к кредуту за iphone 13.
PS Это еще не все! Вас научать как сделать резюме, обновить профайл LinkedIn (кстати отечественные курсы еще могут учить как VPN🪗 установить), покажут сайты для поиска работы и как вести переговоры про зарплату.
А если посмотреть для кого этот курс, то мы увидим вообще всех желающих. Я бы на них посмотрел, как они будут Python учить. Как по мне, это не просто с 0 въехать, уже лучше в SQL разобраться сначала.
Всего за 7000US$ и 6 месяцав, 20 часов в неделю, к сожалению онлайн вас научат как быть Инженером данных - Professional Certificate in Data Engineering
"Data engineering really is a core component of today’s data infrastructure. And because organizations can’t function without data, it’s also a career with a great deal of opportunity and incredibly interesting work as well."
– Abel Sanchez, Research Scientist and Executive Director of MIT’s Geospatial Data Center
Как сказал Абель, без инжиниринга не будет даты, а без даты все организации умрут. То есть это хороший deal, за 7т спасти
Давайте посмотрим чему вас научат:
Секция 1:
Модуль 1-3: Python, NumPy и Pandas (они не хотили копировать data learn и решили сделать наоборот, сначало посложней Python, а потом полегче - SQL🙅♂️)
Модуль 4-6: SQL от простого до Advanced (это наверно Window функции)
Модуль 7-8: Проектики
Секция 2:
Модуль 9: Python кейс в IDE (заинтриговали!)
Модуль 10-12: SDE скилы (git, CLI, CI/CD - расскажут про необходимость + Agile💃)
Модуль 13-15: Базы данных (вы узнаете, что данные хранятся в базах данных в таблицах, и вы поймете, зачем было столько SQL!)
Модуль 16: Data Wrangling (все время путаю с фирмой джинсов Wrangler)
Секция 3:
Модуль 17-18: Хранилище данных (скажут, что это база даннных, но БОЛЬШАЯ)
Модуль 19-20: BigData (расскажут вам история hadoop, и намекнут, что слоник то on fire🐘)
Модуль 21-22: Streaming и Distributed Computing (наверно покажут вам Kafka и Spark)
Модуль 23-24: Введение в AI и ML (наверно дадут билет на метро до Harward, чтобы вы обратно проехали 2 остановки и поучили AI и ML, а лучше слетать к Анастасии Риццо на Мальту или посмотреть ее онлайн курс про введение в DS&ML101).
После завершения у вас будет сертификат, вы можете перейти дорогу и поймать за рукав HR Amazon, а лучше стоять с сертификатом у офиса Амазон! Помимо сертификата, скорей всего, у вас будет кредит на 7000 долларов в добавок к кредуту за iphone 13.
PS Это еще не все! Вас научать как сделать резюме, обновить профайл LinkedIn (кстати отечественные курсы еще могут учить как VPN🪗 установить), покажут сайты для поиска работы и как вести переговоры про зарплату.
А если посмотреть для кого этот курс, то мы увидим вообще всех желающих. Я бы на них посмотрел, как они будут Python учить. Как по мне, это не просто с 0 въехать, уже лучше в SQL разобраться сначала.
executive-ed.xpro.mit.edu
Data Engineering Certification with MIT xPRO | Data Engineer Online Course
Are you a ready develop cutting-edge skills to advance your data engineering career? Apply now to enroll in this 6-month online program from MIT xPro. Registration ends soon.
Forwarded from Alexey Dmitriev
Всем привет!
Возвращаюсь с отзывом)
Чего по-жизни хотел:
Хотел больше работать головой и не заниматься рутинной(повторяющейся) работой. А еще стабилизировать и увеличить свой доход.
Начну со своего опыта:
МГУ или ВШЭ за плечами нет, рядовое техническое высшее образование. Хорошие коммуникативные навыки + желание разбираться в вещах.
Прошел путь из жутко надоевшей мне сферы продаж в аналитику. Сейчас получил оффер в Х5 на Инженера данных и продолжаю учиться :)
Учился долго, до оффера прошло около 9-12 месяцев, из которых первые месяцы- расслабленная учеба с кучей сомнений с мыслями "А получится ли?" и 5 месяцев плотной учебы.
Теперь я понимаю, что этот путь можно было сократить до 6 месяцев
Учился в скиллбоксе на data analyst + подкреплял и расширял знания курсами от DataLearn DE. Сейчас смотрю вебинары DataLearn + учусь на Data Engineer от Karpov Courses
Самое забавное, что не до конца было понятно, клево этим заниматься или нет и какую должность хочу занимать.
Прошел 5 модулей(делал, но не сдавал домашки), но после НГ продолжу дальше :)
О DataLearn:
Потрясающий бесплатный подарок на ютубе, который позволяет понять, что именно делают аналитики, дата сайнтисты, инженеры и зачем они это делают.
Программа DataLearn сформирована очень хорошо и начинается с базовых принципов и основ, чего не было в Skillbox - там сразу учат Python и SQL, где решаешь задачки с непонятным бизнес-смыслом)
Первые три модуля datalearn мне позволили структурировать знания и понять, куда я хочу двигаться.
Выполнять домашки оч важно, именно они позволяют разобраться в том или ином инструменте. Я был в восторге, когда привычные excel таблицы превратил в красивый интерактивный дашборд.
Для того, что бы лучше усвоить Tableau, показанное в DataLearn- прошел короткий бесплатный курс на Stepik.org(пару дней)
После этого данные, которые я отобразил в экселе засияли новыми красками в Tableau. (Потом при трудоустройстве показывал потенциальным работодателям- всем нравилось)
Вебинары от DataLearn:
Отдельный жирный плюс создателям. Ребята приглашают хороших спикеров, которые являются практиками, рассказывающие о сложных вещах простым языком. Людей на вебинаре было не много, поэтому всегда мог комфортно задать все интересующие вопросы :)
После вебинара выходишь с пониманием, что можно теперь легко освоить новый инструмент и выполнить на нем задачку.
Почему так много курсов, а не только DataLearn:
Скиллбокс купил по-неопытности + заметил за собой, что платный курс больше мотивирует его закончить. Глупо, но для меня это так :)
Было сложно?
Да, сложно :)
Я забыл "про деньги и материальные радости" примерно на год, что бы я мог уделять гораздо больше времени учебе.
Самое сложное было это пересилить себя и начать регулярно заниматься и учиться новому. Особенно, когда не верил в свои силы.
Но когда вошел в учебный раш, то главное не останавливаться и делать-делать-делать, думать о туманном будущем становится некогда :)
После 4 месяцев занятий начал понимать, что я двигаюсь к цели и у меня начинает получаться что-то полезное :)
Первое трудоустройство:
Самый сложный и болезненный этап :)
Отправлял около 300 откликов, получил 15 заданий, выполнил около 10 заданий, получил один оффер. Конкуренция на старте огромная, на меня "без опыта" почти не смотрели. В условиях денежного дефицита переживать такое сложно :)
Но после того, как получите хоть малейший опыт, эйчары вас с руками оторвут :)
Стоило ли?
Однозначно ДА!
Я узнал много нового о бизнесе, о способах анализировать что-угодно. Я понял что данные- это очень ценный ресурс.
Мне очень нравится работа, задачи, отношение работодателя. Чувствую себя ценным кадром.
Я горжусь собой настоящим, это очень приободряет.
Спустя 1.5 года после начала пути в аналитику я вышел на доход, бОльший, чем за опыт 5 лет в сфере продаж.
Я знаю куда развиваться и кем я могу быть через 3, 5 лет и на какой доход смогу рассчитывать.
Возвращаюсь с отзывом)
Чего по-жизни хотел:
Хотел больше работать головой и не заниматься рутинной(повторяющейся) работой. А еще стабилизировать и увеличить свой доход.
Начну со своего опыта:
МГУ или ВШЭ за плечами нет, рядовое техническое высшее образование. Хорошие коммуникативные навыки + желание разбираться в вещах.
Прошел путь из жутко надоевшей мне сферы продаж в аналитику. Сейчас получил оффер в Х5 на Инженера данных и продолжаю учиться :)
Учился долго, до оффера прошло около 9-12 месяцев, из которых первые месяцы- расслабленная учеба с кучей сомнений с мыслями "А получится ли?" и 5 месяцев плотной учебы.
Теперь я понимаю, что этот путь можно было сократить до 6 месяцев
Учился в скиллбоксе на data analyst + подкреплял и расширял знания курсами от DataLearn DE. Сейчас смотрю вебинары DataLearn + учусь на Data Engineer от Karpov Courses
Самое забавное, что не до конца было понятно, клево этим заниматься или нет и какую должность хочу занимать.
Прошел 5 модулей(делал, но не сдавал домашки), но после НГ продолжу дальше :)
О DataLearn:
Потрясающий бесплатный подарок на ютубе, который позволяет понять, что именно делают аналитики, дата сайнтисты, инженеры и зачем они это делают.
Программа DataLearn сформирована очень хорошо и начинается с базовых принципов и основ, чего не было в Skillbox - там сразу учат Python и SQL, где решаешь задачки с непонятным бизнес-смыслом)
Первые три модуля datalearn мне позволили структурировать знания и понять, куда я хочу двигаться.
Выполнять домашки оч важно, именно они позволяют разобраться в том или ином инструменте. Я был в восторге, когда привычные excel таблицы превратил в красивый интерактивный дашборд.
Для того, что бы лучше усвоить Tableau, показанное в DataLearn- прошел короткий бесплатный курс на Stepik.org(пару дней)
После этого данные, которые я отобразил в экселе засияли новыми красками в Tableau. (Потом при трудоустройстве показывал потенциальным работодателям- всем нравилось)
Вебинары от DataLearn:
Отдельный жирный плюс создателям. Ребята приглашают хороших спикеров, которые являются практиками, рассказывающие о сложных вещах простым языком. Людей на вебинаре было не много, поэтому всегда мог комфортно задать все интересующие вопросы :)
После вебинара выходишь с пониманием, что можно теперь легко освоить новый инструмент и выполнить на нем задачку.
Почему так много курсов, а не только DataLearn:
Скиллбокс купил по-неопытности + заметил за собой, что платный курс больше мотивирует его закончить. Глупо, но для меня это так :)
Было сложно?
Да, сложно :)
Я забыл "про деньги и материальные радости" примерно на год, что бы я мог уделять гораздо больше времени учебе.
Самое сложное было это пересилить себя и начать регулярно заниматься и учиться новому. Особенно, когда не верил в свои силы.
Но когда вошел в учебный раш, то главное не останавливаться и делать-делать-делать, думать о туманном будущем становится некогда :)
После 4 месяцев занятий начал понимать, что я двигаюсь к цели и у меня начинает получаться что-то полезное :)
Первое трудоустройство:
Самый сложный и болезненный этап :)
Отправлял около 300 откликов, получил 15 заданий, выполнил около 10 заданий, получил один оффер. Конкуренция на старте огромная, на меня "без опыта" почти не смотрели. В условиях денежного дефицита переживать такое сложно :)
Но после того, как получите хоть малейший опыт, эйчары вас с руками оторвут :)
Стоило ли?
Однозначно ДА!
Я узнал много нового о бизнесе, о способах анализировать что-угодно. Я понял что данные- это очень ценный ресурс.
Мне очень нравится работа, задачи, отношение работодателя. Чувствую себя ценным кадром.
Я горжусь собой настоящим, это очень приободряет.
Спустя 1.5 года после начала пути в аналитику я вышел на доход, бОльший, чем за опыт 5 лет в сфере продаж.
Я знаю куда развиваться и кем я могу быть через 3, 5 лет и на какой доход смогу рассчитывать.
Forwarded from Alexey Dmitriev
Чего бы я поменял в datalearn:
Я бы хотел иметь возможность проходить курс платно за возможность получить наставника.
Платный курс позволяет задать 20 вопросов преподавателю по дз и материалы, а он на них ответит и подскажет как сделать лучше.
Хотя и сейчас это уже большое комьюнити, где можно задавать вопросы и получать на них ответы.
Спасибочки:
Cпасибо Дмитирию, Роману, Анастасии, Роману Бунину, Роману Зыкову и другим участвующим в создании и улучшении этого курса!
Вы молодцы!
С вашей помощью я стал доволен своими знаниями, местом работы, задачами, коллективом, доходом.
Дорогой ученик:
Не волнуйся, у тебя все получится. Если уделять время- точно получится. Это не просто, но точно того стоит!
Не избегай собеседований. Тестовые задания очень меня прокачали. Каждое следующее собеседование проходит лучше. Проси обратную связь от эйчаров и анализируй.
PS. Очень помогли еще занятия с психологом. (для тех, кто не может определиться)
Бонус для жителей МСК:
Я сказал ранее, что перехожу в другую компанию на data engineer.
Но мое место, где я взял старт в аналитике - освобождается :)
https://hh.ru/vacancy/49128970 - это смесь аналитика CRM, data analyst, data engineer.
Ищут джуна, можно прийти без опыта, если будешь готов стараться и уже умеешь работать с sql, немного питона и понимаешь, зачем работает бизнес. Вакансия интересная и там хороший коллектив.
Заинтересованным: пишите мне, я сосватаю эйчару, так будет проще попасть на собеседование :)
Я бы хотел иметь возможность проходить курс платно за возможность получить наставника.
Платный курс позволяет задать 20 вопросов преподавателю по дз и материалы, а он на них ответит и подскажет как сделать лучше.
Хотя и сейчас это уже большое комьюнити, где можно задавать вопросы и получать на них ответы.
Спасибочки:
Cпасибо Дмитирию, Роману, Анастасии, Роману Бунину, Роману Зыкову и другим участвующим в создании и улучшении этого курса!
Вы молодцы!
С вашей помощью я стал доволен своими знаниями, местом работы, задачами, коллективом, доходом.
Дорогой ученик:
Не волнуйся, у тебя все получится. Если уделять время- точно получится. Это не просто, но точно того стоит!
Не избегай собеседований. Тестовые задания очень меня прокачали. Каждое следующее собеседование проходит лучше. Проси обратную связь от эйчаров и анализируй.
PS. Очень помогли еще занятия с психологом. (для тех, кто не может определиться)
Бонус для жителей МСК:
Я сказал ранее, что перехожу в другую компанию на data engineer.
Но мое место, где я взял старт в аналитике - освобождается :)
https://hh.ru/vacancy/49128970 - это смесь аналитика CRM, data analyst, data engineer.
Ищут джуна, можно прийти без опыта, если будешь готов стараться и уже умеешь работать с sql, немного питона и понимаешь, зачем работает бизнес. Вакансия интересная и там хороший коллектив.
Заинтересованным: пишите мне, я сосватаю эйчару, так будет проще попасть на собеседование :)
hh.ru
Вакансия Аналитик качества данных в Москве, работа в компании Hoff (вакансия в архиве c 14 января 2022)
Зарплата: не указана. Москва. Требуемый опыт: 1–3 года. Полная занятость. Дата публикации: 29.12.2021.
SQL with Squid Games.pdf
424.7 KB
Базовый SQL на примере Squid Games. Хороший подход, сразу понятно для тех, кто смотрел сериал. (внутри спойлеры)
Пример решения и архитектура от компании Monzo. Используют DBT на Google cloud.
https://medium.com/data-monzo/an-introduction-to-monzos-data-stack-827ae531bc99
https://medium.com/data-monzo/an-introduction-to-monzos-data-stack-827ae531bc99
Databricks продолжает двигаться на встречу low-code приложениям и приобретать user friendly решения (другое было ReDash -> SQL Analytics) - Databricks acquires 8080 Labs to extend its low-code/no-code capabilities
Как будто Code приложение становятся Low Code. А вот No Code/Low Code становятся наоборот Analytics as a Code.
🤪
Как будто Code приложение становятся Low Code. А вот No Code/Low Code становятся наоборот Analytics as a Code.
🤪
TechCrunch
Databricks acquires 8080 Labs to extend its low-code/no-code capabilities
Databricks today announced that it has acquired German startup 8080 Labs, the company behind bamboolib, a popular GUI for the Python-based Pandas data analysis and manipulation tool. Bamboolib allows data scientists to quickly and easily explore their data…
Судя по отзывам хорошая книга!
In this book, Jesse does an excellent job distilling all of Git down to the core of what you really need to know to be successful as a developer, not exclusively, but especially if you are in a team environment. He demystifies many Git commands and concepts, particularly ones that tend to frighten the most hardened of developers. Rebase anyone?
In this book, Jesse does an excellent job distilling all of Git down to the core of what you really need to know to be successful as a developer, not exclusively, but especially if you are in a team environment. He demystifies many Git commands and concepts, particularly ones that tend to frighten the most hardened of developers. Rebase anyone?
Вчера состоялось историческое событие: подписан Российский национальный кодекс этики искусственного интеллекта, который призван наложить определенные ограничения на разработчиков и дата-инженеров.
Так, в ходе обсуждение проблемы с ИИ, Наталья Касперская, президент InfoWatch заявила, что разработчики, «в силу человеческой лени», предпочитают обучать ИИ на базах, которые лежат в свободном доступе в интернете, и «непонятно что в них напихано».
Согласны? ДА / НЕТ
Ещё много занятных высказываний с конференции от топов отрасли выкладывается тут: https://news.1rj.ru/str/cdo2day
PS пост поддержал приют для собак Зоорассвет в Москве
Так, в ходе обсуждение проблемы с ИИ, Наталья Касперская, президент InfoWatch заявила, что разработчики, «в силу человеческой лени», предпочитают обучать ИИ на базах, которые лежат в свободном доступе в интернете, и «непонятно что в них напихано».
Согласны? ДА / НЕТ
Ещё много занятных высказываний с конференции от топов отрасли выкладывается тут: https://news.1rj.ru/str/cdo2day
PS пост поддержал приют для собак Зоорассвет в Москве
Telegram
CDO2Day
Наталья Касперская, президент группы компаний InfoWatch, соучредитель «Лаборатории Касперского»:
Разработчики, «в силу человеческой лени», предпочитают обучать ИИ на базах, которые лежат в свободном доступе в интернете, и «непонятно что в них напихано»
Разработчики, «в силу человеческой лени», предпочитают обучать ИИ на базах, которые лежат в свободном доступе в интернете, и «непонятно что в них напихано»
Можно только позавидовать с какой периодичностью - раз в год, один и тот же человек спрашивает "Есть что добавить спустя год?" (Пост про хранилище в Тинькофф на Greenplum DB) И каждый раз получает развернутый ответ.
Я далек от рынка СУБД в РФ и знаю про 2 продукта Greenplum DB и ClickHouse. Первый мне нравится намного больше, так как он работает по таким же принципам как Терадаты, Редшифт. Но при этом опен сорс. Если я делал решение и было бы ограничение, я бы 💯 использовал Greenplum DB. А вы что выбираете и почему?
Я далек от рынка СУБД в РФ и знаю про 2 продукта Greenplum DB и ClickHouse. Первый мне нравится намного больше, так как он работает по таким же принципам как Терадаты, Редшифт. Но при этом опен сорс. Если я делал решение и было бы ограничение, я бы 💯 использовал Greenplum DB. А вы что выбираете и почему?
Forwarded from Roman Timofeev
Forwarded from Data Events
#Завтра 2021-10-28 :
🤦♂️11:00 “Распознавание лиц: все, что нужно знать об этой технологии"
🚕18:00 Citymobil Data Meetup №3
🚌12:00 Применение ГЕОаналитики на основе Big Data для принятия управленческих решений в сфере транспортного планирования
✅ 16:00 - 22:00 Commvault Connections21, Агенда
🇷🇺В Санкт-Петербурге состоится Всероссийская конференция «Вектор будущего»
❓22:00 Как, выстраивая архитектуру аналитики, найти баланс между Apache Spark и СУБД с массово-параллельной обработкой (#MPP)?
🥳 19:00 DevTools Party в Яндексе
18:00-20:30 Epistemological AI for Natural Language Understanding (NLU) — Михаил Молин
🎙21:00 в голосовом чате планируем обсудить тему технологической зрелости и области #MLOps в целом, и инструментария в частности (в особенности с открытым исходным кодом).
🤦♂️11:00 “Распознавание лиц: все, что нужно знать об этой технологии"
🚕18:00 Citymobil Data Meetup №3
🚌12:00 Применение ГЕОаналитики на основе Big Data для принятия управленческих решений в сфере транспортного планирования
✅ 16:00 - 22:00 Commvault Connections21, Агенда
🇷🇺В Санкт-Петербурге состоится Всероссийская конференция «Вектор будущего»
❓22:00 Как, выстраивая архитектуру аналитики, найти баланс между Apache Spark и СУБД с массово-параллельной обработкой (#MPP)?
🥳 19:00 DevTools Party в Яндексе
18:00-20:30 Epistemological AI for Natural Language Understanding (NLU) — Михаил Молин
🎙21:00 в голосовом чате планируем обсудить тему технологической зрелости и области #MLOps в целом, и инструментария в частности (в особенности с открытым исходным кодом).
Компания Thoughtworks решила заморочиться и выпустила Technology Radar. Сама картинка читается сложно без пояснительной записки.
The Radar captures the output of the Technology Advisory Board’s discussions in a format that provides value to a wide
range of stakeholders, from developers to CTOs. The content is intended as a concise summary.
Adopt: We feel strongly that the industry should be adopting these items. We use them when appropriate in our projects.
Trial: Worth pursuing. It’s important to understand how to build up this capability.
Enterprises can try this technology on a project that can handle the risk.
Assess: Worth exploring with the goal of understanding how it will affect your enterprise.
Hold: Proceed with caution.
В этом докладе вы найдете все популярные инструменты и buzz words и можете посмотреть, где они на графе.
Сама компания занимается консалтингом и именно их архитектор активно топит за Data Mesh
The Radar captures the output of the Technology Advisory Board’s discussions in a format that provides value to a wide
range of stakeholders, from developers to CTOs. The content is intended as a concise summary.
Adopt: We feel strongly that the industry should be adopting these items. We use them when appropriate in our projects.
Trial: Worth pursuing. It’s important to understand how to build up this capability.
Enterprises can try this technology on a project that can handle the risk.
Assess: Worth exploring with the goal of understanding how it will affect your enterprise.
Hold: Proceed with caution.
В этом докладе вы найдете все популярные инструменты и buzz words и можете посмотреть, где они на графе.
Сама компания занимается консалтингом и именно их архитектор активно топит за Data Mesh
Через 15 минут начинаем:
https://youtu.be/cVDIbEsCTow
https://youtu.be/cVDIbEsCTow
YouTube
ВВЕДЕНИЕ В AIRFLOW / ПОНЯТИЕ DAG'а / НАСТРОЙКА DAG'а В AIRFLOW
Познакомимся с инструментом Airflow. Разберем что такое DAG и как его настраивать.
Ссылка на спикера: https://www.linkedin.com/in/dmitry-brazhenko/
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь…
Ссылка на спикера: https://www.linkedin.com/in/dmitry-brazhenko/
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь…
В дополнение к прошедшему вебинару по Airflow представляем перевод статьи от создателя этого инструмента о размышлении про будущее инженера данных.
Ссылка на перевод:
https://vc.ru/hr/311461-budushchee-inzhenera-dannyh
Также перевод продублирован на Яндекс.Дзен
https://zen.yandex.ru/media/id/61706aa4298d6612db1752e5/buduscee-injenera-dannyh-61799bd2126be27e399c4071
Ссылка на перевод:
https://vc.ru/hr/311461-budushchee-inzhenera-dannyh
Также перевод продублирован на Яндекс.Дзен
https://zen.yandex.ru/media/id/61706aa4298d6612db1752e5/buduscee-injenera-dannyh-61799bd2126be27e399c4071
vc.ru
Будущее Инженера Данных — Карьера на vc.ru
Автор оригинала: Maxime Beauchemin
В какой-то момент своей аналитической карьеры (а может быть и до ее начала) вы захотите овладеть software engineering best practices и вообще почитать что-нибудь по этой теме. Вот некоторые из книг:
- Clean Code: A Handbook of Agile Software Craftsmanship
- The Pragmatic Programmer: From Journeyman to Master
- Refactoring: Improving the Design of Existing Code
- Test-Driven Development: By Example
- Code Complete
- The Missing Readme: A Guide for the New Software Engineer (в канале даже было обсуждение и в комментах была pdf)
Можете в комменты добавить ваши варианты. Однажды мы сможем написать чистый и красивый код...
- Clean Code: A Handbook of Agile Software Craftsmanship
- The Pragmatic Programmer: From Journeyman to Master
- Refactoring: Improving the Design of Existing Code
- Test-Driven Development: By Example
- Code Complete
- The Missing Readme: A Guide for the New Software Engineer (в канале даже было обсуждение и в комментах была pdf)
Можете в комменты добавить ваши варианты. Однажды мы сможем написать чистый и красивый код...
Goodreads
Clean Code: A Handbook of Agile Software Craftsmanship
Even bad code can function. But if code isn't clean, it…
А вот свеженькая книжка по нашей тематике: The Informed Company: How to Build a Cloud-Based Data Stack to Explore and Understand Data
- Discover the data stack strategies that are working for today's successful small, medium, and enterprise companies
- Learn the different Agile stages of data organization, and the right one for your team
- Learn how to maintain Data Lakes and Data -Warehouses for effective, accessible data storage
- Gain the knowledge you need to architect Data Warehouses and Data Marts
- Understand your business's level of data sophistication and the steps you can take to get to "level up" your data
https://theinformedcompany.com/ было бы интересно полистать PDF если у кого будет;)
Кстати авторы книги крутые - Dave Fowler (CEO of Chartio - now acquired by Atlassian) and Matt David ( Head of The Data School)
- Discover the data stack strategies that are working for today's successful small, medium, and enterprise companies
- Learn the different Agile stages of data organization, and the right one for your team
- Learn how to maintain Data Lakes and Data -Warehouses for effective, accessible data storage
- Gain the knowledge you need to architect Data Warehouses and Data Marts
- Understand your business's level of data sophistication and the steps you can take to get to "level up" your data
https://theinformedcompany.com/ было бы интересно полистать PDF если у кого будет;)
Кстати авторы книги крутые - Dave Fowler (CEO of Chartio - now acquired by Atlassian) and Matt David ( Head of The Data School)
Вчера у нас был замечательный вводный вебинар/урок/демонстрация про Airflow от Дмитрия Браженко, вот запись.
Я бы очень хотел бы сделать такие же вебинары вводные про
- GreenplumDB
- Clickhouse
Еще бы посмотрели про Apache Superset.
Если у вас есть опыт с этими технологиями и хотите поделиться, welcome! Напишите Роману @rspon, сделает все в лучшем виде! Как раз сейчас модуль 6 про аналитические хранилища, а я могу только про западные рассказывать.
Я бы очень хотел бы сделать такие же вебинары вводные про
- GreenplumDB
- Clickhouse
Еще бы посмотрели про Apache Superset.
Если у вас есть опыт с этими технологиями и хотите поделиться, welcome! Напишите Роману @rspon, сделает все в лучшем виде! Как раз сейчас модуль 6 про аналитические хранилища, а я могу только про западные рассказывать.
YouTube
ВВЕДЕНИЕ В AIRFLOW / ПОНЯТИЕ DAG'а / НАСТРОЙКА DAG'а В AIRFLOW
Познакомимся с инструментом Airflow. Разберем что такое DAG и как его настраивать.
Ссылка на спикера: https://www.linkedin.com/in/dmitry-brazhenko/
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь…
Ссылка на спикера: https://www.linkedin.com/in/dmitry-brazhenko/
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь…
Ваша любимая база данных стала единорогом!https://www.forbes.ru/tekhnologii/444423-osnovannyj-andeksom-startap-clickhouse-stal-edinorogom
Forbes.ru
Основанный «Яндексом» стартап ClickHouse стал «единорогом»
Компания ClickHouse, созданная «Яндексом» в партнерстве с венчурными фондами, привлекла $250 млн инвестиций и стала «единорогом», получив оценку в ходе раунда в $2 млрд