🐙 Осьминог и кенгуру теперь дружат: Airbyte купили Grouparoo 🦘
В марте мы уже вам рассказывали про одну большую сделку (Snowflake купил Streamlit) и объяснили, почему соединение двух компаний – важно. Сегодня мы поговорим о другой большой сделке, которая не только выглядит мило (↑), но и также важна по своей сути.
Разберемся, что здесь интересного
В пятницу Airbyte (open-source ETL-платформа) объявила о приобретении Grouparoo (open-source стартап, который помогает предприятиям синхронизировать данные между хранилищами данных и облачными сервисами). Таким образом, услуги, которые предлагает Airbyte, дополняются новыми “недостающими” деталями: Осьминожка фокусируется на загрузке данных в хранилища, а Кенгуру специализируется на операционализации этих данных.
Обе компании не раскрыли цену приобретения, однако, скорее всего, цена сделки исчисляется несколькими миллионами долларов.
Теперь нам с вами остается с нетерпением ждать, как именно будет улучшен и дополнен сервис Airbyte в результате этой сделки :)
В марте мы уже вам рассказывали про одну большую сделку (Snowflake купил Streamlit) и объяснили, почему соединение двух компаний – важно. Сегодня мы поговорим о другой большой сделке, которая не только выглядит мило (↑), но и также важна по своей сути.
Разберемся, что здесь интересного
В пятницу Airbyte (open-source ETL-платформа) объявила о приобретении Grouparoo (open-source стартап, который помогает предприятиям синхронизировать данные между хранилищами данных и облачными сервисами). Таким образом, услуги, которые предлагает Airbyte, дополняются новыми “недостающими” деталями: Осьминожка фокусируется на загрузке данных в хранилища, а Кенгуру специализируется на операционализации этих данных.
Обе компании не раскрыли цену приобретения, однако, скорее всего, цена сделки исчисляется несколькими миллионами долларов.
Теперь нам с вами остается с нетерпением ждать, как именно будет улучшен и дополнен сервис Airbyte в результате этой сделки :)
👍15❤9
Сервис онлайн-обучения цифровым профессиям Яндекс Практикум запускает программу обучения по специальности «Инженер данных». Курс предназначен для студентов с как минимум базовым знанием SQL и Python — перед стартом необходимо пройти тест.
Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний.
Длительность — 6,5 месяцев.
Курс на 75% состоит из практических занятий – по окончании программы в вашем портфолио будет не менее 10 проектов.
Вы научитесь:
- работать с технологиями Python, SQL, Metabase, Airflow, PostgreSQL, MongoDB, ClickHouse, Celery, Kafka, Hadoop, Apache Spark, Spark Streaming и Yandex.Cloud
- извлекать, очищать и сохранять данные
- создавать и поддерживать хранилища типов Data Warehouse и Data Lake
- работать со стриминговой обработкой данных и облаками
Претендовать на работу по новой специальности студенты курса смогут уже в ходе обучения – с поиском вакансии помогут специалисты карьерного центра Яндекс Практикум.
Запись на курс открыта, старт занятий для ближайшего потока студентов – 18 апреля.
Стоимость курса:
95 000 рублей при разовой оплате, при оплате в рассрочку – 17 000 рублей в месяц.
По завершении программы студенты получат диплом о профессиональной переподготовке.
Запись на бесплатную вводную часть и подробности по ссылке.
#реклама
Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний.
Длительность — 6,5 месяцев.
Курс на 75% состоит из практических занятий – по окончании программы в вашем портфолио будет не менее 10 проектов.
Вы научитесь:
- работать с технологиями Python, SQL, Metabase, Airflow, PostgreSQL, MongoDB, ClickHouse, Celery, Kafka, Hadoop, Apache Spark, Spark Streaming и Yandex.Cloud
- извлекать, очищать и сохранять данные
- создавать и поддерживать хранилища типов Data Warehouse и Data Lake
- работать со стриминговой обработкой данных и облаками
Претендовать на работу по новой специальности студенты курса смогут уже в ходе обучения – с поиском вакансии помогут специалисты карьерного центра Яндекс Практикум.
Запись на курс открыта, старт занятий для ближайшего потока студентов – 18 апреля.
Стоимость курса:
95 000 рублей при разовой оплате, при оплате в рассрочку – 17 000 рублей в месяц.
По завершении программы студенты получат диплом о профессиональной переподготовке.
Запись на бесплатную вводную часть и подробности по ссылке.
#реклама
Яндекс Практикум
Курс «Инженер данных» - онлайн-обучение профессии Data Engineer
Онлайн-курс «Data Engineer» от сервиса Яндекс Практикум. 6.5 месяцев
обучения на инженера данных с выдачей диплома о профессиональной
переподготовке.
обучения на инженера данных с выдачей диплома о профессиональной
переподготовке.
👍23
Децентрализованный Twitter? Что?
Уже некоторое время популярной темой для обсуждения считается Web3.0 (клевая статья у вастрика на этот счет).
Недавно на просторах сети я наткнулся на новую open-source социальную сеть – Mastodon. Ее основное отличие – децентрализованность. Каждый пользователь может развернуть эту соцсеть на своем сервере со своими правилами, целями и так далее. Личные данные в полной безопасности, ведь они не передаются на общий сервер, а остаются лишь у вас. Можно подписываться как на пользователей внутри одного сервера, так и на любых других пользователей сети, делиться контентом, выкладывать фотографии и оставлять коменты. Поскольку в этой соцсети нет услуг для монетизации контента, она не может обанкротиться или быть заблокированной (сейчас это кажется весьма актуальным!). А еще там нет рекламы (ну, пока), в общем, сплошные плюсы 😎
Уже некоторое время популярной темой для обсуждения считается Web3.0 (клевая статья у вастрика на этот счет).
Недавно на просторах сети я наткнулся на новую open-source социальную сеть – Mastodon. Ее основное отличие – децентрализованность. Каждый пользователь может развернуть эту соцсеть на своем сервере со своими правилами, целями и так далее. Личные данные в полной безопасности, ведь они не передаются на общий сервер, а остаются лишь у вас. Можно подписываться как на пользователей внутри одного сервера, так и на любых других пользователей сети, делиться контентом, выкладывать фотографии и оставлять коменты. Поскольку в этой соцсети нет услуг для монетизации контента, она не может обанкротиться или быть заблокированной (сейчас это кажется весьма актуальным!). А еще там нет рекламы (ну, пока), в общем, сплошные плюсы 😎
joinmastodon.org
Mastodon - Decentralized social media
Learn more about Mastodon, the radically different, free and open-source decentralized social media platform.
👍13
Совершенно удивительные достижения из мира AI
Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на вход модели данные: “An astronaut riding a horse in a photorealistic style”, а получаете вот такое изображение ⚡️
А еще модель может:
▫️ добавлять и удалять элементы, принимая во внимание тени, отражения и текстуры
▫️ вдохновиться оригиналом картины, рисунка или фотографии и создать изображение в похожем стиле
Модель уже очень занимательно повертели в этой статье. Брам Адамс тоже проверил, как работает модель: особенно интересно, как она придумывает постеры и обложки для музыкальных альбомов. Музыканты теперь могут вообще не тратить на то время, а лишь набрасывать идеи и поручать DALL·E всю креативную работу.
У меня и моей команды совершенно нет слов, это настоящий прорыв в мире AI. Не терпится пощупать и проверить все своими руками (подали заявку, ждем)!
#leftjoin_ai
Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на вход модели данные: “An astronaut riding a horse in a photorealistic style”, а получаете вот такое изображение ⚡️
А еще модель может:
▫️ добавлять и удалять элементы, принимая во внимание тени, отражения и текстуры
▫️ вдохновиться оригиналом картины, рисунка или фотографии и создать изображение в похожем стиле
Модель уже очень занимательно повертели в этой статье. Брам Адамс тоже проверил, как работает модель: особенно интересно, как она придумывает постеры и обложки для музыкальных альбомов. Музыканты теперь могут вообще не тратить на то время, а лишь набрасывать идеи и поручать DALL·E всю креативную работу.
У меня и моей команды совершенно нет слов, это настоящий прорыв в мире AI. Не терпится пощупать и проверить все своими руками (подали заявку, ждем)!
#leftjoin_ai
👏33👍2
Самая скучная профессия?
Исследование Университета Эссекса определило портрет самого скучного человека в мире — это религиозный специалист по вводу данных, который любит смотреть телевизор и живет в городе. А самой скучной профессией стал Data Analysis.
Исследование Университета Эссекса определило портрет самого скучного человека в мире — это религиозный специалист по вводу данных, который любит смотреть телевизор и живет в городе. А самой скучной профессией стал Data Analysis.
😱13👍6🔥2
🎉 Finally, we are on Twitter! 🎉
Друзья, хочу поделиться с вами ссылкой на свой твиттер, подпишитесь прямо сейчас, если интересен контент на английском. Сейчас у нас в планах море англоязычного контента, которым я буду делиться там, плюс периодически собираюсь скидывать туда полезные ссылки на тему аналитики, BI, AI и так далее. А еще планирую периодически разбавлять контент юмором, который мне по душе, может он и вас заставит улыбнуться 😉
Конечно, этот телеграм-канал также будет пополняться новыми интересными постами, но если вы хотите видеть новости и контент чаще, то подписывайтесь!
P.S. Вчера в Twitter я уже опубликовал ссылку на наш первый материал на Medium.
Друзья, хочу поделиться с вами ссылкой на свой твиттер, подпишитесь прямо сейчас, если интересен контент на английском. Сейчас у нас в планах море англоязычного контента, которым я буду делиться там, плюс периодически собираюсь скидывать туда полезные ссылки на тему аналитики, BI, AI и так далее. А еще планирую периодически разбавлять контент юмором, который мне по душе, может он и вас заставит улыбнуться 😉
Конечно, этот телеграм-канал также будет пополняться новыми интересными постами, но если вы хотите видеть новости и контент чаще, то подписывайтесь!
P.S. Вчера в Twitter я уже опубликовал ссылку на наш первый материал на Medium.
X (formerly Twitter)
Nick Valiotti · Datapreneur (@nvaliotti) on X
Fractional CDO | Datapreneur I turn data into smart decisions for digital companies. Sharing lessons from scaling to €700K+ ARR.
👍12
Шиншилла, которая всех победила
Продолжаем новости из мира AI: недавно было проведено исследование-сравнение различных современных языковых моделей. В результате, новая языковая модель Chinchilla 70B значительно превосходит результаты таких моделей, как Gopher (280B), GPT-3 (175B), Jurassic-1 (178B) и Megatron-Turing NLG (530B). Исследователи обнаружили, что, несмотря на использование различных процедур подбора и обученных моделей, эти три подхода дают сопоставимые прогнозы для оптимального масштабирования параметров и токенов с помощью FLOP.
В общем, если вы работаете с языковыми моделями, то пора пробовать новую.
#leftjoin_ai
Продолжаем новости из мира AI: недавно было проведено исследование-сравнение различных современных языковых моделей. В результате, новая языковая модель Chinchilla 70B значительно превосходит результаты таких моделей, как Gopher (280B), GPT-3 (175B), Jurassic-1 (178B) и Megatron-Turing NLG (530B). Исследователи обнаружили, что, несмотря на использование различных процедур подбора и обученных моделей, эти три подхода дают сопоставимые прогнозы для оптимального масштабирования параметров и токенов с помощью FLOP.
В общем, если вы работаете с языковыми моделями, то пора пробовать новую.
#leftjoin_ai
MarkTechPost
Check Out This DeepMind’s New Language Model, Chinchilla (70B Parameters), Which Significantly Outperforms Gopher (280B) and GPT…
This research summary is based on the paper 'Training Compute-Optimal Large Language Models' Please don't forget to join our ML Subreddit Extreme-scale language models have recently exhibited incredible performance on natural language processing challenges.…
👏10👍7
Все что вам может понадобиться во время работы с Yandex.Datalens
Павел Дубинин собрал в один пост все (вообще все!) ссылки, которые могут вам пригодиться при работе с Yandex.DataLens. Тут и демо-дашборды, и ссылки на сообщества, и гайды по работе с сервисом, и примеры аналитики реальных данных и многое-многое другое. 💪
Павел Дубинин собрал в один пост все (вообще все!) ссылки, которые могут вам пригодиться при работе с Yandex.DataLens. Тут и демо-дашборды, и ссылки на сообщества, и гайды по работе с сервисом, и примеры аналитики реальных данных и многое-многое другое. 💪
Telegram
Pavel Dubinin in Yandex DataLens
Полезные ссылки для знакомства и работы с DataLens
Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования
Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить…
Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования
Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить…
👍33
🦸🏻 Ура! Второй эпизод подкаста DataHeroes уже в сети 🚀
Судя по тому, что многие из вас послушали первый выпуск подкаста, мы движемся в верном направлении!
У нас вышел второй выпуск, в котором мы продолжаем говорить об онлайн-образовании в России. Обучение аналитике без денег — миф или реальность? Сегодня мы поговорим о том, почему бесплатно не значит плохо, как найти в себе мотивацию на самообучение и зачем вообще нужны бесплатные курсы их создателям.
Наши спикеры — те, кому удалось получить новую профессию без финансовых вложений, а также руководители известных онлайн-платформ и образовательных центров Computer Science Center, DataYoga и DataLearn.
Если вы до сих пор считаете, что бесплатный сыр только в мышеловке, то скорее включайте подкаст, мы вас в этом разубедим!
Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Castbox, Overcast, Google, Yandex, Telegram (↓)
#DataHeroes #подкаст
Судя по тому, что многие из вас послушали первый выпуск подкаста, мы движемся в верном направлении!
У нас вышел второй выпуск, в котором мы продолжаем говорить об онлайн-образовании в России. Обучение аналитике без денег — миф или реальность? Сегодня мы поговорим о том, почему бесплатно не значит плохо, как найти в себе мотивацию на самообучение и зачем вообще нужны бесплатные курсы их создателям.
Наши спикеры — те, кому удалось получить новую профессию без финансовых вложений, а также руководители известных онлайн-платформ и образовательных центров Computer Science Center, DataYoga и DataLearn.
Если вы до сих пор считаете, что бесплатный сыр только в мышеловке, то скорее включайте подкаст, мы вас в этом разубедим!
Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Castbox, Overcast, Google, Yandex, Telegram (↓)
#DataHeroes #подкаст
🔥19👍7❤5
В течение десятилетий центральное место в разработке приложений занимала реляционная модель данных, которая используется в таких реляционных СУБД, как Oracle, DB2, SQL Server, MySQL и PostgreSQL. Но в последнее время большое распространение стали получать и другие модели данных - нереляционные / NoSQL.
NoSQL — это вид нетабличных баз данных, которые помогают хранить большие массивы данных без определённой структуры.
NoSQL стали популярным решением из-за простоты и гибкости разработки, широкого функционала, высокой производительности и возможности горизонтального масштабирования.
В зависимости от модели данных и подходов к распределённости и репликации в NoSQL выделяют четыре основных типа систем:
▪️ключ - значение (Redis, Memcached)
▪️колоночные (SAP IQ, Vertica, ClickHouse, Google BigTable, InfoBright, Cassandra)
▪️документо-ориентированные (CouchDB, MongoDB, Amazon DocumentDB)
▪️графовые (Neo4j, Amazon Neptune, InfiniteGraph, InfoGrid)
Данные типы систем используются
для решения задач кэширования, машинного обучения, хранения time-series данных или данных различающихся по структуре, размеру и содержанию.
Подробнее о преимуществах и недостатках применения различных типов NoSQL-систем и многом другом можете узнать на канале Базы данных и SQL
Подписывайтесь: @db_in_it
NoSQL — это вид нетабличных баз данных, которые помогают хранить большие массивы данных без определённой структуры.
NoSQL стали популярным решением из-за простоты и гибкости разработки, широкого функционала, высокой производительности и возможности горизонтального масштабирования.
В зависимости от модели данных и подходов к распределённости и репликации в NoSQL выделяют четыре основных типа систем:
▪️ключ - значение (Redis, Memcached)
▪️колоночные (SAP IQ, Vertica, ClickHouse, Google BigTable, InfoBright, Cassandra)
▪️документо-ориентированные (CouchDB, MongoDB, Amazon DocumentDB)
▪️графовые (Neo4j, Amazon Neptune, InfiniteGraph, InfoGrid)
Данные типы систем используются
для решения задач кэширования, машинного обучения, хранения time-series данных или данных различающихся по структуре, размеру и содержанию.
Подробнее о преимуществах и недостатках применения различных типов NoSQL-систем и многом другом можете узнать на канале Базы данных и SQL
Подписывайтесь: @db_in_it
👍10😱9
Помните историю про утечку данных Яндекс.Еды?
А вот какое наказание понесла «Яндекс.Еда»: 60 тысяч рублей за наши с вами данные. SRSLY??
На минутку, в этом датасете как минимум 148 тыс. юзеров имеют общую сумму заказов больше чем на 60 тыс. рублей.
❗️А сумма в 60 тысяч рублей это всего лишь 0.0001163% от всей выручки за период в датасете (51,567 миллиардов рублей).
Так вот здорово охраняются наши с вами персональные данные🛡
❓Риторический вопрос: эта статья и наказание означает, что в РФ вообще больше никому нельзя оставлять валидные ПД?
А вот какое наказание понесла «Яндекс.Еда»: 60 тысяч рублей за наши с вами данные. SRSLY??
На минутку, в этом датасете как минимум 148 тыс. юзеров имеют общую сумму заказов больше чем на 60 тыс. рублей.
❗️А сумма в 60 тысяч рублей это всего лишь 0.0001163% от всей выручки за период в датасете (51,567 миллиардов рублей).
Так вот здорово охраняются наши с вами персональные данные🛡
❓Риторический вопрос: эта статья и наказание означает, что в РФ вообще больше никому нельзя оставлять валидные ПД?
Telegram
LEFT JOIN
🍟 Яндекс, который не оправдал доверия пользователей
Наверное, вы уже в курсе: Яндекс конкретно облажался. Весь рунет не первый день разглядывает карту заказов Яндекс.Еды, где и мы с вами, и ваши соседи, и все-все-все. Как минимум, все это крипово.
Чем это…
Наверное, вы уже в курсе: Яндекс конкретно облажался. Весь рунет не первый день разглядывает карту заказов Яндекс.Еды, где и мы с вами, и ваши соседи, и все-все-все. Как минимум, все это крипово.
Чем это…
👍38😱6🤔2
👨🎨 Как работает DALL-E 2? 🖼
В одном из последних постов рассказали вам про новую AI-модель и поделились кучей ссылок с примерами её работы. Давайте попробуем разобраться, что за магия происходит в модели и как она создает совершенно новые изображения с помощью короткого текстового описания.
💭 Итак, если объяснять процессы, которые происходят в модели простым языком, то глобально их три: модель получает текстовое описание, которое декодируется и попадает в пространство текстовых эмбедингов (математический способ представления информации). Затем они попадают в пространство эмбедингов изображений, где идет поиск наилучшего совпадения. После этого полученный эмбединг декодируется и мы получаем изображение. Вуаля!
📺 В основе модели лежит модель CLIP, которая занимается прямо противоположным: подбирает наиболее точное описание к каждому изображению. Как вы понимаете, для обеих моделей совершенно необходимо огроменное количество данных, а именно пар (изображение–точное описание). Вручную такое сделать достаточно трудно (руки и глаза точно устанут), поэтому данные собраны со всего Интернета.
🧪 Также, при построении DALL-E 2 использовались диффузионные модели. Сейчас мы быстро постараемся это понять, если к этому моменту вы еще не перегружены информацией. Эти модели берут изображение и постепенно добавляют к нему различные шумы до тех пор пока изображение не меняется до неузнаваемости. Затем, они пытаются провернуть этот процесс задом наперед: воссоздать исходное изображение. Таким образом, модель учится самостоятельно генерировать изображения (или любую другую информацию, например, музыку).
🔗 Сила DALL-E 2 заключается в большом количестве парных данных (естественного языка–изображения), которые доступны в Интернете. Использование таких данных не только устраняет недочеты, вызванные трудоемким процессом ручной маркировки данных. В первую очередь, шумный и даже неконтролируемый характер таких данных лучше всего отражает реальные данные, к которым должны быть устойчивы модели глубокого обучения.
Если все эти выводы кажутся вам непонятными или недостаточными, то в этом видео девушка еще более подробно (на примере схем и изображений) рассказывает о том, как именно работает DALL-E 2 и почему каждый этап обработки важен и незаменим.
#leftjoin_ai
В одном из последних постов рассказали вам про новую AI-модель и поделились кучей ссылок с примерами её работы. Давайте попробуем разобраться, что за магия происходит в модели и как она создает совершенно новые изображения с помощью короткого текстового описания.
💭 Итак, если объяснять процессы, которые происходят в модели простым языком, то глобально их три: модель получает текстовое описание, которое декодируется и попадает в пространство текстовых эмбедингов (математический способ представления информации). Затем они попадают в пространство эмбедингов изображений, где идет поиск наилучшего совпадения. После этого полученный эмбединг декодируется и мы получаем изображение. Вуаля!
📺 В основе модели лежит модель CLIP, которая занимается прямо противоположным: подбирает наиболее точное описание к каждому изображению. Как вы понимаете, для обеих моделей совершенно необходимо огроменное количество данных, а именно пар (изображение–точное описание). Вручную такое сделать достаточно трудно (руки и глаза точно устанут), поэтому данные собраны со всего Интернета.
🧪 Также, при построении DALL-E 2 использовались диффузионные модели. Сейчас мы быстро постараемся это понять, если к этому моменту вы еще не перегружены информацией. Эти модели берут изображение и постепенно добавляют к нему различные шумы до тех пор пока изображение не меняется до неузнаваемости. Затем, они пытаются провернуть этот процесс задом наперед: воссоздать исходное изображение. Таким образом, модель учится самостоятельно генерировать изображения (или любую другую информацию, например, музыку).
🔗 Сила DALL-E 2 заключается в большом количестве парных данных (естественного языка–изображения), которые доступны в Интернете. Использование таких данных не только устраняет недочеты, вызванные трудоемким процессом ручной маркировки данных. В первую очередь, шумный и даже неконтролируемый характер таких данных лучше всего отражает реальные данные, к которым должны быть устойчивы модели глубокого обучения.
Если все эти выводы кажутся вам непонятными или недостаточными, то в этом видео девушка еще более подробно (на примере схем и изображений) рассказывает о том, как именно работает DALL-E 2 и почему каждый этап обработки важен и незаменим.
#leftjoin_ai
Telegram
LEFT JOIN
Совершенно удивительные достижения из мира AI
Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на…
Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на…
👍20
Ура! 🎉
Мы пробили отметку в 10К подписчиков!
Спасибо всем и каждому, кто подписан, вы невероятно мотивируете меня и всю команду продолжать делать интересный контент. 😎😎
Иногда вспоминаю времена, когда в канале было 100 человек и некоторые мои знакомые удивлялись для чего я все это делаю! Конечно же, в большей степени для себя, но очень рад, что посты, контент и любые другие медийные материалы, которые мы выпускаем, принимаются коммьюнити с интересом 😇
Поэтому огромная благодарность за ваши реакции и репосты 👍👍👍
Пробив отметку в 10К собираюсь написать краткий пост с основными ссылками на публикации в этом канале и блоге, а также с информацией об авторе, чтобы все вновь прибывшие сразу могли узнать, что мы тут публикуем ☺️
Мы пробили отметку в 10К подписчиков!
Спасибо всем и каждому, кто подписан, вы невероятно мотивируете меня и всю команду продолжать делать интересный контент. 😎😎
Иногда вспоминаю времена, когда в канале было 100 человек и некоторые мои знакомые удивлялись для чего я все это делаю! Конечно же, в большей степени для себя, но очень рад, что посты, контент и любые другие медийные материалы, которые мы выпускаем, принимаются коммьюнити с интересом 😇
Поэтому огромная благодарность за ваши реакции и репосты 👍👍👍
Пробив отметку в 10К собираюсь написать краткий пост с основными ссылками на публикации в этом канале и блоге, а также с информацией об авторе, чтобы все вновь прибывшие сразу могли узнать, что мы тут публикуем ☺️
❤52🎉31👍27👏1
🚨 Справочник по каналу 🚨
Немного очевидного: меня зовут Николай Валиотти, LEFT JOIN – телеграм-канал, который я веду вместе со своей командой Valiotti Analytics. Меня увлекает тема анализа, инжиниринга и визуализации данных, а также машинного обучения. Этот канал появился в ноябре 2018 года и довольно стремительно развивается все это время от заметок автора по теме интересных инструментов и приемов в Python/SQL к полноценному медиа со своим подкастом, дайджестами и примечательными проектами.
Мне бы хотелось, чтобы у всех специалистов была возможность разобраться в сложной информации об анализе данных, поэтому мы рассказываем об этом простым языком с яркими примерами. Чаще всего в канале можно встретить именно такой контент. Однако иногда я просто публикую интересные новости IT-сферы, поэтому не удивляйтесь. Например, у нас есть рубрика Новостной Дайджест, где информация далеко не только о данных.
🙋 Немного обо мне:
▫️С 2009 года работаю в области анализа данных и даже защитил кандидатскую диссертацию в СПбГУ по теме использования нейронных сетей
▫️Сейчас я учусь на программе Master of Analytics в американском ВУЗе Georgia Tech
▫️Работал в ряде крупных компаний: Лента, Yota, Балтика, Юлмарт, Tapcore, Airpush
▫️Увлекался программированием на разных языках: PHP, JS, C++ (в универе), Java, R, Python, а потом переключился на создание бизнеса, и так в 2019 году появилась компания Valiotti Analytics
▫️Развиваю c партнером стартап Mprove – self-service BI-платформа.
▫️Занимаюсь ангельским инвестированием в технологичные проекты преимущественно в области данных. Если вы – такой проект, то скорее пишите мне.
▫️Интересуюсь криптовалютой и проектами в этой области (особенно здорово, когда они на стыке с данными/аналитикой).
▫️Живу на Кипре с женой и дочкой, увлекаюсь теннисом 🎾, периодически рублю в плойку 🎮 😇
🛠 Услуги
🔹В рамках Valiotti Analytics мы помогаем компаниям строить аналитический стек: процессы инжиниринга, хранилища данных, отчетность, внедрение BI-инструментов на всем, что называется избитым "modern data stack"
🔹Для нас это означает, что мы работаем с современными цифровыми заказчиками, использующими облачные технологии, и совсем не работаем с несколько устаревшим стеком, где, например, присутствует 1С
🔹Также иногда я помогаю в персональном менторинге и консультирую владельцев компаний/топ-менеджеров
❕ Важные материалы
🖼 Цикл постов про использование оконных функций
По хештегу: #leftjoin_sql
📝 Полезные посты из блога LeftJoin
Аналитические метрики здорового маркетолога
Лонгрид про выбор цветов для визуализации данных
Мануал по Yandex.Datasphere
Поиск интересных новых мест по геотегам в Instagram
Граф телеграм-каналов по теме аналитики
Дашборд первых 8 месяцев жизни малыша
👫 Совместные проекты
Дашборд с анализом рынка вакансий аналитиков c hh.ru с @revealthedata
📚 Статьи на Хабре
Используем serverless для построения аналитики на данных из AmoCRM в Yandex.Cloud
Подробный анализ телеграм-канала Артемия Лебедева и кое-что еще
🔬 Исследования
Исследование рынка онлайн-образования по анализу данных в России
📰 Интересные новости
Партнерство Tableau и Looker
Десять open-source аналогов Google Analytics
Snowflake купил Streamlit: почему это важно?
Список альтернатив Slack
🎞 Канал на YouTube
Все, что нужно знать про поступление в магистратуру Georgia Tech
Гайд по современным BI-инструментам
🎤 Интервью и выступления
Выступление на SmartData: Self-Service BI
Выступление на Матемаркетинге
Интервью для @start_ds
Интервью для @revealthedata
Презентация с выступления на конференции Linq
🎧 Подкаст Data Heroes: 2 сезон 👾
Эпизод 1: Рынок аналитики сейчас: какие произошли изменения после старта февральского безумия?
Эпизод 2: Data образование за рубежом: опыт тех, кто уже прошел этот путь
📧 Контакты и ссылки
С удовольствием знакомлюсь и общаюсь с новым и интересными людьми! Если у вас что-то есть по делу, пишите.
Телеграм — @valiotti
Почта — nikolay@valiotti.com
Valiotti Analytics | Блог Left Join | Tableau Public | YouTube
Подкаст Data Heroes | Твиттер | LinkedIn
Немного очевидного: меня зовут Николай Валиотти, LEFT JOIN – телеграм-канал, который я веду вместе со своей командой Valiotti Analytics. Меня увлекает тема анализа, инжиниринга и визуализации данных, а также машинного обучения. Этот канал появился в ноябре 2018 года и довольно стремительно развивается все это время от заметок автора по теме интересных инструментов и приемов в Python/SQL к полноценному медиа со своим подкастом, дайджестами и примечательными проектами.
Мне бы хотелось, чтобы у всех специалистов была возможность разобраться в сложной информации об анализе данных, поэтому мы рассказываем об этом простым языком с яркими примерами. Чаще всего в канале можно встретить именно такой контент. Однако иногда я просто публикую интересные новости IT-сферы, поэтому не удивляйтесь. Например, у нас есть рубрика Новостной Дайджест, где информация далеко не только о данных.
🙋 Немного обо мне:
▫️С 2009 года работаю в области анализа данных и даже защитил кандидатскую диссертацию в СПбГУ по теме использования нейронных сетей
▫️Сейчас я учусь на программе Master of Analytics в американском ВУЗе Georgia Tech
▫️Работал в ряде крупных компаний: Лента, Yota, Балтика, Юлмарт, Tapcore, Airpush
▫️Увлекался программированием на разных языках: PHP, JS, C++ (в универе), Java, R, Python, а потом переключился на создание бизнеса, и так в 2019 году появилась компания Valiotti Analytics
▫️Развиваю c партнером стартап Mprove – self-service BI-платформа.
▫️Занимаюсь ангельским инвестированием в технологичные проекты преимущественно в области данных. Если вы – такой проект, то скорее пишите мне.
▫️Интересуюсь криптовалютой и проектами в этой области (особенно здорово, когда они на стыке с данными/аналитикой).
▫️Живу на Кипре с женой и дочкой, увлекаюсь теннисом 🎾, периодически рублю в плойку 🎮 😇
🛠 Услуги
🔹В рамках Valiotti Analytics мы помогаем компаниям строить аналитический стек: процессы инжиниринга, хранилища данных, отчетность, внедрение BI-инструментов на всем, что называется избитым "modern data stack"
🔹Для нас это означает, что мы работаем с современными цифровыми заказчиками, использующими облачные технологии, и совсем не работаем с несколько устаревшим стеком, где, например, присутствует 1С
🔹Также иногда я помогаю в персональном менторинге и консультирую владельцев компаний/топ-менеджеров
❕ Важные материалы
🖼 Цикл постов про использование оконных функций
По хештегу: #leftjoin_sql
📝 Полезные посты из блога LeftJoin
Аналитические метрики здорового маркетолога
Лонгрид про выбор цветов для визуализации данных
Мануал по Yandex.Datasphere
Поиск интересных новых мест по геотегам в Instagram
Граф телеграм-каналов по теме аналитики
Дашборд первых 8 месяцев жизни малыша
👫 Совместные проекты
Дашборд с анализом рынка вакансий аналитиков c hh.ru с @revealthedata
📚 Статьи на Хабре
Используем serverless для построения аналитики на данных из AmoCRM в Yandex.Cloud
Подробный анализ телеграм-канала Артемия Лебедева и кое-что еще
🔬 Исследования
Исследование рынка онлайн-образования по анализу данных в России
📰 Интересные новости
Партнерство Tableau и Looker
Десять open-source аналогов Google Analytics
Snowflake купил Streamlit: почему это важно?
Список альтернатив Slack
🎞 Канал на YouTube
Все, что нужно знать про поступление в магистратуру Georgia Tech
Гайд по современным BI-инструментам
🎤 Интервью и выступления
Выступление на SmartData: Self-Service BI
Выступление на Матемаркетинге
Интервью для @start_ds
Интервью для @revealthedata
Презентация с выступления на конференции Linq
🎧 Подкаст Data Heroes: 2 сезон 👾
Эпизод 1: Рынок аналитики сейчас: какие произошли изменения после старта февральского безумия?
Эпизод 2: Data образование за рубежом: опыт тех, кто уже прошел этот путь
📧 Контакты и ссылки
С удовольствием знакомлюсь и общаюсь с новым и интересными людьми! Если у вас что-то есть по делу, пишите.
Телеграм — @valiotti
Почта — nikolay@valiotti.com
Valiotti Analytics | Блог Left Join | Tableau Public | YouTube
Подкаст Data Heroes | Твиттер | LinkedIn
Valiotti
Home page
Valiotti Analytics is a data analytics company that can implement a modern data stack, offer data visualization services, and perform top-notch predictive analytics
🔥53👍7
🧑💻Как проанализировать всю свою жизнь и найти ответы на важные вопросы? 📊
Этот проект начался как локальная шутка Феликса Краузе и его друзей, чтобы у них всегда был ответ на вопрос “Когда же Феликс вернется в Нью-Йорк или Сан-Франциско?” Вместо того, чтобы отвечать всем, он просто создал сайт, на котором была вся нужная информация о нем.
На сегодняшний день Феликс собирает данные о себе ежедневно на протяжении 2,5 лет. Он записывает практически все что делает с невероятной точностью: рост, вес, время сна, калорийность еды (с разбивкой на белки, жиры и углеводы), время за компьютером, спорт, медитации и многое-многое другое. На сайте вы можете увидеть где Феликс сейчас, сколько он сегодня поспал и что поел (понятия не имею, зачем вам эта информация, но понаблюдать за этим интересно).
На самом деле целью его проекта было ответить на вопросы о своей жизни, такие как:
🔹 Как жизнь в разных городах влияет на спорт, производительность труда и ощущение счастья?
🔸 Как сон влияет на то, как пройдет день или качество занятия спортом?
🔹 Как погода и разные времена года влияют на мою жизнь?
🔸 Есть ли какие-либо тенденции за последние несколько лет?
🔹 Как время проведенное за компьютером, работа и рабочие встречи влияют на мою личную жизнь?
Думаю, что он старается сделать выводы исходя из данных и внедрить их в свою жизнь. На его сайте есть 42 визуализации данных, которые вы тоже можете просмотреть (не заинтересоваться просто невозможно) и заметить какие-то существенные закономерности🙃
Этот проект начался как локальная шутка Феликса Краузе и его друзей, чтобы у них всегда был ответ на вопрос “Когда же Феликс вернется в Нью-Йорк или Сан-Франциско?” Вместо того, чтобы отвечать всем, он просто создал сайт, на котором была вся нужная информация о нем.
На сегодняшний день Феликс собирает данные о себе ежедневно на протяжении 2,5 лет. Он записывает практически все что делает с невероятной точностью: рост, вес, время сна, калорийность еды (с разбивкой на белки, жиры и углеводы), время за компьютером, спорт, медитации и многое-многое другое. На сайте вы можете увидеть где Феликс сейчас, сколько он сегодня поспал и что поел (понятия не имею, зачем вам эта информация, но понаблюдать за этим интересно).
На самом деле целью его проекта было ответить на вопросы о своей жизни, такие как:
🔹 Как жизнь в разных городах влияет на спорт, производительность труда и ощущение счастья?
🔸 Как сон влияет на то, как пройдет день или качество занятия спортом?
🔹 Как погода и разные времена года влияют на мою жизнь?
🔸 Есть ли какие-либо тенденции за последние несколько лет?
🔹 Как время проведенное за компьютером, работа и рабочие встречи влияют на мою личную жизнь?
Думаю, что он старается сделать выводы исходя из данных и внедрить их в свою жизнь. На его сайте есть 42 визуализации данных, которые вы тоже можете просмотреть (не заинтересоваться просто невозможно) и заметить какие-то существенные закономерности🙃
👍25🔥13🤩3
🤔17👍13👏1