Инжиниринг Данных – Telegram
Инжиниринг Данных
23.5K subscribers
1.99K photos
55 videos
193 files
3.21K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Всегда делюсь своим творчеством🙆‍♂️
Все привет, буду в Москве выступать на этой конференции🥳
Вот как раньше делали отчеты
А вот в этой книге, датированной 1919 годом, автор уже рассуждал про работу с данными:"Миллионы долларов ежегодно тратятся на сбор данных". А на фотографии вычислительная машина тех времен, которая могла могла работать с Big Data! (3000 записей в час).
Teradata CEO Oliver Ratzesberger speaks about the 5 Forces that are disrupting industries today. Хорошо выступил.
Happy Halloween
А это CTO Teradata Stephen Brobst, супер крутой дядька, всегда в гавайских рубашках, легенда, один раз я был на его выступлении в Москве, есть еще порох в пороховницах, если есть возможность посмотрите его свежие выступления, всегда говорит про тренды в индустрии. В общем Терадата активно двинулась в облака, и теперь все желающие могут использовать Teradata Vantage - платформа аналитики, полюбому очень дорого.

Писал я тут в Канаде в Терадату, типа привет, мы тут такие классные, спецы по терадате, но она сказали, что не интересны мы им, да и вообще походу Терадата в Канаде не очень популярна. Но безусловно есть компании, знаю одну лично - компания лотереи в провинции Манитоба “Western Canada Lottery Corporation”, используют Teradata и BI Cognos. А вот компания, WholeFoods, которую приобрел Амазон, тоже на Teradata, но мигрируют на Redshift. В общем так и живем, все куда-то мигрируют, как птицы перелетные.🐔
подходит на все случаи жизни
DE book.pdf
272.8 KB
The Data Engineering Cookbook
- Голосовые помошники и умные колонки сейчас являются самый быстро растущей категорий устройств
- К 2022 году, 70% белых воротничков будут взаимодействовать к чат платформами
- +50% американцев общались с ботоми и голосовыми помошниками

Сердецем голосового помошника является Natural Language Processing. Natural Language Understanding (NLU) - это постобработка текста после спользования алгоритмов (NLP), которое использует Automatic Speech Recognition (ASR), чтобы выполнить правильное действие (intent). В Википедии, говориться, что первым использовал этот метод Даниэль Бобров в 1964 году в MIT, где писал свою Phd. Кстати Alexa NLU находится в Бостоне, поближе к наукоемким специалистам (MIT, Harward).

А вот Ted Talk, где затронуты интересные вопросы про взаимодействия человека и помощника. В целом 30% всех взаимодоействий, это наезд и издевательство на искуственным интелектом. Не говоря уже про склонение к насилию и другим фантазиям людей))
Отличная история для хэштега #fakeittillyoumakeit
Не нужно боятся роботизации, а вот алгоритмы, которые автоматизируют человеческий труд, это все они!
Survey Data Analysis.pdf
595.5 KB
Если вы работает с результатами опросов, эта методичка может быть вам полезна.
Сравнение классических аналитических MPP хранилищ данных. Даже цену за ТБ указали. Опубликовано в 2015 году! Сколько всего изменилось. В это время я первый раз попробовал Redshift и использовал его для маркетингового аналитики (с маркетингом тоже в первый раз работал, модель атрибуции, мобильные приложения и много прочего)
Безопасность данных это очень важно. Особенно, если вы используете данные персональные данные personally identifiable information (PII). По умолчания в Amazon Redshift нет встроенной функциональности для маскировки данных. В этой статье описано решение для и использование стороннего продукта для безопасности персональных данных personally identifiable information (PII) https://aws.amazon.com/blogs/big-data/protect-and-audit-pii-data-in-amazon-redshift-with-datasunrise-security/ Есть и другой вариант использовать hash и python UDF функции, чтобы обезличить ваши данные.
Azure сегодня презентовала новый продукт - Azure Synapse Analytics. В общем они решили очевидную проблему, объединили озеро данных Azure Data Lake и хранилище данных Azure SQL Data Warehouse. Все для нашего удобства. https://news.microsoft.com/innovation-stories/ignite-2019-azure-synapse
В Японии Data Science нет так популярно, как Arificial Intelligence