Data Analysis / Big Data – Telegram
Data Analysis / Big Data
2.81K subscribers
570 photos
3 videos
2 files
2.93K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
Power your data applications with a Semantic Model using Oracle Analytics Cloud

With Oracle Analytics Cloud (OAC) and our new Semantic Modeling Markup Language (SMML), you can now create a powerful semantic model which acts as a translation layer between your application and your underlying data structures. This semantic model exposes a metrics-oriented data layer that can be used directly in your application via APIs, with embedded visualizations, or in other analytics tools.

Read: https://blogs.oracle.com/analytics/post/power-your-data-applications-with-a-semantic-model-using-oracle-analytics-cloud
👍2
Explore Data with Filters (Part 1)

Filters are a powerful interaction paradigm for users to explore data and perform analysis. Filters enable users to get from data to insights, reduce noise in the data, and slice and dice data by different dimensions. This article explains the different filter capabilities available in Oracle Analytics along with best practices.

Read: https://blogs.oracle.com/analytics/post/explore-data-using-filters
Как искать данные в пространстве невероятно быстро? R*-tree в Go

Как использовать R*-tree, чтобы обновлять данные об игроках на сервере даже при онлайне в 1000 человек и выше.

Читать: «Как искать данные в пространстве невероятно быстро? R*-tree в Go»
Как мы в СИБУРе делаем дашборды для людей. Часть 1: закупки и производство

На наших предприятиях множество данных — от постоянно обновляющихся цен и технологических условий до логистических отчетов, графиков доставки и многое, много другое. Не говоря уже о чисто внутренней информации.

При должной сноровке все эти данные можно использовать с пользой, а не просто собирать где-то ради пары годовых отчётов. Но тут есть проблема.

Данные разные, как и их источники. Где-то речь идет об огромных монструозных таблицах в Excel с кучей переменных и подвязок, где-то используются внутренние CRM, в общем, тут кто во что горазд и кому где удобнее работать. То есть информация вроде есть, ее много, на ее основе можно делать выводы и принимать решения, но вот наглядности — никакой.

И тут мы переходим к решению, так что самое время представиться. Меня зовут Марина Коробейникова, я отвечаю за дашборды в закупках и производстве СИБУРа. Именно дашборды помогают нам вырваться из описанного выше порочного круга, предоставляя возможность просто посмотреть на экран и понять, что вообще сейчас происходит. Ну то есть, в компании.

В СИБУРе дашборды применяются для самых разных департаментов – логистики, продаж, закупок, маркетинга, топ-менеджмента, и тд. И о каждом из этих направлений мы расскажем подробнее.

Но начнём, пожалуй, с закупок и производства.


Читать: https://habr.com/ru/post/665144/
👍1
Кто такой Analytics Engineer – E2E-решение с использованием bash + dbt + Looker

Привет! Меня зовут Артемий Козырь, и я Analytics Engineer в Wheely.

Мы могли бы долго и нудно обсуждать, кто такой Analytics (Data / Backend) Engineer, какими инструментами он должен владеть, какие buzzwords в тренде и ценятся в CV, однако, на мой взгляд, гораздо интереснее рассмотреть процесс и результаты его деятельности в рамках конкретной прикладной задачи.

В этой публикации:


Читать: https://habr.com/ru/post/665642/
👍1
7 элементов продуманной стратегии развития ИИ: опыт Salesforce

Искусственный интеллект перестал быть вотчиной исключительно крупных компаний. Он становится мейнстримом для бизнеса, однако, по словам президента и исполнительного директора Salesforce Брета Тейлора, успех способствует ему не всегда. Продуманная стратегия развития ИИ должна в первую очередь учитывать интересы клиента и чётко определять результаты для бизнеса, а ключевым аспектом для всего этого являются данные.

В своём докладе на конференции Scale TransformX 2021 Тейлор рассказал об основных вопросах, которые компании любого размера должны учитывать, чтобы выполнять задачи клиентов и достигать стабильных результатов.

В этой статье мы вкратце изложим семь основных выводов из презентации Тейлора. Более подробную информацию можно посмотреть в видео.


Читать: https://habr.com/ru/post/663112/
Federate access to Amazon Redshift query editor V2 with Active Directory Federation Services (AD FS): Part 3

Read: https://aws.amazon.com/blogs/big-data/federate-access-to-amazon-redshift-query-editor-v2-with-active-directory-federation-services-ad-fs-part-3/
Видео докладов потока Big Data. Конференция BeeTech 2.0

Привет! Мы продолжаем публиковать видео с конференции BeeTech 2.0.  Поток Engineering тут, Management тут.

В этой статье я поделюсь выступлениями спикеров потока Big Data. Вот ссылка на весь поток, внутри статьи ссылки на каждое видео с его описанием + презентация спикера.
Посмотреть видео

Читать: https://habr.com/ru/post/665896/
Deep dive into Amazon EMR Kerberos authentication integrated with Microsoft Active Directory

Read: https://aws.amazon.com/blogs/big-data/deep-dive-into-amazon-emr-kerberos-authentication-integrated-with-microsoft-active-directory/
Как улучшить архитектуру озера данных: два уровня прокачки

Lake city by arsenixc

Построение озера данных на основе облачных сервисов предполагает активное использование объектного хранилища S3. Команда VK Cloud Solutions перевела статью, которая раскрывает тонкости Cloud Native Data Lake.


Читать: https://habr.com/ru/post/665870/
Новости из мира Data Science — дайджест от МТС

Публикуем свежие новости о Data Science: новые проекты, модель, которая пишет симфонию и база кода от Google Research

Читать: «Новости из мира Data Science — дайджест от МТС»
Use a linear learner algorithm in Amazon Redshift ML to solve regression and classification problems

Read: https://aws.amazon.com/blogs/big-data/use-a-linear-learner-algorithm-in-amazon-redshift-ml-to-solve-regression-and-classification-problems/