Data Analysis / Big Data – Telegram
Data Analysis / Big Data
2.81K subscribers
570 photos
3 videos
2 files
2.93K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
Use Amazon Kinesis Data Firehose to extract data insights with Coralogix

Read: https://aws.amazon.com/blogs/big-data/use-amazon-kinesis-data-firehose-to-extract-data-insights-with-coralogix/
👍1
«Божественная комедия», или Девять кругов прогнозирования промо спроса в «Магните»

Привет, Хабр! На связи команда направления прогнозирования промо в «Магните». В предыдущей статье «Магнитная аномалия: как предсказать продажи промо в ритейле» мы дали читателю общее представление о том, чем занимается наша команда. Теперь поговорим о конкретных сложностях и методах их решения, с которыми нам приходится сталкиваться в работе.

Чтобы лучше разобраться во внутренней кухне, предлагаем читателю вместе прогуляться по нашим «девяти кругам прогнозирования промо спроса».


Читать: https://habr.com/ru/post/664358/
👍4
Single Sign-On Configuration for Oracle Analytics Server on OCI Marketplace with Oracle Identity Cloud Service using Apache HTTP Server and OpenIDC Module

Single Sign-On Configuration for Oracle Analytics Server on OCI Marketplace with Oracle Identity Cloud Service using Apache HTTP Server and OpenIDC Module

Read: https://blogs.oracle.com/analytics/post/oas-mp-sso-idcs-apache-openidc
Single Sign-On Configuration for Oracle Analytics Server on OCI Marketplace with Oracle Identity Cloud Service using Oracle HTTP Server and WebGate

Single Sign-On Configuration for Oracle Analytics Server on OCI Marketplace with Oracle Identity Cloud Service using Oracle HTTP Server and WebGate (OAuth/OpenID)

Read: https://blogs.oracle.com/analytics/post/oas-mp-sso-idcs-ohs-webgate
Использование Kudu для решения задач в реальном времени в окружении Hadoop

В предыдущей статье я поделился нашим опытом создания аналитического хранилища полного цикла на базе экосистемы Hadoop. Одним из тезисов той статьи стало утверждение о том, что аналитическую систему можно спроектировать, не прибегая к федерализации разных технологических платформ, предназначенных для решения локальных задач.

В этом материале я попробую подробнее раскрыть, как в нашей системе реализован подход обработки и загрузки данных в реальном времени с использованием технологии Kudu, при котором эти данные сразу доступны для анализа.


Читать: https://habr.com/ru/post/664698/
Securing Oracle Analytics Server on Oracle Cloud by Enforcing OCI WAF on Flexible Load Balancers

Securing Oracle Analytics Server on Oracle Cloud by Enforcing OCI WAF on Flexible Load Balancers

Read: https://blogs.oracle.com/analytics/post/oas-oci-waf
Настройка в OpenSearch аутентификации и авторизации пользователей через Active Directory по протоколу LDAP

В этой статье я расскажу о том, как я настраивал аутентификацию и авторизацию доменных пользователей Active Directory в OpenSearch. В домене я не обладаю правами администратора домена и не могу влиять на структуру каталогов Active Directory. А сценарий настройки Active Directory в OpenSearch, предлагаемый на официальном сайте, применить к домену с разветвленной структурой каталогов оказалось не так просто, как хотелось бы.


Читать: https://habr.com/ru/post/664874/
Проведение совместных экспериментов c DVC

Вы можете использовать удаленные хранилища DVC для совместного использования экспериментов и их данных через машины.


Читать: https://habr.com/ru/post/664946/
Build a big data Lambda architecture for batch and real-time analytics using Amazon Redshift

Read: https://aws.amazon.com/blogs/big-data/build-a-big-data-lambda-architecture-for-batch-and-real-time-analytics-using-amazon-redshift/
Power your data applications with a Semantic Model using Oracle Analytics Cloud

With Oracle Analytics Cloud (OAC) and our new Semantic Modeling Markup Language (SMML), you can now create a powerful semantic model which acts as a translation layer between your application and your underlying data structures. This semantic model exposes a metrics-oriented data layer that can be used directly in your application via APIs, with embedded visualizations, or in other analytics tools.

Read: https://blogs.oracle.com/analytics/post/power-your-data-applications-with-a-semantic-model-using-oracle-analytics-cloud
👍2
Explore Data with Filters (Part 1)

Filters are a powerful interaction paradigm for users to explore data and perform analysis. Filters enable users to get from data to insights, reduce noise in the data, and slice and dice data by different dimensions. This article explains the different filter capabilities available in Oracle Analytics along with best practices.

Read: https://blogs.oracle.com/analytics/post/explore-data-using-filters
Как искать данные в пространстве невероятно быстро? R*-tree в Go

Как использовать R*-tree, чтобы обновлять данные об игроках на сервере даже при онлайне в 1000 человек и выше.

Читать: «Как искать данные в пространстве невероятно быстро? R*-tree в Go»