NEW BOT Телеграм, страница

Data Analysis / Big Data

Где вы получаете / получили необходимые навыки для работы в IT?

Anonymous Poll

18%

Учебное заведение (школа, вуз)

Бесплатные онлайн курсы

59%

Самообразование

16%

Посмотреть результаты

141 voters640 views11:52

Data Analysis / Big Data

Что под капотом у Умного Ташкента?

Привет, Хабр! Вот, прошли майские праздники, и я готов поделиться с вами подробностями нашего проекта по цифровизации Ташкента. В конце концов, наша референсная модель может помочь в цифровизации других городов. И в этом посте мы подробнее разберем вопросы интеграции между различными компонентами, механику взаимодействия с Visiology BI и Геоинтеллект, а также ряд интересных на мой взгляд технических вопросов. Я покажу, как в нашей системе реализована поддержка процессов укладки асфальта, аналитики по видео, загрузки огромных массивов данных из различных ведомств.

Читать: https://habr.com/ru/post/667450/

👍2

672 views13:29

Data Analysis / Big Data

Synchronize your AWS Glue Studio Visual Jobs to different environments

Read: https://aws.amazon.com/blogs/big-data/synchronize-your-aws-glue-studio-visual-jobs-to-different-environments/

647 views16:50

Data Analysis / Big Data

Что такое Brain2Logic: Data Science без кода для юниоров

Современное машинное обучение не только перенимает крутые математические методы, но и подстраивается под стремление человека автоматизировать управление процессами. Природа явления остаётся загадкой. То ли мы добиваемся лаконичности, то ли убиваемся собственной ленью — неважно, если результат оправдывает затраты.

Одним из таких результатов стала AutoML-платорма Brain2Logic стартапа Mavericka, которая недавно была пропилотирована в песочнице Ассоциации больших данных. Платформу помог протестировать Билайн, поставив задачу построить модели для рекомендаций фильмов. В этой статье представлен общий взгляд на современные AutoML-решения с акцентом на проект Brain2Logic (B2L).

Если вам интересно, что смогли придумать в Mavericka, посмотреть на тестирование и почитать наши рассуждения про AutoML — добро пожаловать под кат.

Читать: https://habr.com/ru/post/667788/

670 views13:01

Data Analysis / Big Data

Объединение данных с датчиков и интерполяция для Autonomous Vehicles

Товарищи, рассказываю о нюансах сбора и работы с данными для Autonomous Vehicles. Как правило, для создания обучающего датасета используют данные с датчиков LIDAR и камер. Но полученные данные в сыром виде очень разрознены ,и чтобы решить эту проблему, их нужно правильно объединить и интерполировать. И только после этого приступать к 3D Point Cloud разметке.

Читать: https://habr.com/ru/post/667842/

661 views15:58

Data Analysis / Big Data

Visualize MongoDB data from Amazon QuickSight using Amazon Athena Federated Query

Read: https://aws.amazon.com/blogs/big-data/visualize-mongodb-data-from-amazon-quicksight-using-amazon-athena-federated-query/

690 views16:51

Data Analysis / Big Data

Зачем бизнесу data science

Встретились как-то продакт с дата-сайентистом в одном офисе и стали выяснять, кто для бизнеса нужнее. Об этом в нашем видеоблоге вышел огромный выпуск, который я решил переделать в статью. Если интересно послушать полный диалог со всеми подробностями – добро пожаловать.

Всем привет! Меня зовут Игорь Уткин, я – дата-сайентист в hh.ru. В этой статье разбираемся: когда компании может понадобиться дата-сайентист, имеет ли собранная модель право на ошибку и как вообще люди уходят в data science.

Читать: https://habr.com/ru/post/667856/

👍2

696 views09:52

Data Analysis / Big Data

12 вакансий для аналитиков

— Бизнес-аналитик (приложение для колл-центра)
— Бизнес-аналитик (голосовые и чат-боты)
— Middle Бизнес-аналитик
— Ведущий аналитик (бизнес / системный аналитик)
— Ведущий системный аналитик
— Старший системный аналитик
— UX-аналитик
— Аналитик-разработчик Progress
— Продуктовый аналитик
— Младший инженер-аналитик SOC (1-ая линия)

#вакансии #работа

707 views13:00

Data Analysis / Big Data

Setting up a local development environment for python data projects using Docker

Read: https://www.startdataengineering.com/post/local-dev/

694 views14:01

Data Analysis / Big Data

Preview of Semantic Modeler in Oracle Analytics Cloud

Oracle analytics has a seasoned, rich Semantic Model which has been used by thousands of analytics customers over the past two decades. Today, I'm excited to share with you the next generation modeling tool and a modeling language to create those semantic models.

Read: https://blogs.oracle.com/analytics/post/preview-of-semantic-modeler-in-oracle-analytics-cloud

Oracle

Preview of Semantic Modeler in Oracle Analytics Cloud

Oracle Analytics has a seasoned, rich Semantic Model, which has been used by thousands of analytics customers over the past two decades. Learn about the next-generation modeling tool and a modeling language to create those semantic models.

694 views00:20

Data Analysis / Big Data

«Ваша сезонность, сэр!»: ищем тренд и прогнозируем спрос с помощью временных рядов, SARIMA и Python. Ч.1

Как вы можете помнить по первой статье "Маркетинговая аналитика на Python. Пишем код для RFM-сегментации", более 8 лет я работаю в сфере маркетинга для B2B и примерно столько же бешусь от дилетантского подхода к аналитике, который тянет за собой ряд проблем с определением ключевых метрик эффективности для компании (и, как следствие, с мотивацией сотрудников):

Читать: https://habr.com/ru/post/668186/

687 views10:52

Data Analysis / Big Data

Big Data for big thing

Или великий китайский социальный рейтинг. Что это вообще такое, как он возник, что получилось в итоге, а главное — зачем?
Мы привыкли считать Китай страной весьма далёкой от нашей цивилизации — как в географическом, так и в ментальном смысле. Я бы даже сказал, что во многом её до сих пор считают «отсталой». У неё нет высоты американских технологий или мощи российских сил ядерного сдерживания, их Шекспиры нам неизвестны, а их Лувры, в общем-то кажутся не такими интересными. А ещё их полтора (а может, два?) миллиарда человек. И мне кажется, мы прозевали момент, когда Китай единственный на планете сдал суровый экзамен на мастерство инфраструктурного манёвра. Я говорю про времена ковидного поветрия, по итогам которого только одна страна (угадайте, какая) вышла с положительными показателями экономического роста.

Читать: https://habr.com/ru/post/667432/

👍2

701 views12:09

Data Analysis / Big Data

Oracle Analytics Performance Tuning: Times Series

How to improve performance of reports using time series or filter functions

Read: https://blogs.oracle.com/analytics/post/oracle-analytics-performance-tuning-times-series

Oracle

Oracle Analytics Performance Tuning: Times Series

How to improve performance of reports using time series or filter functions

664 views00:21

Data Analysis / Big Data

Tips to Convert Text Columns to Dates in Oracle Analytics Dataset Editor - Part Two

This blog is the second of a two-part series that helps you deal with dates not being recognized in datasets. Date columns might not be recognized during the dataset creation process for various reasons. We classified these cases into "The Good, The Bad, and The Ugly" as described in the first article in the series. This article helps you work with more complex (The Ugly) cases, where you need to use a formula and when the text needs wrangling before conversion.

Read: https://blogs.oracle.com/analytics/post/tips-to-convert-text-columns-to-dates-in-oracle-analytics-dataset-editor-part-two

670 views00:18

Data Analysis / Big Data

Data Engineering Weekly #88

Read: https://www.dataengineeringweekly.com/p/data-engineering-weekly-88

👍1

653 views14:05

Data Analysis / Big Data

Работа в Data Science: что важно знать и как этому научиться

Сегодня словосочетания вроде Data Science, Machine Learning, Artificial Intelligence очень популярны. При этом нередко под ними понимаются довольно разные вещи. Это зачастую смущает и запутывает людей, желающих войти в специальность: трудно разобраться, с чего начать, что действительно нужно, а что необязательно для начала. Не претендуя на общность, расскажем, как это видится на основе десятка лет опыта c решением такого рода задач для крупных клиентов со всего мира (сервис / заказная разработка / аутсорс – подставьте термин по вкусу).

Читать: https://habr.com/ru/post/668428/

👍1

753 views18:30

Data Analysis / Big Data

Oracle Analytics Server Best Practices Series: Deployment

Oracle Analytics Server Best Practices Series: Deployment

Read: https://blogs.oracle.com/analytics/post/oracle-analytics-server-best-practices-series-deployment

Oracle

Oracle Analytics Server Best Practices Series: Deployment

658 views00:19

Data Analysis / Big Data

Enable End-to-End SSL Configuration for Oracle Analytics Server on Oracle Cloud Marketplace

Enable End-to-End SSL Configuration for Oracle Analytics Server on Oracle Cloud Marketplace

Read: https://blogs.oracle.com/analytics/post/oas-mp-end-to-end-ssl

664 views00:19

Data Analysis / Big Data

Строим тепловые карты в Apache Zeppelin

Привет!

В этой статье я бы хотел поделиться с теми, кто использует Apache Zeppelin в сочетании со Spark на Scala возможностями по визуализации полученных данных.

Как самим построить такое "северное сияние", как на картинке, какие преимущества имеют тепловые карты, какие процессы легко пропустить, не используя их для анализа - обо всём этом в статье
Әйдә, укы!

Читать: https://habr.com/ru/post/668468/

639 views06:33

Data Analysis / Big Data

Система сбора распределенной телеметрии на Cassandra и Kotlin Spring

Сердцем любого backend являются данные. Существует два сценария использования данных. В одном из них данные изменяются редко, но при этом активно используются в сыром или агрегированном виде и применяются для целей аналитики в реальном времени (такие системы принято называть OLAP). В других системах важно обеспечить сохранение с высокой скоростью большого количество неструктурированных или полуструктурированных объектов, поступающих от устройств Интернета вещей, из источников произвольных событий, наблюдений за активностью пользователя (такие системы называются OLTP - Online Transaction Processing, ориентированные на большое количество транзакций с минимальной задержкой обработки). Для таких систем важно обеспечить надежность хранения данных, поддержку распределенного хранения на нескольких серверах и/или дата-центрах и сохранение консистентности распределенного хранилища.

При этом сами объекты могут отличаться от привычной реляционной модели данных и представляться, например, в виде json-документов с произвольной схемой, объектов с полями со множественными значениями или графов. Разумеется это приводит к необходимости изучения новых подходов к поиску и добавлению данных, использованию специальных драйверов. Но что если соединить распределенное надежное хранилище и синтаксис запросов, близкий к SQL? В этой статье мы познакомимся с проектом Apache Cassandra и обсудим на примере разработки API на Kotlin для сбора телеметрии с датчиков, расположенных по всему миру (с поддержкой отказоустойчивости и управляемой репликации между дата-центрами).

Читать: https://habr.com/ru/post/668524/

👍2

695 views16:24

Data Analysis / Big Data

Know your data 33: oops the dog did it

Read: https://junkcharts.typepad.com/numbersruleyourworld/2022/05/know-your-data-33-oops-the-dog-did-it.html

👍1

665 views13:07

About

Blog

Apps

Platform