NEW BOT Телеграм, страница

Aspiring Data Science

#GPT #Bloomberg

"Bloomberg потратила около 1,3 млн GPU-часов на обучение BloombergGPT на ускорителях NVIDIA A100 в облаке AWS. Обучение проводилось на 64 кластерах ускорителей, в каждом из которых было по восемь A100 (40 Гбайт), объединённых NVswitch. Для связи использовались 400G-подключения посредством AWS Elastic Fabric и NVIDIA GPUDirect Storage, а для хранения данных была задействована распределённая параллельная файловая система Lustre с поддержкой скорости чтения и записи до 1000 Мбайт/с. Общего объёма памяти всех ускорителей оказалось недостаточно, поэтому Bloomberg произвела оптимизацию для обучения модели: разбиение на отдельные этапы, использование вычислений смешанной точности (BF16/FP32) и т.д. «После экспериментов с различными технологиями мы достигли [производительности] в среднем 102 Тфлопс, а каждый этап тренировки занимал 32,5 с», — сообщили исследователи.

Bloomberg задействовала чуть больше половины (54 %) имеющегося у неё набора данных — 363 млрд документов (с 2007 года) из внутренней базы данных Bloomberg. Остальные 345 млрд документов были получены из общедоступных пресс-релизов, новостей Bloomberg, публичных документов и даже Википедии. Документы получили название «токен». Исследователи стремились, чтобы обучающие последовательности имели длину 2048 токенов, чтобы поддерживать максимально высокий уровень использования ускорителей."

https://servernews.ru/1084721

ServerNews - все из мира больших мощностей

Bloomberg создала собственную ИИ-модель BloombergGPT, которая меньше ChatGPT, но эффективнее при использовании в финансовых операциях

Финансовая фирма Bloomberg решила доказать, что существуют более разумные способы тонкой настройки ИИ-приложений, не имеющих проблем с соблюдением принципов этики или с безопасностью, с которыми сталкиваются при использовании, например, ChatGPT.

👍1

43 viewsedited 02:26

Aspiring Data Science

#ml #graphs #sberbank

"«Визуализация графов» отвечает за доступ к интерактивному просмотру графов и выявляет скрытые взаимосвязи между компаниями и физлицами, а сервис поиск неявных связей Link Prediction — за неизвестные факты о связанности клиентов, если данные о них изначально отсутствовали или были скрыты.

Среди сервисов также есть «Графовые нейронные сети» (GNN) — это готовый пайплайн обучения Graph Convolutional Network на базе PyTorch Geometric по собственным таргетам. «Встраиваемая графовая база данных» подходит для нестандартных решений. В ядре платформы Сбера находится собственная производительная база данных FastGraph, а также open-source-технологии стека Hadoop.

Как отмечают в компании, уже собрано более 17 Пбайт плотно связанной между собой неоднородной обезличенной информации. Сервисы платформы применяются в десятках автоматизированных бизнес-процессов Сбера. BI-инструментами и данными платформы пользуется 6,5 тыс. специалистов компании."

https://servernews.ru/1084444

ServerNews - все из мира больших мощностей

За кредитование Сбера ответит собственная графовая платформа

Сбер разработал графовую платформу для работы с большими данными и встроил ее в бизнес-процессы корпоративного и розничного кредитования. В компании уверяют, что это позволит эффективнее принимать решения о выдаче кредитов и их параметрах.

50 views02:28

Aspiring Data Science

image_2023-04-09_06-19-45.png

37.4 KB

Хотел использовать ЧатГПТ для помощи со статьёй, плюнул. Городит чушь, не знаю, что там она за диагнозы пациентам ставит.

49 views03:19

Aspiring Data Science

#ApproximateEntropy #SampleEntropy #FuzzyEntropy #DistributionEntropy #PermutationEntropy #antropy #EntropyHub Измерение сложности сигнала https://www.youtube.com/watch?v=5vOYgJ-80Bg https://github.com/raphaelvallat/antropy

Заинтересовал вопрос, а можно ли с помощью этих методов различить случайный и структурированный сигнал. Так что зачем-то вместо сна я всю ночь делал расчёты и писал статью. Отправил на ревью в TowardsDataScience, посмотрим, примут ли.

🤯1

48 views08:28

Aspiring Data Science

#numpy #bugs

Нампай тож свалился на этом проекте )) Захотел 4 эксбибайта памяти.

https://github.com/numpy/numpy/issues/23564

GitHub

BUG: Memory Overflow in np.histogram with bins="auto" · Issue #23564 · numpy/numpy

Describe the issue: Something is wrong with the "auto" option. Reproduce the code example: import numpy as np hist, bin_edges = np.histogram( np.array( [ -4.24264069e00, -5.55111512e-17, ...

52 viewsedited 00:53

Aspiring Data Science

#trading #ml

Интересный таргет придумали.

https://www.youtube.com/watch?v=y4dycLL6w2U

YouTube

Криптовалюты, алготрейдинг и ML — Михаил Горкунов, Евгений Сидоров, Андрей Шапулин

Секция SysML, part 1
Data Fest⁵, 2018.04.28

73 viewsedited 04:20

Aspiring Data Science

#trading #crypto #hft #backtesting

https://www.youtube.com/watch?v=7whTVJ9MA20

YouTube

#ЦМФ FastForward: алгоритмический трейдинг, криптовалюты, крах FTX, маркетмейкинг, бэктест, карьера

Современный маркетмейкинг на криптобиржах:

Михаил Горкунов, Co-Founder & Head of Quantitative Research @ FastForward Trading
Андрей Белоусов, Head of Development Team @ FastForward Trading

0:00 Введение
2:00 О Fast Forward Trading
3:05 На каких биржах торгуют…

57 viewsedited 04:54

Aspiring Data Science

#trading #crypto #hft #backtesting https://www.youtube.com/watch?v=7whTVJ9MA20

#stats #probability #python

https://www.youtube.com/watch?v=blMLK620yCg

YouTube

#ЦМФ. Проект по теории вероятностей, математической статистике и случайным процессам

Александр Ланцов, студент программы «Количественная аналитика»:

0:35 Первая неделя: генераторы случайных чисел
2:35 Данные по коронавирусу
4:55 Вторая неделя: обработка данных по коронавирусу — учёт выходных и понедельников, оценка распределения, анализ…

51 views05:11

Aspiring Data Science

#finance #optimalstopping

Вау, сам Альберт Николаевич Ширяев. Применяет теорию оптимальной остановки случайного процесса к задаче buy & hold. Что интересно, в области ООП работал в своё время даже... Березовский )

https://www.youtube.com/watch?v=Hv1iZhYvfoE

YouTube

#ЦМФ Альберт Николаевич Ширяев, академик (Мехмат МГУ): Стратегия Buy&Hold #Финансовая_математика

Альберт Николаевич Ширяев — ученик А. Н. Колмогорова, заведующий кафедрой Теории вероятностей Мехмата МГУ, создатель российской школы финансовой математики

0:01 Что такое Buy&Hold?
1:55 Практическая постановка задачи в банке: как продать акцию по максимальной…

52 viewsedited 05:21

Aspiring Data Science

#trading #nlp

https://www.youtube.com/watch?v=nYr5mkhALMk

YouTube

#ЦМФ. Проект по скорингу новостей и использованию новостей для алгоритмического трейдинга

Максим Звегинцев, студент программы «Количественная аналитика»:

0:15 Постановка задачи и обзор данных
1:08 Предобработка данных
3:30 BERT (Bidirectional Encoder Representations from Transformers)
5:22 Оценка результатов

Страница ЦМФ: https://vk.com/cmf_russia…

71 views05:41

Aspiring Data Science

#ml #contest

Это было первое моё соревнование в DS. Я тогда ни фига не знал, раскрыв рот смотрел на бэйзлайн, в котором использовался pandas. Прошло 6 лет, а всё так же ничего не знаю, по ощущениям. Но по-прежнему жутко интересно.

https://www.youtube.com/watch?v=BRwIIEXnXXU

YouTube

Sberbank Data Science Contest: предсказание пола клиента — Михаил Горкунов

Михаил Горкунов рассказывает, как можно подойти к задаче предсказания пола клиента в банке, которая решалась в рамках Sberbank Data Science Contest. Из видео вы сможете узнать:

- Можно ли деанонимизировать платежные данные
- Какие признаки можно строить…

51 views05:57

Aspiring Data Science

#trading

https://www.youtube.com/watch?v=3UDnIgGturg

YouTube

Алготрейдинг. Торговые роботы. Круглый стол.

Сергей Васильев, Арам Гущян, Евгений Бочаров, Алексей Афанасьевский

http://confa.smart-lab.ru/

50 views07:06

Aspiring Data Science

#dask #joblib #sklearn #daskml #coiled

https://www.coiled.io/blog/sklearn-joblib-dask

www.coiled.io

Scikit-learn + Joblib: Scale your Machine Learning Models for Faster Training

You can train a sklearn models in parallel using the sklearn joblib interface. This allows sklearn to take full advantage of the multiple cores in your machine and speed up training.

51 views08:30

Aspiring Data Science

#dask

https://youtu.be/nnndxbr_Xq4

YouTube

Dask in 8 Minutes: An Introduction

This video gives a general overview of the Dask project.

What is Dask?

Dask is a flexible library for parallel computing in Python.

Dask is composed of two parts:

1. Dynamic task scheduling optimized for computation. This is similar to Airflow, Luigi…

57 views08:49

Aspiring Data Science

#trading #scalping #icebergs

https://www.youtube.com/watch?v=poG0pGYXsdE

YouTube

ЧТО ТАКОЕ СКАЛЬПИНГ? ЖИВ ЛИ СКАЛЬПИНГ В 2019

Что такое скальпинг, в сравнении с другими стилями торговли на бирже. И почему трейдинг на младших таймфреймах - это не скальпинг.
Обучение трейдингу - https://www.proscalping.com/scalpingrts
Отчеты моих сделок - https://www.instagram.com/maximov.trade/

58 views16:31

Aspiring Data Science

#trading

Лидер.

😍2

58 views18:40

Aspiring Data Science

#diet

Прельстился в магазине сладкой водичкой по скидке. Дома после жадного свинчивания крышки двухлитровая бутыль извергла такой столб содержимого, что липкой сладкой хренью забрызгало всё в радиусе полутора метров, включая меня, ноут, кресло и внешнюю клаву. Теперь залипает часть кнопок. А ведь мне даже не понравился вкус.

53 views20:18

Aspiring Data Science

#atms #ml #sberbank

Про придумывание истории после перемещения банкомата кажется бредом, про подбор лагов на CV интересная идея, но не раскрыта.

https://www.youtube.com/watch?v=s7cYqaiA2mE&t=3s

YouTube

"Data Science на примере управления банкоматной сетью Банка"

Александр Ульянов, Сбербанк, Data Science Executive Director.СПЕЦИАЛИСТЫ В ОБЛАСТИ
DATA SCIENCE И DATA ENGINEERINGhttp://newprolab.com

🤔1

62 viewsedited 20:33

Aspiring Data Science

#trading

Про песочницу интересно

https://www.youtube.com/watch?v=DLeVIu-RWww

YouTube

Алготрейдинг. Роботы. HFT роботы. Как стать алготрейдером. Создание роботов для своей системы.

Алготрединг-мифы и реальность
Основные стратегии алготрейдера
Частые ошибки новичков
Как стать алготрейдером
___________________________________
Как создать робота
Как создать свой алгофонд
Какие доходности могут быть
Почему все роботы "сливают" и как этого…

71 views22:04

Aspiring Data Science

#mlops #dvc

Уже в который раз смотрю материалы про dvc, и никак не могу понять, нафига это нужно. А вы пользуетесь DVC или каким-либо другим инструментом версионирования данных?

https://www.youtube.com/watch?v=FbIyKjOdiI8

YouTube

Estefania Barreto-Ojeda - Applications in ML Drug Discovery pipelines | PyData NYC 2022

www.pydata.org

Development of Machine Learning (ML) pipelines in drug discovery faces different challenges from those in traditional software development. In addition to unique challenges during the data engineering stage, drug discovery pipelines require…

62 views03:03

Aspiring Data Science

#towardsdatascience

Немного помоев в лицо. Видимо, моя работа слишком хороша для них.

"Hi Anatoly,

Thank you for considering Towards Data Science. Our team has decided not to publish the post you shared with us, but we appreciate the chance to read your work.

👀1

49 viewsedited 21:19

About

Blog

Apps

Platform