Aspiring Data Science – Telegram
Aspiring Data Science
386 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#trading #stationarity #chan #bagging #featureselection #stepwise

Мастерс, кстати, тоже утверждает, что в финансовые модели вообще нельзя брать нестационарные факторы.
По моему опыту, всё-таки в некоторой мере можно. Но, видимо, лучше их преобразовать )

https://www.youtube.com/watch?v=OxNcA6RO_ZE
#apple #rings

"Компания уделяет особое внимание вопросам здравоохранения — это касается умных часов Apple Watch с большим набором сенсоров, и новейших наушников AirPods Pro 2, которые могут работать как слуховой аппарат. Умное кольцо, как и умные часы, оборудуется различными датчиками, которые помогают отслеживать показатели здоровья пользователя, например, частоту сердечных сокращений. Одним из пионеров в этой области была финская компания Oura, но в этом году Samsung выпустила Galaxy Ring — корейский производитель рассчитывает совершить прорыв в сфере здравоохранения, адресовав устройство более широкой аудитории. Умное кольцо за $399 расширяет экосистему устройств Samsung, и той же стратегии придерживается Apple.

Важным отличием умных колец от других гаджетов являются разные размеры пальцев у людей — перед заказом Samsung отправляет потенциальным покупателям набор образцов; а в распоряжении Apple есть обширная сеть розничных магазинов, которая также поможет в реализации этих устройств. Наконец, кольцо — это модный аксессуар, напомнил аналитик. «Apple — марка, имеющая определённую долю репутации с точки зрения продукта, которым люди гордятся. Думаю, красиво исполненное кольцо от Apple может быть одной из тех вещей, которые являются своего рода символом статуса», — отметил Бен Вуд."

https://3dnews.ru/1112143/apple-predrekli-vipusk-umnogo-koltsa-v-2026-godu
#astronomy #asteroids

"Считается, что зонд DART образовал ударный кратер на поверхности Диморфа и выбил из него груду валунов, пыли и других обломков. Наблюдения в телескоп «Хаббл» помогли обнаружить в шлейфе как минимум 37 крупных валунов. По некоторым признакам, Диморф не был монолитным теплом и представлял собой слипшуюся под действием гравитации гору камней. Нетрудно представить, что удар по такому скоплению приведёт к иным результатам, чем удар по монолиту.

На борту зонда «Гера» два кубсатов-разведчика — Milani и Juventas, которые он сбросит при приближении к Диморфу, в общей сложности 12 научных приборов. На станции установлены три камеры, тепловизор, лидар и приборы для измерения гравитации в системе астероидов. На кубстатах также установлены камеры, радары и датчики. Как минимум один из них попытается совершить посадку на астероид. Задача всего этого оборудования заключается в получении наиболее полных и точных данных об астероидах, их строении, составе и орбитах. Только точная информация поможет построить наиболее совершенную модель расчётов отклонения опасных от Земли астероидов методом кинетического удара.

В марте 2025 года зонд «Гера» совершит облёт Марса для гравитационного манёвра и сделает близкие снимки одного из его спутников — Деймоса. К целевой системе астероидов станция доберётся в октябре 2026 года. Это станет началом полугодовой миссии «Геры» по изучению Диморфа и Дидима. Наибольшее сближение станции и Дидима должно составить примерно 1 км."

https://3dnews.ru/1112132/spacex-zapustila-raketu-s-megplanetnoy-stantsiey-hera-k-udarennomu-zondom-nasa-asteroidu
#storage #parquet

Оказывается, в паркетных файлах много настроек, от размера группы до кодировки. трюк с хранением timestamp как отсортированной timedelta позволяет сэкономить 17% размера файла.

Советуют хранить float в кодировке BSS, проверять эффекты сортировки, брать сжатие zstd по дефолту, но обращать внимание на время записи/чтения файла.

https://www.youtube.com/watch?v=GkBDqTrV0hg
👍1
#nobelprize

Шта? Бред какой-то... Нет, я в чем-то рад, что нейросети и ИИ прокрались в нобелевский комитет, но...

"В основе ряда нейронных сетей, алгоритмов машинного обучения и искусственного интеллекта лежат глубокие открытия в области физики, о чём сегодня заявили представители Нобелевского комитета Каролинского института Стокгольма. Премия 2024 года за эти заслуги присуждена физику Джону Хопфилду (John Hopfield) и математику Джеффри Хинтону (Geoffrey Hinton).

«Работа лауреатов уже принесла наибольшую пользу. В физике мы используем искусственные нейронные сети в широком спектре областей, таких как разработка новых материалов с определенными свойствами», — прокомментировала награждение Эллен Мунс (Ellen Moons), председатель Нобелевского комитета по физике."

https://3dnews.ru/1112153/nobelevskuyu-premiyu-po-fizike-dali-za-sozdanie-osnov-neyrosetey-i-mashinnogo-obucheniya
#management #amd

"Десять лет назад, 8 октября 2014 года, доктор Лиза Су (Lisa Su) была назначена на должность генерального директора и президента AMD. На тот момент компания находилась в глубоком кризисе — её акции торговались ниже $3, а рыночная капитализация составляла чуть более $2 млрд после потери $1 млрд за несколько месяцев. Сегодня AMD оценивается в $278 млрд, и это стало возможным благодаря руководству Су, которая привела компанию к трансформации и успеху."

https://3dnews.ru/1112182/liza-su-otmetila-10-let-na-postu-generalnogo-direktora-amd
Forwarded from Data notes
RM_DS_position.pdf
87.4 KB
Ищем в наш нигерийский банк DS с уклоном в риск-аналитику.

Задачи - развивать риск-движок, "пополнять" его новыми моделями, интегрировать новые истоники данных и многое другое.
Подойдет тем, кто хочет в перспективе выйти на международный рынок труда, освоить "мировые" облачные технологии (AWS) и при этом работать на удаленке из РФ. Год назад здесь не было буквально ничего, так что работать еще есть над чем, многое предстоит сделать с нуля.
Точно не подойдет, если вы привыкли, что все данные разложены по полочкам, все процессы выстроены и каждый занимается только своими задачами. Плюс много общения с нигерийцами, что требует много усилий и терпения.

Писать в личку.
#chemistry #nobelprize

"Шведская королевская академия наук разделила Нобелевскую премию по химии за 2024 год между Дэвидом Бейкером (David Baker) из Университета Вашингтона и Демисом Хассабисом (Demis Hassabis) и Джоном Джампером (John Jumper) из Google Deep Mind за создание машинных алгоритмов по предсказанию структуры белков. Поскольку оба достижения направлены на изучение белков — кирпичиков биологической жизни на Земле — эта работа учёных бесценна.

Демис Хассабис и Джон Джампер с коллегами из Deep Mind представили платформу AlphaFold широкой общественности в 2018 году. С тех пор вышло несколько версий программы вплоть до третьей в мае этого года. До появления AlphaFold биологи и химики фактически вручную прогнозировали объёмные структуры белков. Все они состоят примерно из двух десятков аминокислот. В зависимости от последовательностей соединений итоговый белок примет в пространстве ту или иную уникальную конфигурацию.

Белок будет полезным, если его форма подойдёт как ключ к замку к тому или иному соединению, живой клетке или её элементу. Тогда он сможет присоединиться и прореагировать. Это позволяет открывать новые лекарства, ферменты и многое другое в биологии и химии. Но предсказать 3D-форму новых белков среди сотен миллионов вариантов — это непосильная для человеческого ума задача. Программа AlphaFold играючи предсказала пространственную форму всех уже известных науке 200 млн белков и готова предсказывать форму не существующих в природе соединения аминокислот.

Дэвид Бейкер делал эту работу за многие годы до появления AlphaFold. Он создал абсолютно новый и ни на что не похожий белок ещё в 2003 году, чем также заслужил признание со стороны Комитета нобелевской премии. В этом году награда нашла героев."

https://3dnews.ru/1112209/nobelevskuyu-premiyu-po-himii-razdelili-uchyoniy-po-sintezu-nevozmognih-belkov-i-sozdateli-neyroseti-dlya-predskazaniya-strukturi-belkov
👍2
#lmul #transformers #floats

"Новый метод может сократить использование энергии вплоть до 95 %. Команда называет своё открытие «Умножением линейной сложности» (Linear-Complexity Multiplication) или сокращённо L-Mul. Как пишет TechSpot, этот вычислительный процесс основан на сложении целых чисел и требует значительно меньше энергии и операций по сравнению с умножением чисел с плавающей запятой, которое широко применяется в задачах, связанных с ИИ.

На сегодняшний день числа с плавающей запятой активно используются в ИИ для обработки очень больших или очень малых чисел. Они напоминают запись в бинарной форме, что позволяет алгоритмам точно выполнять сложные вычисления. Однако такая точность требует крайне больших ресурсов и уже вызывает определённые опасения, так как некоторым ИИ-моделям нужны огромные объёмы электроэнергии. Например, для работы ChatGPT требуется столько электроэнергии, сколько потребляют 18 000 домохозяйств в США — 564 МВт·ч ежедневно. По оценкам аналитиков из Кембриджского центра альтернативных финансов, к 2027 году ИИ-индустрия может потреблять от 85 до 134 ТВт·ч ежегодно.

Алгоритм L-Mul решает эту проблему за счёт замены сложных операций умножения с плавающей запятой на более простые сложения целых чисел. В ходе тестирования ИИ-модели сохранили точность, при этом энергопотребление для операций с тензорами сократилось на 95 %, а для скалярных операций на 80 %.

L-Mul также улучшает и производительность. Оказалось, что алгоритм превосходит текущие стандарты вычислений с 8-битной точностью, обеспечивая более высокую точность с меньшим количеством операций на уровне битов. В ходе тестов, охватывающих различные задачи ИИ, включая обработку естественного языка и машинное зрение, снижение производительности составило всего 0,07 %, что специалисты сочли незначительной потерей на фоне огромной экономии энергии.

При этом модели на основе трансформеров, такие как GPT, могут получить наибольшую выгоду от использования L-Mul, поскольку алгоритм легко интегрируется во все ключевые компоненты этих систем. А тесты на популярных моделях ИИ, таких как Llama и Mistral, показали даже улучшение точности в некоторых задачах."
https://3dnews.ru/1112241/noviy-algoritm-lmul-pomoget-snizit-energopotreblenie-ii-na-95-no-nvidia-eto-ne-ponravitsya
#sports #tennis #cv

"Всеанглийский клуб лаун-тенниса и крокета объявил о революционных изменениях в судействе старейшего теннисного турнира серии Большого шлема — Уимблдона. По сообщению AP News, с 2025 года на Уимблдоне будет использоваться искусственный интеллект для вынесения решений об аутах и ошибках подачи. Линейных судей, которые прежде отвечали за фиксацию этих событий, поблагодарили за значительный вклад и преданную службу."

https://3dnews.ru/1112240/uimbldon-zamenit-v-2025-godu-lineynih-sudey-na-iskusstvenniy-intellekt
#stocks #nvidia

Шо, опять вставать в лонг по ним?!

"За последний месяц акции Nvidia выросли на 25 % и приблизились к рекордным значениям. Это произошло на фоне ожиданий инвесторами отчётности крупнейших технологических компаний, таких как Meta, Microsoft и Alphabet, которые вскоре расскажут о своём развитии в области ИИ. Эти данные могут оказать значительное влияние на позиции Nvidia, учитывая её ключевую роль на рынке графических процессоров (GPU), применяемых для обучения и работы ИИ."

https://3dnews.ru/1112255/aktsii-nvidia-vzleteli-na-25-pered-otchyotnostyu-krupnih-tehnologicheskih-gigantov
#physics #dune #neutrino

Вот за подобные экспериментальные работы нужно давать нобелевки по физике, а не за абстрактный матаппарат нейросетей, при всём уважении.

"Чуть больше месяца назад завершились масштабные земляные работы, в ходе которых было извлечено 800 тыс. тонн породы. На очереди подготовка помещений к развёртыванию оборудования, на что уйдут годы.

Эксперимент Deep Underground Neutrino Experiment (DUNE) будет включать два детектора нейтрино: ближний и дальний. База между источником мюонных нейтрино в Фермилаб и дальним детектором составит 1300 км. Ближний детектор будет размещён недалеко от источника, а дальний — в Южной Дакоте под Сэнфордской лабораторией. В августе рабочие закончили извлекать грунт под Сэнфордской лабораторией, создав, в том числе под землёй пространство для детектора высотой с 7-этажный дом.

Впечатляющий объём грунта между лабораторным источником нейтрино и дальним детектором, а также специальные камеры для них, содержащие по 17 тыс. т жидкого аргона, нужны для отсеивания нейтрино из других источников (космические и, особенно, солнечные), а также для фильтрации иных элементарных частиц. Нейтрино очень слабо взаимодействуют с веществом. Им нужны хорошие фильтры и особые детекторы. Например, чтобы повысить вероятность столкновения нейтрино с веществом до 50 % необходимо направить его сквозь сплошную стену свинца толщиной в один световой год. "


https://3dnews.ru/1112261/v-ssha-otrili-gigantskie-podzemnie-tonneli-dlya-novogo-pokoleniya-eksperimentov-s-neytrino
🔥2
#asr #nlp #finetuning #t5

Лектор обалденный. Чистое золото!

Сколько он техник применил для решения реальной задачи, просто жесть. Могу подтвердить, что так всё на практике и бывает, всплывает много мелких проблем, каждую из которых приходится решать творчески.
Я не знал, что моделька t5 так хороша, в эпоху больших-то моделей.

https://youtu.be/blE2Dm9SORE?si=LzGeMhrApdLkqq1R
Practitioners guide to MLOps: A framework for continuous delivery and automation of machine learning by Google Cloud

Across industries, DevOps and DataOps have been widely adopted as methodologies to improve quality and reduce the time to market of software engineering and data engineering initiatives. With the rapid growth in machine learning (ML) systems, similar approaches need to be developed in the context of ML engineering, which handle the unique complexities of the practical applications of ML. This is the domain of MLOps. MLOps is a set of standardized processes and technology capabilities for building, deploying, and operationalizing ML systems rapidly and reliably.

The document is in two parts. The first part, an overview of the MLOps lifecycle, is for all readers. It introduces MLOps processes and capabilities and why they’re important for successful adoption of ML-based systems.

The second part is a deep dive on the MLOps processes and capabilities. This part is for readers who want to understand the concrete details of tasks like running a continuous training pipeline, deploying a model, and monitoring predictive performance of an ML model.

Link: Book

Navigational hashtags: #armknowledgesharing #armbooks
General hashtags: #mlops
#fun #bobr

Bobr kurwa! Это видео "сделало мой день" )

Ночь, встретил бобра
В тиши, на дороге пустой.
Он
вдруг заметил меня
И стал
удивленный такой.

Его к речке я захотел прогнать
И кричал ему, чтобы напугать:

Pierwszy raz w życiu widzę bobra!
Ale jesteś, kurwa, duży ty!
Pierdolę, ja patrzcie co spotkałem!
Jakie bydlę, bobr kurwa!

"Впервые в жизни вижу бобра!
Ты такой, блин, здоровый!
Офигеть, посмотрите, кого я встретил!
Какое животное, бобр, черт возьми!" (польск.)


https://www.youtube.com/watch?v=-RTVlPINyQ8