Aspiring Data Science – Telegram
Aspiring Data Science
386 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#nlp #mlm #transformers

Друзья, а какая из публично доступных моделей сейчас считается SOTA для мультиязыкового masked language prediction? Bert-ы что-то не вдохновляют.

капец. похоже, ошибку нашёл в contextualSpellChecker.
для "Я ушл в магазин.", bert-base-multilingual-cased предлагает топовый ответ '##шел' с вероятностью 0.3896,
Либа думает, что решётка означает склейку токенов, и склеивает очищенный от решёток вариант с предыдущим токеном. Хотя, кажется, Берт имеет в виду вовсе не склейку с предыдущим токеном, а скорее склейку с текущим токеном, но выброшенными посл 2-мя символами. А, нет, это уже глюки. ## это просто признак субтокена.
#business #news #projects

Пока с облачным проектом неожиданный затык (ограничения по скрейпингу AWS), решил переключиться обратно на прогнозную модель для трейдинга. Собираю сегодня допинфо о параметрах биржевых сессий и ГО, и вернусь к блокам фичей.
🔥1
Forwarded from MMMeme Channel
1🌚1
В первый раз сегодня повзаимодействовала с банкоматом нового типа, в хипстерском стиле таким, с огромным экраном. Написано было у него на этом экране "заплатить через Сбербанк онлайн".
Ткнув туда, узнала, что можно действительно не вставлять в него карту, а просто через приложение два раза отсканировать QR-код, и банкомат даст денежек 😱
До сих пор не могу привыкнуть к этим новшествам всем...
Помню, у меня первая банковская карта только в 20 лет появилась. И ещё лет пять я с нее просто снимала кеш, и кешем за все платила, а саму карту никуда не тыкала, кроме банкомата. Только лет в 25 приучилась самой картой платить... а там уже мне беспроводную карту дали, которую не только тыкать, но и прикладывать можно.
Лет в 28 начала впервые пользоваться приложением банковским - и то потому что поехала в Лондон, и мне там дали карту банка, у которого не было банковских отделений, и все делалось через это приложение... только после этого поняла, зачем это все нужно, и на российские приложения также стала обращать внимание и устанавливать их себе. Теперь уже и вспомнить трудно, как это я так без приложений всем пользовалась.
Единственное, что вызывало у меня опасение — это оплата с помощью NFC-чипа в телефоне. Ничто в мире не бывает более беспомощным, безответственным и порочным, чем NFC-чип. Но я знаю, что рано или поздно перейду и на эту дрянь. 😄

P.S. Капец я мамонт, конечно))
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣1
#dotnet #linux

Оказывается, скомпилированные Net приложения запускаются прям в линуксе (через mono)!! вот это приятная новость.. я думал, это не работает.

https://www.codesdope.com/course/c-sharp-introduction/
#git

Так можно добавить в git существующий проект. Рекомендуется это сделать тем, кто над одним и тем же кодом работает с разных компов и мест. Ну или командой из нескольких человек, тогда вообще обязательно.
Хороший .gitignore в камментах, чтобы не тянуть в облако временные файлы и прочий мусор.

https://kbroman.org/github_tutorial/pages/init.html
#astronomy

"Красный сверхгигант Бетельгейзе продолжает лихорадить после произошедшего в 2019 году титанического выброса коронарной массы в 400 млрд раз больше обычного выброса на нашем Солнце. После отмеченного четыре года назад Великого Потускнения в виде снижения светимости на 25–35 %, сегодня наблюдается резкий рост блеска. В апреле звезда достигла пика светимости в 156 % от первоначального. Неужели мы на пороге взрыва гигантской сверхновой всего в 700 световых годах от Земли?"

Dort in der Tiefe
unendlich fern
ein helles Licht
Doch es stirbt ein Stern

Und wir tanzen
so blind durch die Nacht
spielen mit den Göttern
das Spiel um die Macht
bis ein Roter Riese
am Horizont erscheint
und eine Explosion
uns mit dem All vereint

https://www.youtube.com/watch?v=0pIAx_t92vE
#scheduledcalls #fun

Пару минут, коллеги, интернет нестабильный
😁3
#news #nvidia

"Что интересно, за сутки NVIDIA прибавила больше, чем капитализация всей таких компаний, как AMD и Intel. Первая оценивается в $192 млрд, тогда как цена второй сократилась до всего лишь $113 млрд.

Решение о создании компании было принято в апреле 1993 года, когда теперешний её глава Дженсен Хуанг (Jensen Huang) обсуждал с двумя коллегами-инженерами возможности улучшить компьютерную графику. В конце 2006 года NVIDIA совершила революцию, предложив средства разработки ПО, использующего мощности графических процессоров для целей, не связанных с графикой. Вскоре стало ясно, что чипы NVIDIA подходят для вычислений, необходимых для работы систем ИИ — они превосходно выполняют множество операций одновременно, тогда как центральные процессоры справляются с этой задачей менее эффективно."

https://3dnews.ru/1087429/nvidiavplotnuyu-podobralas-k-rinochnoy-kapitalizatsii-v-1-trillion
#news

"Более половины работников исследовательского подразделения были переведены в другие отделы Arm — научные проекты не были закрыты полностью, но их направление было скорректировано в сторону конкретных возможностей для бизнеса с перспективой около 10 лет по нескольким направлениям. В последние годы Arm Research занималось, в частности, сенсорами малой мощности, контролирующими подачу питания от аккумуляторов; ИИ-суперкомпьютерами с архитектурой по образцу человеческого мозга; а также новыми полупроводниковыми материалами.

Некоторые проекты, включая направления машинного обучения и архитектуры микросхем, были переданы другим подразделениям компании — расформированию подверглись команды, занимавшиеся инновационными материалами, устройствами и схемами, промышленная реализация которых пока невозможна."

https://3dnews.ru/1087425/arm-zakrila-issledovatelskoe-podrazdelenie-radi-optimizatsii-pered-ipo
Минутка проверки знаний иностранных языков. Как можно перевести на английский слово "баловать"? Не заглядывайте в словарь! )
Anonymous Quiz
16%
to pamper
0%
to featherbed
16%
to coddle
0%
to cosset
0%
to cosher
0%
to dandle
3%
to grandmother
13%
to baby
34%
ALL of above
19%
NONE of above
🤔1
#gpt #law

"Роберто Мата подал в суд на авиакомпанию Avianca в связи с получением травм из-за столкновения с сервировочной тележкой во время полёта в 2019 году, заявив о халатности со стороны её сотрудника. Стивен Шварц, адвокат Levidow, Levidow & Oberman, имеющий лицензию на адвокатскую практику в Нью-Йорке более трёх десятилетий, прибегнул к помощи ChatGPT для сбора данных о предыдущих подобных судебных процессах, итоги которых свидетельствовали бы в пользу его подзащитного.

Как выяснилось, ChatGPT предоставил ему вымышленные факты, из-за чего адвокату теперь грозит потеря лицензии. В конце апреля адвокаты Avianca из Condon & Forsyth направили судье Кевину Кастелю (Kevin Castel) Федерального окружного суда Южного округа Нью-Йорка письмо, в котором поставили под сомнение подлинность приведённых адвокатом дел.

Судья после проверки отметил в постановлении, что по крайней мере шесть дел, представленных Шварцем в качестве прецедентов, «кажутся фиктивными судебными решениями с фиктивными цитатами и фиктивными внутренними отсылками к источнику»."

https://3dnews.ru/1087499/advokat-vospolzovalsya-iibotom-dlya-sbora-faktov-i-gorko-ob-etom-pogalel
🌚2
#news #hardware #nvidia

"DGX GH200 использует новую платформу NVLink Switch System, позволяющую 256 суперчипам GH200 Grace Hopper работать как единый GPU (каждый из таких суперчипов объединяет 72-ядерный CPU Grace на базе Arm, GPU класса H100, 96 Гбайт HBM3 и 512 Гбайт LPDDR5X-памяти). Это, по словам NVIDIA, позволит DGX GH200 развить производительность в 1 экзафлоп и иметь 144 терабайта общей памяти. Шквал анонсов подчёркивает перерождение NVIDIA из простого производителя графических чипов в компанию, находящуюся в центре бума ИИ. На прошлой неделе Дженсен Хуанг дал ошеломляющий прогноз продаж на текущий квартал — почти на $4 млрд выше оценок аналитиков — благодаря спросу на чипы для центров обработки данных, выполняющие задачи ИИ. Это привело к рекордному росту акций и поставило NVIDIA на грань оценки в 1 триллион долларов — впервые в индустрии чипов."

https://3dnews.ru/1087529/nvidia-predstavila-ryad-iiproduktov-vo-glave-kotorih-dgx-gh200-odin-iz-samih-moshchnih-superkompyuterov-v-mire
Forwarded from Борис опять
#лабораторный_журнал

Внедрил ML!

Если внедрять сбор данных в операции пришлось пять-шесть месяцев, то путь от нуля до запущенного бейзлайн ML решения занял две недели. Пока что в теневом режиме: модель делает предсказания, распознает проблемы на фабрике, но этого никто не видит кроме нашей команды. Убедимся, что прогнозы полезные, и будем выводить в мир.

Вот такой глупый бейзлайн дал небесполезные предсказания: вытащить из фотографии clip embedding и обучить логрегрессию. Все сделано втупую: модель распознает классы “любая проблема” и “нет проблемы”. “Проблемных” лейблов всего пара тысяч на десятки тысяч “ок” лейблов, так что я думал, что ничего не выйдет. Но возможно получилось уже сильно лучше, чем ничего.

Сейчас у нас на фабрике каждый день надо проверять до тысячи локаций. Рук на это нехватает, поэтому проверяется случайная выборка, от силы сотня. Немалая часть проблем остаются ненайденными. Идеальная система находила бы все проблемы, мы предлагали бы агрономам проверить только проблемные локации и готово: все проблемы найдены и подтверждены человеком. Это снизило бы нагрузку с проверки сотен локаций до пары десятков, что занимало бы минут 15.

Теперь к реальности. Из 100 проблемных изображений безлайн верно находит 75. На каждые 100 распознанных проблем он неверно размечает еще 500 нормальных изображений как проблемные, так что проверять надо в 5 раз больше, чем есть проблем. Но вот что важно: подавляющее большинство локаций не проблемные. Среди 100 нормальных изображений бейзлайн верно определяет 80 как не имеющие проблем.

В конечном итоге агрономам нужно размечать только 15% изображений, что конвертируется в максимум 120 локаций. Пока что далеко от цели в 20-30 локаций. Но этот объем уже можно проверить за день. Конечно 1/3 проблем не будет найдены, но мы посчитали, что это все равно меньше, чем остается ненайденным сейчас!

Довольно глупая модель оказывается полезной, потому что убирает огромную долю простых и изначально неинтересных случаев из объема работы.
1
#analogcomputing

Так подождите, гадание на кофейной гуще, что... Да ну не...

"How to make predictions
To understand how we can use a reservoir computer to make predictions, imagine you have a record of daily rainfall for the past year and a bucket full of water near you. The bucket will be our "computational reservoir".

We input the daily rainfall record to the bucket by means of stone. For a day of light rain, we throw a small stone; for a day of heavy rain, a big stone. For a day of no rain, we throw no rock.

Each stone creates waves, which then slosh around the bucket and interact with waves created by other stones.

At the end of this process, the state of the water in the bucket gives us a prediction. If the interactions between waves create large new waves, we can say our reservoir computer predicts heavy rains. But if they are small then we should expect only light rain.

It is also possible that the waves will cancel one another, forming a still water surface. In that case, we should not expect any rain.

The reservoir makes a weather forecast because the waves in the bucket and rainfall patterns evolve over time following the same laws of physics.

So do many other natural and socio-economic processes. This means a reservoir computer can also forecast financial markets and even certain kinds of human activity."

https://www.sciencealert.com/prototype-reservoir-computer-predicts-events-better-than-some-digital-computers
#nvidia

"Ценные бумаги компании на прошлой неделе резко пошли в рост после квартального финансового отчёта, ключевые показатели которого оказались выше прогнозов аналитиков. Подорожали акции и других производителей чипов, досадным исключением стала лишь Intel. Примечательно, что во II квартале 2024 финансового года NVIDIA прогнозирует продажи на уровне $11 млрд — это на 50 % выше, чем прогнозируемые аналитиками $7,15 млрд."

https://3dnews.ru/1087606/kapitalizatsiya-nvidia-previsila-1-trillion