NEW BOT Телеграм, страница

Aspiring Data Science

#politics #war

Хочется и смеяться, и плакать. Как пел Шевчук: что случилось с Родиной и с нами?

https://youtu.be/EDZrzxKCALI

YouTube

Пригожин открывает филиалы в 42 городах! Набор 400 тысяч контрактников!

Второй канал: https://www.youtube.com/channel/UCihQbex-36nUl5KNMjC6Xxw
При создании ролика использовались информационные материалы из независимых СМИ, статьи публицистов и политологов.

🤡2

61 viewsedited 11:10

Aspiring Data Science

#fairuz

Приобщаемся к ливанской/арабской культуре )

https://youtu.be/PY1Ue0ykOrA

YouTube

Fairuz - Nassam Alayna El Hawa (Lyric Video) | فيروز - نسّم علينا الهوى

Lyrics | كلمات

نسم علينا الهوا من مفرق الوادي
يا هوا دخل الهوا خدني على بلادي
نسم علينا الهوا من مفرق الوادي
يا هوا دخل الهوا خدني على بلادي
نسم علينا الهوا من مفرق الوادي
يا هوا دخل الهوا خدني على بلادي
يا هوا يا هوا يللي طاير بالهوا
في منتورة طاقة وصورة…

62 viewsedited 15:06

Aspiring Data Science

#trading #backtesting #walkforward #maestro

Ребят, как выяснилось, у нас некоторые подписчики интересуются торговлей на бирже.
Разбираем принцип работы бэктестера на живом примере )

https://youtu.be/tvetI09PcMc

YouTube

Откровения маэстро трейдинга. Выпуск 5.

Обдуманная торговля на практике. Секреты безубыточного стабильного трейдинга.
Лучший брокер: https://www.tinkoff.ru/sl/KuwZ7ciqnm
Мой профиль: https://www.tinkoff.ru/invest/social/profile/Maestr/

72 viewsedited 15:40

Aspiring Data Science

#games #saturnalia

❤1

63 views16:09

Aspiring Data Science

#gpt4

"На следующей неделе OpenAI совместно с Microsoft представит большую языковую модель (LLM) нового поколения GPT-4 (Generative Pre-trained Transformer 4). Об этом сообщил технический директор немецкого подразделения Microsoft Андреас Браун (Andreas Braun). Как ожидается, GPT-4 будет значительно превосходить по функциональности предыдущую версию GPT-3.5, открывая новые возможности корпоративного использования генеративного ИИ. «Мы представим GPT-4 на следующей неделе, там у нас будут мультимодальные модели, которые предложат совершенно другие возможности — например, [генерацию] видео», — заявил Браун в ходе прошедшего в четверг мероприятия AI in Focus – Digital Kickoff. Он отметил, что использование больших языковых моделей привело к «изменению правил игры», поскольку они учат машины понимать естественный язык, что позволяет им понимать то, что ранее было доступно для понимания только человеку. Технология вышла на новый уровень и «работает на всех языках»: можно задать вопрос на немецком и получить ответ на итальянском. Благодаря мультимодальности Microsoft (совместно с OpenAI) «сделает модели всеобъемлющими», отметил Браун. Если GPT-3.5 позволяет пользователям взаимодействовать посредством ввода текста, то GPT-4 с мультимодальными возможностями, в идеале может обеспечить возможность взаимодействовать в нескольких режимах, включая текст, изображения и звуки."

https://3dnews.ru/1083235/gpt-4-launch

3DNews - Daily Digital Digest

Все самое интересное из мира IT-индустрии

Самые интересные и оперативные новости из мира высоких технологий. На нашем портале - все о компьютерном железе, гаджетах, ноутбуках и других цифровых устройствах. А также обзоры новых игр, достижения современной науки и самые любопытные онлайн-проекты.

60 viewsedited 13:16

Aspiring Data Science

Every dog has its day

https://www.youtube.com/watch?v=AP7_godzwVI&ab_channel=PyData

YouTube

Iain Carmichael, Michael Kim | Open Data, Networks and the Law

PyData Carolinas 2016

What does network science have to say about the law? Can we determine which are the most the most influential cases in our legal system? Can we understand how legal doctrine evolves? Using tools from network statistics and data provided…

❤1

53 viewsedited 20:28

Aspiring Data Science

#shap #explainability #ml

Шок-контент, либа SHAP, оказывается, не поддерживается уже несколько лет. Может, автор умер, или просто забил, не знаю. А я-то думаю, чего она такая медленная, ужасный код, а тут ещё вчера выяснилось, что ошибки, всплывавшие ещё пару лет тому, до сих пор не исправлены, и issues висят открытые. Так что лучше полагайтесь на другие реализации, если найдёте. Вроде в Rapids/CuML что-то есть.

👍3😢1😨1

58 viewsedited 10:46

Aspiring Data Science

Вы моделируете для клуба угловые в футболе. Разбили пространство у ворот на несколько зон, крутите стату. Из зон A и Б с углового атаковали по 1000 раз, забили 3.7% и 5.8%.

Anonymous Poll

Я посоветую тренеру все угловые направлять в зону А, объясню почему в комментах

33%

Я посоветую тренеру все угловые направлять в зону Б, т.к. оттуда выше процент реализации

67%

Мне пока неясно, куда лучше напрвлять угловые, объясню почему в комментах

6 voters50 views11:00

Aspiring Data Science

Forwarded from New Yorko Times (Yury Kashnitsky)

Командный пет-проект – шикарный опыт
#career #petproject

Зная, что конверсия из поста про MLOps-курс https://news.1rj.ru/str/new_yorko_times/96 в упомянутую там статью на Хабре – около 1%, опишу выводы из той же статьи чуть подробнее. Будет полезно всем, кто хочет командой попилить проект, будь то любой пет (как с chatGPT так и без) или командный проект в рамках скоро стартующего курса по MLOps.

- Поработать в команде над интересным проектом – очень крутой опыт, он и сам по себе полезен, и “продавать” его тоже можно на собеседованиях. Это может сравниться с командной зарубой в Kaggle соревновании – тут можно многому научиться, как работе с GitHub, так и навыкам планирования
- Очень важно иметь дедлайн, скажем, конец соревнования на Kaggle или окончание курса. Иначе мотивация бодро фигачить начинает падать
- Оптимальный размер команды – от 3 до 5 человек. Недаром и на Kaggle к этому пришли. Сверх этого – уже есть риск нанять балласт вместо паравоза
- Хорошо бы довести пет-проект до красивой демки, на которую можно и в резюме сослаться и в любой ситуации хоть в лифте показать. Вот наша http://cryptobarometer.org - барометр, показывающий тональность новостей о крипте
- Немного “галеры” привнести в душевный пет-проект не помешает: если обозначить цели (можно в формате OKR) и настроить базовые Scrum-ритуалы, будет более четкое понимание, кто что делает и куда команда движется. Но надо аккуратно, все же пет-проджект – это больше про веселье и полет фантазии
- Здорово в начале сотрудничества побрейнстормить: собраться и накидать идей, обсудить и приоретизировать (сервисы типа https://easyretro.io хорошо для этого подходят)
- Очень помогает делать мини-демки внутри команды. Даже если встречаться всего на час в неделю, имеет смысл начать с 20-минутной демки кого-то из участников (например, продемонстрировать продвижения с фронтендом или сервисом LabelStudio), а потом уже обычный стендап с обсуждением текущих задач.
- Мне помогло разделение активности на треки – инженерный и исследовательский. Первый – про API, докеры и куберы, второй – про прикладной рисеч а-ля active learning, помогают ли аугментации данных и т.д. В целом как Delivery vs. Discovery в корпорациях
- Также помогло четко расписать роли в команде, у нас это был один ML-инженер, два Data Scientist-a/аналитика/ML-исследователя, один Data Engineer и тимлид
- Неочевидным, но, как кажется, верным решением было подождать, пока кто-то один (тимлид, конечно) накидает прототип решения, с мок-версиями всех компонентов (например, базовый круалер и tf-idf вместо берта) и прописанным в коде взаимодействием компонентов. Имея такой прототип, можно было уже намного эффективнее распараллелить задачи по совершенствованию каждого компонента (иначе – затыки а-ля краулер готов, а база еще нет, active learning вроде готов, но неоткуда разметку брать и т.д.).

34 views18:14

Aspiring Data Science

Forwarded from Техножрица 👩‍💻👩‍🏫👩‍🔧

Решила поностальгировать над первым учебным пособием по нейросетям, которое я читала. Книжка вышла в 2007 году, а я ходила на спецкурс, который вели по ней то ли в 2014, то ли в 2015 году. В то время это был единственный курс по нейросетям на мехмате (to the best of my knowledge), и читал его сам автор книжки - пожилой уже профессор Голубев. К сожалению, я не нашла полной версии данного учебного материала в интернете, но вот сокращенная версия, которая дает почувствовать стиль изложения: https://www.mathnet.ru/links/0d06f1ed4abeaf72dccbe0fcd18cec74/fpm915.pdf .
Легко видеть, что такое изложение воспринимается намного труднее, чем современные учебные материалы по тем же темам. Также оно содержит много причудливых названий, которые не используются сейчас. И хотя сам профессор был доброжелательным, отвечал на все вопросы и старался, чтобы спецкурс был интересным, воспринимать его все равно было немного трудновато - даже на последнем курсе мехмата.
Тем не менее, именно оттуда я узнала про основы нейросетевых методов - как устроена полносвязная сеть, что такое градиентный спуск, обратное распространение ошибки...
Хорошо, что сейчас все то же самое научились излагать намного доступнее, понаделали хороших фреймворков (в те времена я знала только три варианта: Theano, Sklearn или "сделай сама" - например, в матлаб; Tensorflow, если и существовал, то в совершенно неиграбельном состоянии, а PyTorch ещё и не пахло), и теперь не только старшекурсники мехмата, но и люди с намного меньшим математическим бэкграундом (даже некоторые старшеклассники!) могут заниматься данной областью.
Ну а книжка, конечно, хоть к настоящему моменту и устарела (начинающим, конечно, я уже порекомендую начинать с более современных материалов), но я её все равно с любовью украсила наклейками и храню как память.

#учебные_материалы #учеба_на_мехмате

33 views11:35

Aspiring Data Science

#postgres #rdbms

Выбирают постгре-совместимую СУБД для распределённого хранения данных (на многих серверах), частично они состоят из временных рядов (неизменяемые, append-only) без первичного ключа (типа показаний сенсоров) , частично из записей с меткой времени, но всё же подверженных нечастому изменению, уже с первичным ключом. часть с json, часть нормализованная. Таблицы большие. Рассматриваю TimescaleDB vs Citus. Если есть опыт использования, отпишите впечатления в комменты, плиз.

39 viewsedited 13:01

Aspiring Data Science

#citus

https://www.youtube.com/watch?v=A9q7w96yO_E&ab_channel=MicrosoftDeveloper

YouTube

How to scale Postgres for time series data with Citus | Citus Con: An Event for Postgres 2022

Video of a conference talk by Burak Velioglu at Citus Con: An Event for Postgres. Abstract: Managing time series data at scale can be a challenge. PostgreSQL offers many powerful data processing features such as indexes, COPY, and SQL—but the high data volumes…

38 views13:22

Aspiring Data Science

#citus

https://www.youtube.com/watch?v=qV_fcja-aQA&ab_channel=FordevsCommunity

YouTube

Contributing.today - Citus 10 Open Source & Columnar Storage for Postgres

Citus 10 is out! A spectacular new release from our Citus open source team. Citus 10 gives you columnar storage for Postgres, Citus on a single node—plus, we’ve open sourced the shard rebalancer. Come see a demo & learn how the Citus extension gives you Postgres…

38 views13:35

Aspiring Data Science

#ottertune #rdbms #tuning

Внезапно, есть сервис, который тюнит с помощь МЛ настройки ваших СУБД (postgres,mysql). Оказывается, 40% облачных инстансов overprovisioned. Достигнутые метрики точности, как обычно, никогда не уточняются. На Хабре давно видел статью от Postgres Pro о динамическом ML-планировщике, так и не знаю, пошел ли он в прод.

https://www.youtube.com/watch?v=J_3NHB5bQgM&ab_channel=MicrosoftDeveloper

YouTube

Why Postgres Is Better Than MySQL for Automated Knob Tuning | Citus Con: An Event for Postgres 2022

Video of a talk by Dana Van Aken at Citus Con: An Event for Postgres. Abstract: Database management systems (DBMS) expose dozens of configurable knobs that control runtime behavior. Setting these knobs correctly for an application's workload can improve the…

40 viewsedited 13:44

Aspiring Data Science

https://ottertune.com/

37 views13:48

Aspiring Data Science

#ottertune

41 viewsedited 13:48

Aspiring Data Science

#ottertune

Системные параметры ОС тоже тюнятся. ML-метрики достигнутые нигде не упомянуты, что заставляет задуматься, а есть ли там вообще МЛ, или это просто оптимизация брутфорс перебором. Работает только с AWS, стоит $110/mo/instance

https://www.youtube.com/watch?v=SFoYQqGfxhE&t=4s&ab_channel=PostgresConference

YouTube

OtterTune: An Automatic Database Configuration Tuning Service

Database management systems (DBMS) expose dozens of configurable knobs that control their runtime behavior. Setting these knobs correctly for an application's workload can improve the performance and efficiency of the DBMS. But such tuning requires considerable…

44 viewsedited 13:52

About

Blog

Apps

Platform