#trading
"But it doesn't mean, for example, that you can't find your own edge. I mean, the stuff we use is not based on anything all that... it's not based on anything terribly exotic, and it works extremely well. You know, there's all kinds of edges. And I think it's like they said, there's a million roads to Mecca. I think there's a million roads to making money in the markets. But you simply have to find your edge. And the simple truth is, you have to make sure that... the most important thing is if you think you have an edge, make sure you know you got an edge and make sure it's thoroughly tested and make sure you can afford it. And make sure that in fact all the assumptions about slippage and cost and so forth are real. And then go for it.
But I mean, you know, people are making money in the markets that aren't institutions for many, many years. I believe they always will be. But you have to find your edge. And let's face it, I mean, the amount of sophistication that people have now, for example, versus what they had when I first started doing this... I mean, it's a joke. But the irony is that, you know, even though TradeStation and a lot of these tools have come a long way and are very powerful, it's... to me, it's very ironic that after putting walk-forward out there almost 30 years ago now, that people still don't at the even seem wise to use it all the time. I mean, I wouldn't... I can't imagine building a strategy without walk-forward analysis. I simply... I would really shoot myself if I hadn't done that."
https://www.youtube.com/watch?v=IEeJh-A-uIQ
"But it doesn't mean, for example, that you can't find your own edge. I mean, the stuff we use is not based on anything all that... it's not based on anything terribly exotic, and it works extremely well. You know, there's all kinds of edges. And I think it's like they said, there's a million roads to Mecca. I think there's a million roads to making money in the markets. But you simply have to find your edge. And the simple truth is, you have to make sure that... the most important thing is if you think you have an edge, make sure you know you got an edge and make sure it's thoroughly tested and make sure you can afford it. And make sure that in fact all the assumptions about slippage and cost and so forth are real. And then go for it.
But I mean, you know, people are making money in the markets that aren't institutions for many, many years. I believe they always will be. But you have to find your edge. And let's face it, I mean, the amount of sophistication that people have now, for example, versus what they had when I first started doing this... I mean, it's a joke. But the irony is that, you know, even though TradeStation and a lot of these tools have come a long way and are very powerful, it's... to me, it's very ironic that after putting walk-forward out there almost 30 years ago now, that people still don't at the even seem wise to use it all the time. I mean, I wouldn't... I can't imagine building a strategy without walk-forward analysis. I simply... I would really shoot myself if I hadn't done that."
https://www.youtube.com/watch?v=IEeJh-A-uIQ
YouTube
Can Artificial Intelligence really replace the human trader? - Bob Pardo
Are our roles as traders coming to an end soon?
Is AI and ML (that’s Machine Learning, not Money Laundering or Meat Loaf…) going to take over the trading world?
Trading veteran Bob Pardo from Pardo Capital joins us to discuss these topics plus much more…
Is AI and ML (that’s Machine Learning, not Money Laundering or Meat Loaf…) going to take over the trading world?
Trading veteran Bob Pardo from Pardo Capital joins us to discuss these topics plus much more…
#gpt #llms #codegems #openai
Красивый способ извлечь текстовые данные в структурированном виде. Пример Extracting data from research papers using Structured Outputs.
Example response:
Красивый способ извлечь текстовые данные в структурированном виде. Пример Extracting data from research papers using Structured Outputs.
from pydantic import BaseModel
from openai import OpenAI
client = OpenAI()
class ResearchPaperExtraction(BaseModel):
noscript: str
authors: list[str]
abstract: str
keywords: list[str]
completion = client.beta.chat.completions.parse(
model="gpt-4o-2024-08-06",
messages=[
{"role": "system", "content": "You are an expert at structured data extraction. You will be given unstructured text from a research paper and should convert it into the given structure."},
{"role": "user", "content": "..."}
],
response_format=ResearchPaperExtraction,
)
research_paper = completion.choices[0].message.parsed
Example response:
{
"noscript": "Application of Quantum Algorithms in Interstellar Navigation: A New Frontier",
"authors": [
"Dr. Stella Voyager",
"Dr. Nova Star",
"Dr. Lyra Hunter"
],
"abstract": "This paper investigates the utilization of quantum algorithms to improve interstellar navigation systems. By leveraging quantum superposition and entanglement, our proposed navigation system can calculate optimal travel paths through space-time anomalies more efficiently than classical methods. Experimental simulations suggest a significant reduction in travel time and fuel consumption for interstellar missions.",
"keywords": [
"Quantum algorithms",
"interstellar navigation",
"space-time anomalies",
"quantum superposition",
"quantum entanglement",
"space travel"
]
}
Forwarded from Data notes
Женя - очень крутой лидер, именно с ним мы последние полгода делали риск-движок для нигерийского банка, о котором я упоминал выше. И, в отличие от меня, он в Нигерии прям живет, и в этом подкасте рассказывает много интересного не только про рабочие будни, но и про жизнь в этой стране, о которой мы, выходцы из стран СНГ, практически ничего не знаем.
Эксклюзивный контент!
Эксклюзивный контент!
YouTube
Царская жизнь дата сайентиста в Нигерии — повара, охрана, яхт-клубы и похищения
Подробнее о наших друзьях из Lamoda Tech:
Telegram: https://news.1rj.ru/str/+fexYbm24Q34zMDgy
Сайт: https://latech.ru/
Habr: https://habr.com/ru/companies/lamoda/articles/
Супер-курс Влада Тена по Алгоритмам!
https://news.1rj.ru/str/tribute/app?startapp=sjGY-5jAPwCjfRH3
Мы обречены…
Telegram: https://news.1rj.ru/str/+fexYbm24Q34zMDgy
Сайт: https://latech.ru/
Habr: https://habr.com/ru/companies/lamoda/articles/
Супер-курс Влада Тена по Алгоритмам!
https://news.1rj.ru/str/tribute/app?startapp=sjGY-5jAPwCjfRH3
Мы обречены…
#nlp #mteb #embeddings
Есть такой MTEB - Massive Text Embedding Benchmark.
У них сделан приятный лидерборд на Градио.
Большинства моделек, которые были в топе пару лет тому, когда я немного занимался NLP, в этой таблице вообще нет, наверное, слишком слабы.
Что удивительно, эмбеддинговые модельки от OpenAI практически в самом хвосте.
А что же чемпион? Всех заруливает опенсорсная NV-Embed-v2 от Nvidia.
"We present NV-Embed-v2, a generalist embedding model that ranks No. 1 on the Massive Text Embedding Benchmark (MTEB benchmark)(as of Aug 30, 2024) with a score of 72.31 across 56 text embedding tasks. It also holds the No. 1 in the retrieval sub-category (a score of 62.65 across 15 tasks) in the leaderboard, which is essential to the development of RAG technology.
NV-Embed-v2 presents several new designs, including having the LLM attend to latent vectors for better pooled embedding output, and demonstrating a two-staged instruction tuning method to enhance the accuracy of both retrieval and non-retrieval tasks. Additionally, NV-Embed-v2 incorporates a novel hard-negative mining methods that take into account the positive relevance score for better false negatives removal.
For more technical details, refer to our paper: NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models."
Для русского языка потестировано в 6 раз меньше моделей, лидируют e5-mistral-7b-instruct(7B) и multilingual-e5-large-instruct (0.5B). Если их сравнить со старенькими distilrubert-small-cased или rubert от DeepPavlov, в зависимости от задачи скор лидеров выше от 10 до 60 процентных пунктов.
Есть такой MTEB - Massive Text Embedding Benchmark.
У них сделан приятный лидерборд на Градио.
Большинства моделек, которые были в топе пару лет тому, когда я немного занимался NLP, в этой таблице вообще нет, наверное, слишком слабы.
Что удивительно, эмбеддинговые модельки от OpenAI практически в самом хвосте.
А что же чемпион? Всех заруливает опенсорсная NV-Embed-v2 от Nvidia.
"We present NV-Embed-v2, a generalist embedding model that ranks No. 1 on the Massive Text Embedding Benchmark (MTEB benchmark)(as of Aug 30, 2024) with a score of 72.31 across 56 text embedding tasks. It also holds the No. 1 in the retrieval sub-category (a score of 62.65 across 15 tasks) in the leaderboard, which is essential to the development of RAG technology.
NV-Embed-v2 presents several new designs, including having the LLM attend to latent vectors for better pooled embedding output, and demonstrating a two-staged instruction tuning method to enhance the accuracy of both retrieval and non-retrieval tasks. Additionally, NV-Embed-v2 incorporates a novel hard-negative mining methods that take into account the positive relevance score for better false negatives removal.
For more technical details, refer to our paper: NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models."
Для русского языка потестировано в 6 раз меньше моделей, лидируют e5-mistral-7b-instruct(7B) и multilingual-e5-large-instruct (0.5B). Если их сравнить со старенькими distilrubert-small-cased или rubert от DeepPavlov, в зависимости от задачи скор лидеров выше от 10 до 60 процентных пунктов.
GitHub
GitHub - embeddings-benchmark/mteb: MTEB: Massive Text Embedding Benchmark
MTEB: Massive Text Embedding Benchmark. Contribute to embeddings-benchmark/mteb development by creating an account on GitHub.
👍3
Не забросил идею создания базы знаний по трейдингу на основании интервью экспертов, с AI технологиями. Интересен ли Вам такой продукт?
Anonymous Poll
17%
Нет. Не интересуюсь трейдингом и инвестированием
78%
Любопытно посмотреть, получится ли у тебя. Сделай, а там увидим, вдруг заинтересуюсь.
6%
Я буду задавать ИИ вопросы, а он отвечать, пользуясь знаниями экспертов? Готов купить подписку.
#featureselection #redundancy #indicators #trading #hurst
https://www.youtube.com/watch?v=x_JcExwuu60
https://www.youtube.com/watch?v=x_JcExwuu60
YouTube
David Aronson of Hood River on data mining & Hurst signals - at The Trading Show Chicago 2013
David Aronson, President of Hood River Research, gave a presentation at The Trading Show Chicago 2013 on the topic, 'Rapid identification of non-redundant predictors with data mining bias correction and its application to extreme Hurst signals.'
The Trading…
The Trading…
#google #alphachip
https://3dnews.ru/1111695/google-predstavila-tehnologiyu-proektirovaniya-mikroshem-alphachip-s-pomoshchyu-ii
https://3dnews.ru/1111695/google-predstavila-tehnologiyu-proektirovaniya-mikroshem-alphachip-s-pomoshchyu-ii
3DNews - Daily Digital Digest
Google представила технологию проектирования микросхем AlphaChip с помощью ИИ
Google представила AlphaChip — метод обучения искусственного интеллекта с подкреплением для проектирования микросхем.
#postgres #databases
Темпоральный уникальный ключ - крутая идея! Как и триггер ON LOGIN.
https://www.youtube.com/watch?v=peLXtGorl8A
Темпоральный уникальный ключ - крутая идея! Как и триггер ON LOGIN.
https://www.youtube.com/watch?v=peLXtGorl8A
YouTube
Обзор PostgreSQL 17 — Павел Лузанов, PGConf.Russia 2024
На конференции по PostgreSQL в Москве руководитель отдела образовательных программ Postgres Professional представил детальный обзор фич новой 17-версии открытой СУБД PostgreSQL. На PGConf.Russia 2024 Павел рассказал про часть фич системы, о которых было известно…
#microsoft #brazil
Интересно, что история с судьёй Мораесом и Маском ничему Сатью не научила.
"Компания Microsoft будет способствовать развитию облачной и ИИ-инфраструктуры Бразилии, расширяя свои собственные дата-центры в стране. По данным Datacenter Dynamics, компания объявила о намерении потратить $2,7 млрд на соответствующие проекты в течение трёх лет. В частности, в штате Сан-Паулу предполагается расширить облачную инфраструктуру в нескольких кампусах ЦОД. В Бразилии у компании есть облачный регион Brazil South в штате Сан-Паулу (введён в эксплуатацию в 2014 году), а в 2020 году IT-гигант запустил Brazil Southeast в Рио-де-Жанейро.
Глава Microsoft Сатья Наделла (Satia Nadella) уже заявил о поддержке ИИ-трансформации страны и сообщил, что новые инвестиции компании в облака и ИИ обеспечат доступ к современным технологиям, а программы обучения будут способствовать получению новых навыков, которые станут драйвером процветания людей и экономики Бразилии в эру ИИ."
https://servernews.ru/1111708
Интересно, что история с судьёй Мораесом и Маском ничему Сатью не научила.
"Компания Microsoft будет способствовать развитию облачной и ИИ-инфраструктуры Бразилии, расширяя свои собственные дата-центры в стране. По данным Datacenter Dynamics, компания объявила о намерении потратить $2,7 млрд на соответствующие проекты в течение трёх лет. В частности, в штате Сан-Паулу предполагается расширить облачную инфраструктуру в нескольких кампусах ЦОД. В Бразилии у компании есть облачный регион Brazil South в штате Сан-Паулу (введён в эксплуатацию в 2014 году), а в 2020 году IT-гигант запустил Brazil Southeast в Рио-де-Жанейро.
Глава Microsoft Сатья Наделла (Satia Nadella) уже заявил о поддержке ИИ-трансформации страны и сообщил, что новые инвестиции компании в облака и ИИ обеспечат доступ к современным технологиям, а программы обучения будут способствовать получению новых навыков, которые станут драйвером процветания людей и экономики Бразилии в эру ИИ."
https://servernews.ru/1111708
ServerNews - все из мира больших мощностей
Microsoft потратит $2,7 млрд на облачную и ИИ-инфраструктуру в Бразилии
Компания Microsoft будет способствовать развитию облачной и ИИ-инфраструктуры Бразилии, расширяя свои собственные дата-центры в стране. По данным Datacenter Dynamics, компания объявила о намерении потратить $2,7 млрд на соответствующие проекты в течение трёх…
#twitter #musk #management
Реально Маск просто угандошил Твиттер. Даже внешне посмотреть, из голубенькой, яркой, весёлой соцсети он сделал что-то чёрное, угрюмое. Лучше бы он свою "соцсеть мечты" X с нуля делал (
https://3dnews.ru/1111795/po-otsenkam-fidelity-seychas-aktivi-x-stoyat-v-chetire-raza-menshe-chem-do-ih-pokupki-ilonom-maskom
Реально Маск просто угандошил Твиттер. Даже внешне посмотреть, из голубенькой, яркой, весёлой соцсети он сделал что-то чёрное, угрюмое. Лучше бы он свою "соцсеть мечты" X с нуля делал (
https://3dnews.ru/1111795/po-otsenkam-fidelity-seychas-aktivi-x-stoyat-v-chetire-raza-menshe-chem-do-ih-pokupki-ilonom-maskom
3DNews - Daily Digital Digest
Эффективный менеджмент: под управлением Илона Маска Twitter подешевел более чем вчетверо
В конце 2022 года Илон Маск (Elon Musk) был вынужден купить Twitter за $44 млрд, поскольку все его попытки сбить цену с апреля того же года потерпели неудачу, а в случае отказа от условий сделки по его инициативе миллиардеру грозил серьёзный штраф.
Forwarded from Maxim.ML - канал
Как новички в Data Science решают сложные задачи: результаты моих студентов в ML соревновании 📊
Какие подходы пробуют применять стажеры и джуны в Data Science соревнованиях с табличными данными? Я принёс инфографику моих студентов, которая иллюстрирует их работы в финальном соревновании курса 📈
🔍 Предыстория
В прошлом учебном году я вел блок занятий по Machine Learning на одном из курсов. Чтобы отработать навыки студентов, я запустил inclass соревнование. Студенты решали задачу бинарной классификации — для многих это был первый подобный опыт.
Почти все подходы студентов были связаны с алгоритмами градиентного бустинга. В топ 3 решений попали ансамбли, automl и catboost 🏆
Если вам понравилась визуализация, python код для ее воспроизведения доступен на моем GitHub. Сделать такую же инфографику проще, чем вы думаете! ✨
Какие подходы пробуют применять стажеры и джуны в Data Science соревнованиях с табличными данными? Я принёс инфографику моих студентов, которая иллюстрирует их работы в финальном соревновании курса 📈
🔍 Предыстория
В прошлом учебном году я вел блок занятий по Machine Learning на одном из курсов. Чтобы отработать навыки студентов, я запустил inclass соревнование. Студенты решали задачу бинарной классификации — для многих это был первый подобный опыт.
Почти все подходы студентов были связаны с алгоритмами градиентного бустинга. В топ 3 решений попали ансамбли, automl и catboost 🏆
Если вам понравилась визуализация, python код для ее воспроизведения доступен на моем GitHub. Сделать такую же инфографику проще, чем вы думаете! ✨
#gpt #llms #copilot
Любопытно.
"Авторы исследования Uplevel, охватившего деятельность примерно 800 разработчиков программного обеспечения, утверждают, что применение инструментов с искусственным интеллектом для написания программного кода пока не выявило ни повышения производительности труда профильных специалистов, ни снижения их эмоционального выгорания.
Первоначально ожидалось, что применение GitHub Copilot снизит количество ошибок в программном коде и увеличит производительность труда, но по факту в первом случае наблюдался рост количества ошибок на 41 %, а ещё попытки применять ИИ-ассистента не привели к существенному улучшению ситуации с эмоциональным выгоранием специалистов.
По данным GitHub, применение помощника Copilot способно на 55 % повысить скорость написания кода разработчиками.
Некоторые эксперты признались, что написанные с помощью ИИ участки программного кода трудно поддаются анализу и выявлению ошибок, поэтому порой проще переписать нужный фрагмент заново. На ранних этапах развития ChatGPT, например, отмечалось, что этот чат-бот более половины всех запросов, связанных с оптимизацией работы создателей программного кода, просто неверно истолковывает. Представители Gehtsoft, например, убеждены, что разработка программного обеспечения на 90 % зависит от функций человеческого мозга, в части понимания требований, разработки системы и определения ограничений. Превращение сформированных взаимных зависимостей в программный код является самой простой частью работы программиста.
С другой стороны, находятся и те, кто восхваляет возможности ИИ в разработке программного кода. Представители провайдера облачных услуг Innovative Solutions, например, отмечают почти троекратное повышение производительности после перехода на использование ИИ-ассистентов типа Claude Dev и Copilot."
https://3dnews.ru/1111873/ispolzovanie-iiassistentov-pri-razrabotke-po-poka-ne-uvelichivaet-proizvoditelnost-truda-kak-pokazalo-issledovanie
Любопытно.
"Авторы исследования Uplevel, охватившего деятельность примерно 800 разработчиков программного обеспечения, утверждают, что применение инструментов с искусственным интеллектом для написания программного кода пока не выявило ни повышения производительности труда профильных специалистов, ни снижения их эмоционального выгорания.
Первоначально ожидалось, что применение GitHub Copilot снизит количество ошибок в программном коде и увеличит производительность труда, но по факту в первом случае наблюдался рост количества ошибок на 41 %, а ещё попытки применять ИИ-ассистента не привели к существенному улучшению ситуации с эмоциональным выгоранием специалистов.
По данным GitHub, применение помощника Copilot способно на 55 % повысить скорость написания кода разработчиками.
Некоторые эксперты признались, что написанные с помощью ИИ участки программного кода трудно поддаются анализу и выявлению ошибок, поэтому порой проще переписать нужный фрагмент заново. На ранних этапах развития ChatGPT, например, отмечалось, что этот чат-бот более половины всех запросов, связанных с оптимизацией работы создателей программного кода, просто неверно истолковывает. Представители Gehtsoft, например, убеждены, что разработка программного обеспечения на 90 % зависит от функций человеческого мозга, в части понимания требований, разработки системы и определения ограничений. Превращение сформированных взаимных зависимостей в программный код является самой простой частью работы программиста.
С другой стороны, находятся и те, кто восхваляет возможности ИИ в разработке программного кода. Представители провайдера облачных услуг Innovative Solutions, например, отмечают почти троекратное повышение производительности после перехода на использование ИИ-ассистентов типа Claude Dev и Copilot."
https://3dnews.ru/1111873/ispolzovanie-iiassistentov-pri-razrabotke-po-poka-ne-uvelichivaet-proizvoditelnost-truda-kak-pokazalo-issledovanie
3DNews - Daily Digital Digest
Выяснилось, что ИИ-ассистенты не повышают продуктивность программистов
Авторы исследования Uplevel, охватившего деятельность примерно 800 разработчиков программного обеспечения, утверждают, что применение инструментов с искусственным интеллектом для написания программного кода пока не выявило ни повышения производительности…
#optimization #guroby #gurobipy_pandas #guroby_ml
Что примечательно, в качестве ограничений оптимизационной модели можно использовать ... регрессоры!
https://www.youtube.com/watch?v=-xXUVM2UJlg
Что примечательно, в качестве ограничений оптимизационной модели можно использовать ... регрессоры!
https://www.youtube.com/watch?v=-xXUVM2UJlg
YouTube
Prenoscriptive Analytics in the Python Ecosystem with Gurobi [PyCon DE & PyData Berlin 2024]
🔊 Recorded at PyCon DE & PyData Berlin 2024, 24.04.2024
https://2024.pycon.de/program/KCYDM9/
🎓 Watch as Dr. Robert Luce introduces you to the world of prenoscriptive analytics with Gurobi in Python, enhancing your optimization workflows with mathematical…
https://2024.pycon.de/program/KCYDM9/
🎓 Watch as Dr. Robert Luce introduces you to the world of prenoscriptive analytics with Gurobi in Python, enhancing your optimization workflows with mathematical…
👍2