ML-легушька – Telegram
ML-легушька
3.54K subscribers
1.42K photos
165 videos
6 files
95 links
Гений, стартапер, плейбой, филантроп
Для связи: @MLfroge
Download Telegram
HFT на биржах и MFT на мемкоинах это одно и то же? Или причем здесь предельные теоремы.
Давайте проанализируем некоторые структурные особенности рынка мемкоинов на то время, когда я ими занимался.
В те времена, когда я занимался алгоритмической торговлей мемами, одной из основных проблем были rug pull-ы - когда создатель монеты резко выводит все деньги из пула, соответственно он остается с деньгами, а держатели мема - с фигой.
При этом мемов а) выходило очень много и б) если ты относительно рано зашел в мемкоин и вышел до rug pull, то ты на нем заработал.
Другой крупной проблемой был market-impact - из-за небольших размеров пулов сделки как сами по себе сильно могли толкнуть цену (что видно на примерах, рассмотренных в посте про AMM), так и могли триггерить скальперов - людей/ботов, которые зарабатывают на движении цены от твоей сделки, тем самым делая цену после своих действий скорее всего менее выгодной для тебя/риски плохо прогнозируемыми.
Торговать на небольшом количестве самых ликвидных монет - можно, но там большая конкуренция. Изучив все эти особенности, я решил сконцентрироваться на небольших сделках по огромному количеству монет.
Это и делает торговлю мемкоинами в такой парадигме похожей на HFT - ты совершаешь много сделок не за короткий период времени на нескольких активах, но из-за большого количества активов суммарное кол-во сделок выходит огромным, соответственно средняя доходность на сделку начинает крайне быстро концентрироваться вокруг своего математического ожидания.
Это позволяет делать безрисковые (с точки зрения вероятности просадки капитала) вероятностные стратегии, при этом делать их сильно проще по своей природе в сравнении с HFT-стратегиями, так как моделирование строится не на одном активе и его конкретных свойствах, а на всем рынке сразу, используя его макроструктурные особенности.
Соответственно, если вы замоделировали время жизни монеты, то вам не обязательно делать предикт на каждой монете - достаточно просэмплировать время жизни из модельного распределения, и выйти раньше него. Тогда, если вы заходите в каждую монету на очень маленькую сумму, доходность на монету быстро сойдется к мат.ожиданию. Более того, за счет маленьких сумм вы ограничиваете снизу свою максимальную потерю на монету, однако так как распределение доходности имеет достаточно тяжелый хвост, при знании времени жизни монеты потери перекрываются 'выбросами' доходности, и вы начнете зарабатывать на такой простой стратегии.
Безусловно, это очень простой бейзлайн. Вы можете по-умному (используя уже микроструктурные свойства) торговать в рамках этого горизонта, чтобы повысить мат.ожидание доходности на монету. Вы можете фильтровать монеты на основе сторонней информации, но тут уже будет компромисс, так как вам придется накопить по монете некоторую информацию и обработать ее, а время захода в монету может быть критично.
Прошу знающих криптанов в комментарии, если есть что добавить/поправить. Не является индивидуальной инвестиционной рекомендацией. Все описанные выше неэффективности скорее всего уже частично/полностью устранены, но общий подход к анализу концентраций и торговле по макроструктурным рыночным свойствам остался.
Навалите актива, если было интересно!
143🔥17💋5❤‍🔥4👏3
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня объявляю день под лозунгом «Не зли жабу»
Не зли жабу.
14🔥6👍3❤‍🔥1🤡1
Если кто увидит меня, то подходите :)
🔥367🤮2🤡1
ML-легушька
Если кто увидит меня, то подходите :)
Собственно, выступал вчера на мероприятии от ЦПМ для учителей, где собираются ученые и рассказывают про последние достижения в науке.
Я рассказывал про распределенное обучение и достижения в нем, более технически можно сказать, но вроде не сильно кокнул.
Мне понравились доклады и других выступающих. В частности, очень интересно про химию - там рассказывали про клик-реакции (способ просто, эффективно и быстро сшивать между собой биополимеры и в целом разные соединения) и фотокатализ - он упоминался еще в экологии, так как позволяет сделать химтех более экологичным.
Вообще мероприятие было крупное, во дворце пионеров прикольно, жаль что он как и все Воробьевы горы от меня далековато.
Новые красивые носки для привлечения внимания
🔥2510🥰7🤡1
Когда уже на маркетплейсах можно будет поставить фильтр «без генеративного ИИ»
😁4710🤔4❤‍🔥2🥰1
🔥3312🥰6😁2🤡1
для простоты рассмотрим баланс в кассе нашей организации. вот приход, вот расход. не трудно заметить, что никакой вашей зарплаты здесь нет — присутствует исключительно синтаксический сахар.
1🤡29😈76👍1😁1
Спят усталые игрушки змейки спят
Одеяла и подушки ждут ребят
❤‍🔥286🤡3🤮2
Какая же она крутая…
🥰207💯6🔥2🤡2
Очень странная статья от Google.
Основная идея: давайте случайно не применять обновления к параметрам, а если и применять - уменьшать их на величину, пропорциональную отклонению угла стохастического градиента от накопленного за последние итерации.
Они также привели некие доказательства сходимости своего метода.
В частности, очень интересен assumption 3 (см на картинке) - он говорит, что стохастический градиент по норме не слишком сильно отклоняется от истинного.
В чем проблема данной статьи, на мой взгляд?
Мне кажется, что авторы зашли не с того угла.
Во-первых, в их случае (а явно этого не прописано) константа ограничивающая разброс из предположения явно никак не оценивается, по крайней мере я не нашел в статье этого.
Во-вторых, и что более проблемно, существует E-SG (см.картинку 3). E-SG является более сильным условием, чем они предлагают в своем предположении. Более того, они неявно приближают обусловленность своей задачи к E-SG сценарию, так как несонаправленные градиенты начинают зануляться с большей вероятностью - очевидно, что разброс становится меньше.
В-третьих, уже есть методы для достижения E-SG, в частности адаптивный батчинг, в частности для случаев когда мы близки к решению - AdLoCo, который я предложил в своей последней статье.
Безусловно, научный вклад у статьи есть - с вычислительной точки зрения (если не смотреть другие аспекты по типу распределенного обучения, где AdLoCo побьет их) это более простой метод, и он очень хорошо рассмотрен с точки зрения взаимодействия со спецификой трансформеров.
Не знаю, может написать им, спросить?
Если вы со мной не согласны, то пишите в комментариях - подискутируем. Может быть я тупой и что-то не понял :)
Ссылка на статью
120👍4🤔1🤡1