Aspiring Data Science – Telegram
Aspiring Data Science
385 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
Forwarded from kyrillic
Про выбор места жительства, самые популярные кейсы. В прошлый раз был пост с примерами мест пмж по разным критериям. Где главный конечно - уровень удаленного дохода. В том же посте описал, почему у меня немалая насмотренность нынешних релокантов/номадов.

И кстати недавно мы выяснили (опрос), что вы очень даже умеете удаленно зарабатывать 🙂 Респект!

Давайте рассмотрим самые популярные кейсы!

Дисклеймер все тот же - это всего лишь субъективное мнение из интернета.

1️⃣ Одинокий айтишник (М 30+) В постах про счастье писал, что глубокие эмоциональные связи - ключевой фактор счастья и удовлетворенности от жизни. Если переиначить, то одиночество вряд ли можно считать нормой с научной точки зрения. Формально даже жить с мамой - более норма, чем одному.

При этом ru-айтишнику в эмиграции статистически намного сложнее найти пару в силу довольно объективных причин (пост) Субъективно кажется, что это справедливо только для натуралов.

Поэтому разумный выбор, до смены статуса (одинокого или натурала 🙂) - это либо родина, либо места с высокой долей одиноких ru-релокантов-девушек. И пониженной конкуренцией 🙂 А это по сути только 🇬🇪 Тбилиси. Либо 🇮🇱 Тель-Авив, если позволяет происхождение.

2️⃣ Одинокая айтишница 25+ Тут конечно путь в крупные города, в зависимости от предпочтений. Считаю лучшими 🇬🇧 Лондон и 🇫🇷 Париж, просто потому что там “ru” всегда было и будет плюсом из-за культурного влияния. Почти конкурентное преимущество! Но в целом подойдут любые столицы первого мира.

3️⃣ Релокантам пост-студенческого возраста один путь - в магистратуру (пост). Все, кто пошел другим путем, будет скорее всего отставать в эмиграции от тех, кто выбрал магистратуру. И тут место учебы имеет значение только в контексте локации. Поэтому лучше ехать в 🇺🇸 США, 🇬🇧 UK и т.д. Вот релевантный пост про талантов 22-25 лет.

4️⃣ Пара без детей, 28+ Наверное самая многочисленная категория - уже есть уверенность, моральная и материальная, есть гибкость в жизненных решениях. И тут выбор огромен, все зависит от вкусов и возможностей. Проще сказать, куда точно не надо: постсоветские страны и возможно Восточная Европа, потому что это с очень большой натяжкой можно назвать эмиграцией.

5️⃣ Пара с детьми/ребенком дошкольного возраста. Климат решает! Даже в опросе про стоимость жизни (пост), большинство с детьми выбирают теплые прибрежные локации. Оно и понятно!

Если разделять города по уровню доходов пары, то с $2-3k лучшие места - 🇪🇸 Аликанте и окрестности, небольшие города 🇮🇹 Лигурии, даже 🇹🇷 Турция ок. С $3-5k - 🇪🇸 Барселона, 🇫🇷 Юг Франции.

6️⃣ Семья с детьми школьного возраста. Считаю что только представителям этой категории разумно рассуждать о привычных эмигрантских критериях, столь популярных в чатах, - медицина, налоги, образование, социализация, время до паспорта и др. Потому что такие семьи - самый репрезентативный элемент любого развитого общества. А значит влияние перечисленных факторов наиболее высоко на отдельно взятую семью.

Потому что в кейсах "я одинокий ML инженер в Лондоне с з/п $200k" зачастую локация в Тиндере - "Невский Проспект + 10км". И у человека есть что-то поважнее, чем сравнение NHS с медициной других стран.

7️⃣ Фаундеры стартапов, которые уже что-то умеют. Любое место помимо 🇺🇸 Долины - это компромисс. Можно много говорить о крутой экосистеме стартапов например в Барселоне, но это просто село, по сравнению с Долиной. Хотя Долина - это село по множеству других критериев 🙂

8️⃣ Топ 3% айти-таланты. Если кто-то из вас себя таковым считает, то путь тоже один. Точнее два - побережья 🇺🇸 США (пост).

9️⃣ Мое общее наблюдение на тему критериев выбора простое: cчитаю самыми важными те, которые влияют на жизненные шансы, а если говорить прямо - на победу в конкуренции с другими людьми.

При этом такие факторы не особо обсуждают, потому что они менее наглядные и менее подсчитываемые, чем налоги, климат, рейтинг университетов/краж/самоубийств и др. Хотя эти неощутимые критерии - достаточно объективны и обусловлены человеческой природой, устройством обществ и тервером 🙂

@kyrillic
Forwarded from ML for Value / Ваня Максимов (Ivan Maksimov)
Выводы про А/В-тестирование от Optimizely

Довольно известная плафторма АВ Optimizely выпустила репорт с анализом 127к экспов за последние 5 лет. И вот что они обнаружили

1. 88% экспериментов проваливаются
Да-да лишь 1 из 10 ваших самых гениальных и продуманных идей в итоге растит метрики)
Эта цифра довольно хорошо согласуется и с репортами от крупнейших компаний (гугл, ютуб, амазон, airbnb)

2. Половина компаний проводит менее 34 экспериментов в год
Это очень МАЛО ~3 эксперимента в месяц. На моей практике в Delivery Club мы видели хороший суммарный эффект от АВ плафтормы на 10+ экспериментах в месяц. Ну и в конце концов разогнались до ~40-50 экспериментов в месяц (по данным optimizely это как у топ-3% компаний)

3. ~30% экспериментов используют метрику "Выручка". Но красится она в <1% случаев
В общем, думайте тщательно над выбором метрик - не берите просто самую верхнеуровневую! Как правило, почти всегда можно выбрать более узкую и специфичную для вашей фичи метрику (конверсию из действия Х в У, например). Для этого вам помогут деревья метрик и декомпозиция метрик

4. 10% экспов используют 4+ тестовые группы.. и несут х2 импакта - Тут есть вопросики 🤡
Среди 4+ вариантов без хороших поправок на множественное тестирование легко найти победителя, даже если его нет. Тогда конечно такие экспы будут *случайно* нести больше импакта. В общем, я бы покопался под капотом Optimizely - проверил, как они делают (и делают ли) поправку на множественное тестирование

Мое мнение - в 95% кейсов можно использовать 2 группы, в оставшихся 5% - 3 группы

5. Топ 5% АВ-тестов (всего 2 экспа из 34) приносят 50% импакта
Кажется, эпоха low-hanging fruits прошла. Нужно не бояться делать большие изменения и смотреть, что получится
Плюс, делать больше качественных экспериментов конечно!) Optimizely посчитали, что оптимально 1 разраб = не более 1 экспа в месяц


А какие выводы про АВ есть из вашего опыта?)
#ads

Хорошо.
2
#law #tesla #musk

Правильно, ибо нефиг себе назначать заоблачные премии.

"Соответствующий компенсационный пакет в форме акций компании был назначен ему ещё в 2018 году, и стал рекордным по своей величине среди всех публичных компаний. Вердикт об аннулировании данной договорённости между советом директоров Tesla и Илоном Маском на этой неделе огласил суд штата Делавэр, рассмотрев иск одного из акционеров Tesla Ричарда Торнетты (Richard Tornetta), который ранее выразил несогласие с размерами компенсации за работу Илона Маска в данной должности. Сторонам спора ещё предстоит определить, на каких условиях Маску предстоит вернуть полученные ранее акции и средства в качестве оплаты своего труда на посту генерального директора Tesla. Ответчик сохраняет за собой возможность оспорить данное решение в суде высшей инстанции.

Как определил суд, именно компенсационный пакет в размере $56 млрд помог Илону Маску стать богатейшим человеком в мире. По существовавшему плану, с 2018 года Маск мог получать акции Tesla порциями по 12 пакетов, если финансовые показатели компании достигали определённых целевых значений. Реализация акций на рынке по актуальным ценам позволяла Маску зарабатывать крупные суммы денег. По мнению суда, главе Tesla удалось подогнать фактические показатели под требуемую величину, а потому его результирующее обогащение не является справедливым. Совет директоров, по мнению истца, пошёл на поводу у Маска, назначив ему столь щедрый компенсационный пакет. В составе совета директоров находились люди, имевшие прочные связи с самим Маском, а потому принятое решение о компенсации было в принято в интересах миллиардера на необъективных условиях. По мнению представителей американских органов правосудия, ни совет директоров Tesla, ни комитет по назначению компенсационных выплат не действовал на том этапе в интересах компании и её акционеров. Нет даже внятных доказательств факта самого ведения переговоров по этому вопросу.

Илон Маск на момент подготовки материала к публикации ограничился лишь призывом со страниц своей социальной сети X «никогда не регистрировать компании в юрисдикции штата Делавэр». Он также запустил социологический опрос с предложением перерегистрировать Tesla в штате Техас, где находится её штаб-квартира после переезда из Калифорнии. К слову, тот переезд был инициирован Илоном Маском не только из-за конфликта с властями Калифорнии на почве локдауна местного предприятия компании в первые недели пандемии 2020 года, но и ради экономии на налогах."

https://3dnews.ru/1099580/sud-annuliroval-kompensatsionniy-paket-ilona-maska-na-summu-56-mlrd-za-rukovodstvo-kompaniey-tesla
#marketingbullshit

Немного маркетингового дерьма. В этой новости прекрасно ВСЁ.

От индуса-управленца (действительно, кто же ещё? Mastercard это же индийская компания с штабом в Дели, правда?) до патента на рекуррентную нейросеть (керас и пайторч, ау).

Но самый писк в способности новой модели выявлять мошеннические модели и тенденции для прогнозирования будущих типов мошенничества, которые пока не встречались в платёжной экосистеме. Как?! У вас же обучение по размеченным данным. Что-то я не слышал, чтоб сетки применяли для outlier detection. И что такое "уровень обнаружения" мошенничества в 20%? Это точность или полнота?
А как связаны генеративный ИИ и анализ транзакций? Может, в Мастеркард и есть интересные решения, только этот президент о них знает примерно ничего, судя по его комментариям.

Рецепт как стать президентом по кибербезопасности в крупной компании:
1) быть индусом
2) выучить слова "экосистема" и "ИИ"
3) ни хера не разбираться в ML

"Аджай Бхалла (Ajay Bhalla), президент бизнес-подразделения Mastercard по кибербезопасности и разведке, рассказал CNBC, что новое решение представляет собой запатентованную рекуррентную нейронную сеть, созданную с нуля командами Mastercard по кибербезопасности и борьбе с мошенничеством.

«Мы используем модели-трансформеры, которые, по сути, помогают получить мощь генеративного ИИ, — сообщил Бхалла. — Всё это было создано собственными силами, у нас есть все виды данных из экосистемы. Благодаря характеру нашей деятельности, мы видим все данные о транзакциях, которые поступают к нам из экосистемы».

Он отметил, что в некоторых случаях Mastercard полагается на открытый исходный код «всякий раз, когда это необходимо», но «большая часть» технологий создаётся собственными силами компании.

Собственный алгоритм Mastercard обучен на данных примерно 125 млрд транзакций, которые ежегодно совершаются в платёжной сети компании. Вместо текстового ввода он использует историю посещений торговых точек держателем карты в качестве подсказки для определения того, является ли бизнес, участвующий в транзакции, местом, куда с большой вероятностью направится покупатель.

Затем алгоритм генерирует пути через сеть Mastercard, чтобы оценить варианты. Более высокий балл в оценке будет соответствовать модели обычного поведения, ожидаемого от держателя карты, а более низкий балл — за пределами этой модели. Весь этот процесс занимает всего 50 миллисекунд.

По словам Бхаллы, новая ИИ-технология позволит финансовым учреждениям повысить уровень обнаружения мошенничества в среднем на 20 %. Однако в некоторых случаях эта модель привела к повышению уровня выявления мошенничества на целых 300 %, добавил он. Mastercard ожидает, что её алгоритм также позволит банкам сэкономить до 20 % на затратах на оценку незаконных транзакций.

Однако истинный потенциал новой технологии Mastercard, как полагает Бхалла, заключается в её способности выявлять мошеннические модели и тенденции для прогнозирования будущих типов мошенничества, которые пока не встречались в платёжной экосистеме."

https://3dnews.ru/1099665/novaya-iitehnologiya-mastercard-pozvolyaet-povisit-na-300-uroven-viyavleniya-moshennichestva-v-platyognoy-seti
#hardware #vr #apple

Понравились несколько крутых фишек Vision Pro: бесшовная интеграция с макбуком, создание виртуальных 4k монитров, автодетекция собеседника и его появление из "тумана" VR.
Фишка с трансляцией глаз прикольная, но, если честно, толку в ней не вижу, а стоила она наверняка до фига. Переплачивать баксов 500 чтобы при ношении шлема VR кто-то видел твои глаза.. Хм.

https://www.youtube.com/watch?v=dtp6b76pMak
#physics #china #darkmatter

"Детектор CDEX представляет собой твердотельный полупроводниковый датчик в виде 10 кг чистого германия в кристаллическом состоянии. Считается, что 10 кг чувствительной среды способно уловить одно событие в год. Датчик CDEX призван улавливать гипотетические WIMP-частицы (Weakly Interacting Massive Particles) в нижнем диапазоне масс.

Новый полупроводниковый датчик из германия в только что запущенной лаборатории CJPL-II (China Jinping Underground Laboratory-II) имеет массу около 100 кг, что на порядок повысило частоту возможной регистрации кандидатов в частицы тёмной материи. При этом созданы условия для дальнейшего повышения массы полупроводникового датчика примерно до одной тонны. Когда он будет создан, Китай окажется в этом впереди планеты всей.

Второй эксперимент опирается на датчик из ксенона, находящегося в двух фазовых состояниях — жидком и газообразном. Эксперимент PandaX стартовал со 120 кг. В новых залах лаборатории CJPL-II масса вещества в датчике PandaX-4T повышена до 4 т и в будущем вырастет до 40 или даже до 50 т. Сегодня самый чувствительный датчик такого плана у итальянцев в проекте LNGS XENONnT — он включает 8,6 т. В американском проекте LUX-ZEPLIN масса ксенона достигает 7 т. Для подобных экспериментов крайне важна повторяемость, чтобы отсеять случайные срабатывания детекторов."

https://3dnews.ru/1099759/samaya-glubokaya-podzemnaya-laboratoriya-dlya-poiska-tyomnoy-materii-kratno-povisila-chuvstvitelnost-detektorov-ona-zarabotala-v-kitae
👍1
#cv

"Ещё в 18 веке при раскопках римской виллы в Геркулануме было обнаружено более 1000 целых или частичных свитков в особняке, который, как считалось, принадлежал тестю Юлия Цезаря. Извержение Везувия в 79 году н.э. и последующее погребение свитков землёй превратили их в обугленные останки, развернуть которые можно было только один раз — они при этом рассыпались. Тексты также были нечитаемые, поскольку чернила выгорели вместе с основой. Прочесть всё это и многое другое — это достойно усилий.

Попытки создать технологию для прочтения обугленных свитков из Геркуланума много лет возглавлял специалист по информатике из Университета Кентукки Брент Силз (Brent Seales). Он и его команда с помощью рентгеновской томографии на ускорительном комплексе Diamond Light Source — источнике синхротронного излучения третьего поколения в графстве Оксфордшир — научились распознавать следы чернил в волокнах папируса, не трогая и не разрушая свиток"

https://youtu.be/Z_L1oN8y7Bs
#physics

"В декабре 2022 года учёные из Ливерморской национальной лаборатории им. Э. Лоуренса (LLNL) на установке NIF впервые добились термоядерного воспламенения — самоподдерживающейся реакции термоядерного синтеза, которая дала больше энергии, чем было потрачено на её запуск. Учёное сообщество с предельной осторожностью отнеслось к работе. Экспертная оценка длилась около года, и только недавно поддержала выводы авторов: термоядерный синтез с помощью лазеров работает.

Эксперты оценили пять работ учёных LLNL, представленных для публикации в одном из престижных для физиков журнале Physical Review Letters. Все выкладки авторов работ были перепроверены независимыми специалистами. Цифры сошлись. В том теперь уже историческом эксперименте в начале декабря 2022 года на капсулу с топливом было подано 2,05 МДж энергии, а высвободилось 3,15 МДж, что примерно в 1,5 раза больше. Учёные около 50 лет шли к этой цели, что можно назвать переломным моментом в освоении термоядерной энергии синтеза.

Позже, в середине 2023 года, после улучшения капсулы с топливом, изменения объёма самого топлива, условий зажигания и оптимизации лазеров, был получен ещё лучший выход: 3,88 МДж при той же энергии входа. Это стало наивысшим на сегодняшний день достижением в сфере инерциального термоядерного синтеза, когда почти две сотни мощных лазеров (192 шт.) были сфокусированы на специальной капсуле с 220 мкг смеси дейтерия и трития. Вокруг топлива было создано давление до 600 млрд атмосфер и температура 151 млн °C. И это привело к запуску самоподдерживающейся реакции синтеза, когда атомы водорода сливались и изливали в пространство энергию вместе с атомами новорожденного гелия и нейтронами."

https://3dnews.ru/1099893/uchyonie-dali-ekspertnuyu-otsenku-amerikanskomu-eksperimentu-po-termoyadernomu-sintezu-s-pomoshchyu-lazerov
1🔥1
#vr #hardware #apple

Кратко: FOV подкачал, на уровне Quest 2, в остальном техническое качество и удобство пользования выше всяких похвал. А этот чел перепробовал, наверное, все VR шлемы, что выходили в продажу )

https://www.youtube.com/watch?v=XSNLZTpvUiY
#astronomy

"Подробные данные по системе Сатурна собрала автоматическая станция «Кассини» в период с 2004 по 2017 годы. Группа учёных из Парижской обсерватории воспользовалась этой информацией, чтобы заново оценить орбитальные параметры Мимаса, который напоминает «Звезду смерти» благодаря огромному ударному кратеру на своей поверхности. Они хотели исключить один из сценариев, из-за которого орбита этой луны выглядит необычно для монолитного скалистого небесного тела.

Согласно одному из вариантов, Мимас может содержать сильно вытянутое ядро, которое заставляет его совершать колебательные движения, проходя по орбите. Во втором случае, под его скалистой поверхностью может скрываться глобальный водный мир, потоки которого также вызывают изменения в орбитальном движении спутника.

Моделирование показало, что существование вытянутого ядра представляется наименее вероятным сценарием. С учётом динамики орбитального движения Мимаса под воздействием гравитации Сатурна и других его крупнейших лун, орбитальные параметры подозрительной луны, скорее всего, объясняются жидким подповерхностным океаном.

Расчёты показывают, что жидкий океан на Мимасе сравнительно молодой — ему всего 2–3 млн лет. Вероятнее всего, незадолго до его появления орбита этой луны изменилась со стабильной круговой на вытянутую, что в системе с множеством лун считается нормальным явлением. Гравитация Сатурна стала оказывать на недра Мимаса прерывистое воздействие, и это привело к гравитационному разогреву его ядра и внутренней структуры. Вода начала выделяться в жидком виде и постепенно там образовался глобальный подповерхностный океан, который к настоящему моменту подошёл к поверхности Мимаса на 20–30 км.

По внешнему виду этой луны не скажешь, что под её корой плещутся массы воды, намного больше, чем в земных океанах. На Мимасе нет трещин и гейзеров, как на лунах Энцеладе, Европе, Ганимеде и Титане, поэтому он долго хранил свою тайну. Не менее важно, что если там действительно есть глобальный океан, то его молодость — это способ заглянуть в прошлое других лун Сатурна и Юпитера, чтобы понять эволюционное развитие подповерхностных водных миров. На глазах учёных буквально может твориться ранняя геологическая история этих миров, чему учёные несказанно рады."

https://3dnews.ru/1099972/pohogiy-na-zvezdu-smerti-sputnik-saturna-mimas-zapodozren-v-sokritii-podpoverhnostnogo-globalnogo-okeana