Данные по-большому – Telegram
Данные по-большому
132 subscribers
330 photos
59 videos
205 links
И все остальное по-маленькому.

Успешный успех в сфере DE, DS, AI, ML и прочего бигтеха, а также лайфстайл, мемы и новости айтишки и не только
Download Telegram
Норму переработок в Трудовом кодексе увеличат в два раза.
Поправки в ТК уже готовы.

#режим_работы #новости
Научпоперской нейробиологии вам в ленту.

Или российский научпоп - это когда делаешь мукбанги как Панчин, который на камеру громко жует протеиновые батончики и asmrно шуршит обертками, или как Алипов, который рекламит ставочки и стримит с бомжом из Орегона (Убермаргиналом).

#научпоп
Когда ты стесняешься своих 200к рублей (около 2к баксов, 24к баксов в год) в месяц, помни, что дата-инжиры в Databricks и прочем FAANG лутают по 300-600к баксов в год.
А если пересчитать в контексте цен на недвижимость и автомобили, то картина и вовсе специфическая...

#зарплаты
Золотые правила на собеседованиях

1. Не врать если совсем с технологией данного типа не работал. Не освоишь ты ML за пару недель с нуля - это не джуновские знания языка программирования вайбкодингом закрывать, с матаном и линалом и всякими computer vision и NLP так не получится.
2. Если ты, условно, не работал с Databricks, но шаришь за Spark+Iceberg, то говорить прямо об этом. То же самое и с другими технологиями: если не работал - ищи аналог.
3. Торговаться при наличии двух и более офферов.
4. Писать сопроводительные письма, если тебя сократили или уволили. У тебя внезапно стало много времени, а права на ошибку уже нет.
5. На собес приходить чистым, опрятным, с подготовленным питчем и настроем словно это твой последний шанс, который тебе надо вырвать из лап судьбы. Бороться до конца, идти с боевым настроем.
6. Ставить компании с меньшим для тебя приоритетом первыми, для разогрева, а потом переходить к мастодонтам. Да, интервью должны идти подряд с перерывом в полчаса-час, в которые ты отдыхаешь.
7. Если есть лайвкодинг, то читерить имхо можно, потому что нафиг лайвкодинг в эру генерации кода, да и хорошие лайвкодеры все равно не затаскивают теорию, на которой не считеришь ну никак. Я не видел ни одного знакомого, кто бы не гуглил или не читерил бы на секции лайвкодинга, за исключением вчерашних выпускников техвузов.
8. Где ещё не считеришь так это на секции систем дизайна, которую надо вызубрить десятками примеров реальных сервисов и тем, что у них под капотом.
9. Сильвер буллет - это твои знания 1-2 хайповых технологий. Я вообще периодически изучаю что там в Apache Incubator сейчас.
10. Фаталити - это когда ты на каждую технологию из списка заготовил 50 кейсов типа "а что если у нас в Кафке выросла очередь, почему так может быть?", то есть не просто знаешь что такое продюсер и консюмер, а знаешь боли бизнеса и как их решать с помощью или внутри конкретной технологии.

#собесы #лайфхаки
Как правильно подходить к изучению новой технологии?

На основе личного опыта:

1. Качаешь книжку, читаешь. Если книги нет, то ищешь статьи. Для книг лучше приобрести читалку, ибо с монитора читать удовольствия ноль. А ещё лучше купить печатную версию для мультимодального запоминания.
2. Читаешь документацию
3. Просишь текстовый процессор натренировать тебя по этой технологии. Если же это язык программирования, то берешь примеры с литкода или степика по курсу "Поколение Python" и решаешь их на данном языке.

#лайфхаки
👍2
Сделаю прогнозы на 2026 год и временно заброшу канал, так как надо закрыть техдолг и пановать на зимних каникулах

Итак, что нас ждёт в 2026:
- Агенты станут мощнее, но не факт, что дешевле. Инвесторы уже спрашивают ИИ-гиганты "где деньги, Лебовски?"
- AGI не будет. Максимум SWE-Bench 95%.
- Роботы на оптоволокне с управлением от оператора будут протестированы на поле боя
- Выкатят в продажу новейшие лечащие облысение препараты и первые безопасные сенолитики против старения.
- В России достроят Чебурнет, вероятно закроют доступ ко всем адресам вне зоны .ru
- Границы плавно начнут закрывать. Глобальная движуха не за горами.
- Сдающих IELTS будут сажать, как и владельцев сертификатов IELTS за "участие в деятельности нежелательной организации - Британского совета".
- НДС 22% - это временная мера. Будет 25-30%.
- НДФЛ 20% на доход от 3 млн. руб. в год.
- Рабочая неделя, вероятно, станет 6-дневной.
- Тайм-трекеры будут узаконены.
- Двойную занятость начнут отслеживать. Негоже холопу иметь двух бояр. За работу на иностранного барина могут начать приравнивать к иноагентам из-за "финансирования из-за рубежа".
- Мессенджер Max будет установлен везде: от госуслуг до маркетплейсов. Фото каждые две минуты и полная прослушка с транскрибацией в комплекте.
- Биометрию начнут собирать официально без спроса.
- Наличные будут вытесняться из оборота любыми способами.
- "Духовное возрождение" и наплыв мигрантов в Европе и России продолжатся. С вероятностью 60% в Британии узаконят шариат, а в России исламский банкинг и халяль как ГОСТ. Атеизм признают экстремистской идеологией.
- АвтоВАЗ так и не сможет выпустить автомобиль хотя бы уровня Рено Логан, автопарк России будет ветшать и дальше на фоне роста утильсбора. Средний возраст авто станет 20 лет, запчастей на сервисах не будет, а жестянщики начнут зарабатывать огромные деньги.
- Схема Долиной так и останется, даже если конкретно случай Долиной обжалуют в Верховном суде. В выигрыше девелоперы, впариваюшие на первичке микроквартиры, и банки с огромными процентными ставками.
- Репрессивные антисемейные антимужские законы усилятся: запретят ДНК-тесты детей, запретят отмену отцовства и обяжут всех неженатых мужчин "взять ответственность" за разведенок с детьми не от них (либо платить налог на бездетность в 2 раза выше, чем у бездетных пар), а алименты улетят в космос без контроля на что именно они тратятся.
- Движуха на Украине продолжится. Договорнячка не будет.
- В США с вероятностью 70% сместят Трампа. Он не сумеет узурпировать власть, ибо не служил в спецслужбах.
- Китай выйдет на финишную прямую возврата Тайваня в родную гавань. Сам возврат будет в 2027 году, но, возможно, и раньше из-за дефицита чипов.

#прогнозы
💊7
Вернулся в канал на выходных.

Выскажу одну важную на мой взгляд мысль: ни одна технология не имеет смысла кроме как в свете победы над смертью.

У людей есть то, что в экономике называется going concern assumption - базовое предположение о том, что завтра наступит и что смерть и прекращение существования - это где-то далеко. Люди верят в иллюзии: в то, что будут жить после смерти и что будут жить в своих детях (тоже миф, так как гены перемешиваются до неузнаваемости уже в 4-5 поколениях, а богатые кланы в 90% случаев разоряются через 3-6 поколений). Раньше ещё верили, что построят коммунизм для потомков, а потомки будут благодарны за светлое настоящее, созданное дедушками и бабушками, но эта иллюзия рухнула, в отличие от двух других.

Я искренне убежден, что победа над смертью кроется в полной смене общественной идеологии и вероубеждений. Я противник свободы вероубеждений, поскольку именно эта свобода косвенно оставляет каждого из нас смертными. Лженаука опасна для здоровья и кошелька, а "духовное возрождение" смертельно опасно для всего общества.

AGI - это не цель, это средство достижения более глобальной цели. Бессмертный интеллект - это путь в вечность для интеллектов смертных, то есть для каждого из нас.

#научный_иммортализм
Маккиавелианский лайфхак почему на работу нужно брать скуфов и дедов, а не 18-20-летних зумеров и альф.

Очень просто: допустим, ты пособесил деда, взяли его, ты ему такой говоришь, что это ты за его кандидатуру впрягся. Дед работает, скорее всего не уйдет через год и даже через пять, ибо на рыночке есть эйджизм молодых эйчарок по отношению к дедам. А вот ты, будучи помоложе, уйти можешь. Захочешь, допустим, вернуться, и дед за тебя слово замолвит.

Я лично знал такого деда в одной из прошлых компаний, я его собесил и своему тогдашнему боссу сказал, что его стоит взять. Босс тогда сильно сомневался, но деда взяли, дед работал сначала медленно, а потом нормально (после испыталки я прямо деду сказал, что поспособствовал его трудоустройству). Дед до сих пор работает в той компании, хотя пошло уже четыре года. Дед даже вырос до сеньора или лида, и при желании, если я вдруг захочу вернуться, напишу ему.

Вот так считаю правильно делать. Хотя знаю скуфов, которые берут на работу молодых вчерашних студентов, чтобы типа "вырастить их до сеньоров". Видимо реализуют некую форму "отцовского инстинкта", но думаю смысла в этом нет, если ты заботишься о своих "эгоистичных генах" (по Докинзу).

Из рисков только то, что дед умрет раньше, чем ты захочешь вернуться на прежнюю работу, но это уже так, мелочи.

#лайфхаки
🤔1
Аргумент номер два за всеобщую удаленку в России

Первый аргумент я приводил ранее.

Представим, что вы хотите протолкнуть всеобщую удаленку на государственном уровне. Как это сделать?

В открытом доступе есть e-mail'ы 450 депутатов Госдумы. Им можно написать следующий аргумент (на примере депутата Делимханова):
"Дорогой уважаемый Адам Султанович!
Пишет Вам Инжиров Дато Скуфынович. Прошу рассмотреть на ближайшей сессии Государственной Думы Российской Федерации поправку в Трудовой кодекс о введении всеобщей удаленной занятости на рабочих местах, где она возможна (включая места депутатов Госдумы). В рабочих коллективах офисов, расположенных в крупных городах, у граждан возникают более плотные, темплые и дружественные взаимоотношения, чем готовы воспользоваться враги Родины для вывода более сплочённых масс против установленной Б-гом/Аллахом власти. Напротив, у занятых удаленно сотрудников, расположенных далеко друг от друга на просторах нашей огромной Родины, снижается протестный потенциал, что ведёт к большей стабильности и безопасности нашего государства (включая столицу Чеченской Республики город Грозный). Экстремисты и террористы, если такие есть в рабочих коллективах, не смогут организовать вокруг себя вражеское движение и раскачать лодку. Искренне прошу Вас помочь принять поправку об удаленной занятости в Трудовой кодекс Российской Федерации".

Вот так точно сработает.

#режим_работы
1
Cursor за оверпрайс всё

Claudix - это расширение для Visual Studio Code, которое интегрирует Claude AI прямо в ваш редактор. Оно предлагает интерактивный интерфейс для общения, управление сессиями и анализ кода, что делает процесс программирования более удобным и эффективным.

🚀 Основные темы:
- Интерактивный чат с Claude Code
- Управление сессиями и история разговоров
- Интеллектуальный анализ кода
- Поддержка нескольких моделей Claude
- Реакция в реальном времени

📌 GitHub: https://github.com/Haleclipse/Claudix
Forwarded from Machinelearning
📌Внутри нашего мозга работает аналог GPT с контекстным окном всего в 10 слов.

Представьте себе биологическую нейросеть, физический объем которой, если собрать все её ткани вместе, не превысит размер обычной клубники.

Именно такую компактную, но критически важную структуру описывает нейробиолог Эв Федоренко из MIT, посвятившая 15 лет изучению того, как наш мозг обрабатывает речь.

Её выводы звучат для инженеров и дата-сайентистов очень знакомо: внутри человеческой головы функционирует система, которая ведет себя подозрительно похоже на современные большие языковые модели. Это своего рода «бездумный» языковой процессор, который занимается маппингом слов и смыслов, но сам при этом абсолютно не умеет мыслить.

🟡Утверждение базируется на серьезном массиве данных.

Лаборатория Федоренко провела фМРТ-сканирование 1400 человек, чтобы построить детальную вероятностную карту мозговой активности.

Архитектура этой «языковой сети» оказалась удивительно стабильной и воспроизводимой: у большинства взрослых людей она локализуется в 3 конкретных зонах левой лобной доли и на протяженном участке вдоль средней височной извилины.

Федоренко называет эту структуру функциональным блоком, сравнимым с органом, вроде пищеварительной системы, или зоной распознавания лиц.

Самое интересное начинается, если посмотреть на функционал. Федоренко описывает эту сеть как парсер или набор указателей. Её задача сугубо утилитарна — работать интерфейсом между входными сигналами (звук, текст, жесты) и абстрактными представлениями смысла, хранящимися в совершенно других отделах мозга.

Сама языковая сеть не обладает ни эпизодической памятью, ни социальным интеллектом, ни способностью к рассуждению. Весь процесс раздумий происходит за её пределами.

Это объясняет феномен афазии: при повреждении этого «интерфейса» человек сохраняет сложное когнитивное мышление, но оказывается заперт внутри себя, потеряв доступ к словарю и грамматическим правилам.

🟡Сходство с LLM становится еще очевиднее, если взглянуть на ограничения системы.

Исследования показывают, что человеческая языковая сеть имеет крайне узкое контекстное окно: она способна эффективно обрабатывать чанки длиной максимум в 8–10 слов.

По сути, это довольно поверхностная система. Она реагирует на грамматически верную бессмыслицу Ноама Хомского «Colorless green ideas sleep furiously» так же активно, как и на осмысленные предложения. Ей важна структура и статистическая вероятность стыковки слов, а не истинность или глубокий смысл высказывания.

Это роднит её с ранними языковыми моделями: сеть просто выучила правила, по которым слова собираются в цепочки.

Данные Федоренко заставляют пересмотреть и классические представления об анатомии, ведь многие учебники до сих пор ссылаются на устаревшие концепции.

Например, зона Брока, которую десятилетиями считали центром речи, на деле оказалась областью моторного планирования. Она лишь готовит мышцы рта к артикуляции и активируется даже при произнесении полной бессмыслицы, работая как ведомый регион для получения команд.

Настоящая же языковая сеть мозга - это отдельный, специализированный вычислительный кластер, который, подобно ChatGPT, блестяще имитирует связность речи, даже если за ней не стоит никакой реальной мысли.


@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Джентльменский набор для оффера на 15-30к баксов, чтобы получать зарплату в долларах и пановать в России

Изучил тему валютных удаленок чисто для дата-инжиров и дата-систиенсов.
Вот что нужно:
1. Не совсем легальные в России технологии из трех букв с пока еще неблокируемыми ведомством из трех букв протоколами. Желательно чтобы IP был немецкий или американский.
2. Аккаунты на западных аналогах HH.ru (на LinkedIn зарегать аккаунт в 2025 году из России - это буквально подвиг с их nocaptcha error)
3. Сертификаты по вендорскому ПО (1-2 штуки минимум) + знания специфических популярных на Западе инструментов (которые, скорее всего, не опенсорс).
4. Желательно образование техвуза из мирового рейтинга вузов (МФТИ в этом рейтинге, к примеру, есть), либо аналоговнетное ВШЭ как у админа канала (которую админ перекрывает профепереподготовкой по ML+DE от МГУ)
5. Запрещенные в России сертификаты по английскому языку не ниже 8.5 баллов. Особенно нужно вкачать спикинг. Сертификаты эти так же нужны для релокации, в случае если оффер жирный, но с обязательной релокацией (к примеру для легализации в Австралии или Новой Зеландии миграционная служба требует один запрещенный в России сертификат). Английский - это самое сложное для русскоговорящего человека, который, как правило, может читать и понимать речь, но не может выражать мысли на английском языке (среднестатистический индус говорит на английском в разы свободнее среднестатистического россиянина). Именно из-за английского людей из России сливают, а не из-за паспорта. Как в старом анекдоте "бьют не по паспорту, а по морде".
6. Счет иностранного банка. Лучше не банка Армении или Казахстана, а немецкого или хотя бы сербского банка.
7. Телефонный номер по месту геолокации. То есть если ты ищешь работу в Германии, то у тебя должен быть немецкий номер телефона и немецкий IP, причем симка должна быть немецкая, VoIP умеют выявлять. Иногда могут попросить показать что у тебя за окном, и, если там будет разливайка "Пивной мир", а не "Хофбройхаус", то могут слить. Как лайфхак: к окну приставлять лист фанеры и говорить, что живешь в микроквартире без окон.

#карьера #лайфхаки
💊2
Потолковые зарплаты Senior Data Engineer

В России - 550к на руки (неуверенно, редкость) и 450к (уверенно, видел неоднократно).
На Западе - 20к долларов (неуверенно, потому что могут быть выбросы как и до 50к баксов, так и 20к где-то потолок) и 10к долларов (уверенно).

Источник: поверь мне брат, я знаю, я видел (реально рисерчил)

#зарплаты
Полезно ли смотреть/слушать видео с собеседований?

Ответ однозначно "да", потому что ты учишь типовые вопросы, а лично я после каждого такого видео понимаю, почему у меня получается выбивать по 2-3 жирных оффера за две-три недели, а другие пишут, что месяцами не могут найти работу.

В большинстве видосов парни действительно могут шарить за матчасть, но софтскиллы у них никакие. На одних хардах выехать очень сложно, скорее даже невозможно.

Как же качать софтскиллы? Лично я всю жизнь до 18 лет был интровертом-социофобом, пока не пошел работать продаваном всякого шлака в рекламную компанию S7. Работая по 4 часа в сутки, я поднимал 50-60к на руки в месяц, что по тем временам было очень даже неплохо. Также некоторое время тусовался с московскими гуру пикапа (тогда они были в моде), будучи гормональным юношей, который не знал как подкатить к девушкам.

Через год опыт продавана и опыт гуру пикапа процентов на 70-80% закрыли мои коммуникационные навыки, подавили робость и застенчивость и неумение преподнести себя. А ещё параллельно всему этому во ВШЭ учили питчить за пять минут свои проекты, которые могли быть полным бредом, но которые надо было зарекомендовать на всяких защитах лаб, чтобы сдать и забыть.

Собственно, если технарь пропустил этап социализации, то я бы рекомендовал по выходным взять подработку промоутером или продаваном за гроши. Пары месяцев хватит чтобы прокачаться в коммуникации.

#софтскиллы
Попросил Claude провести исследование зарплат гошников, растовиков и скалистов по миру.

Результаты:
- Scala: вакансий мало, но по деньгам больше всех платят. Медиана 130к баксов в год против 120 у Rust и 109 у Go.
- Вакансий больше всего у Go.
- Rust феноменально быстро растет, на него переписывают вообще всё (и, может быть, зря).
- Scala в банковском секторе даёт какие-то баснословные 700-900к в год в США. Rust в сфере крипты даёт сопоставимые цифры.
- Scala медленно умирает, но прогноз неопределенный. Возможно хайп Rust натолкнется на барьеры, где его просто невозможно будет применять в силу проблем с безопасностью.

Общий вывод: Go совершенно не нужен инжиру, особенно при новом Python 3.14, а вот Scala и Rust знать бы надо.

Лично мне из всех языков именно Scala нравится сильнее всего: она "красивая" и не такая "молодежная" как питон, который даже школьники в 5 классе учат. А Rust хорош взрывом мозга и близостью к железу, что тоже круто.

#языки #карьера #зарплаты
Scala для дедов, Python для вкатунов

Интересный market research по Scala. Только 1.7% вкатунов в IT учат Scala, а кодят на ней олды.

Scala для финтеха (на замену Java), Python для ML и прочего хайпа.
Scala для чистой бигдаты, Python для "быстро запустил, проверил гипотезу, убил джобу".
На Scala вайбкодить труднее, так как обучающие датасеты меньше. Python идеален для вайбкодинга.
Scala для денег, Python для удовольствия.

#scala #python
Один из самых забавных и одновременно ключевых инцидентов в "расследовании" пользы алкоголя - это исследование MACH15.

Вернее, планируемое исследование. Американский Институт Здоровья - государственная организация, мощно объявила:
«‎мы проведём самое масштабное рандомизированное контролируемое исследование на 8,000 человек, чтобы наконец выяснить, приносит ли алкоголь в низких дозировках пользу!»‎


Это и правда очень амбициозно. Ведь до тех пор были только эпидемиологические работы и очень сомнительные результаты по спорным биомаркерам.

Объявили. Но вскоре журналисты выяснили следующее: (и да, без них правда, вероятно, никогда бы не вскрылась)

- алкогольная индустрия фактически сделала ведущих авторов финансово зависимыми, для того чтобы подтвердить, что маленькие дозировки алкоголя - это часть здоровой диеты.

- учёных отправляли в путешествия, на элитные ланчи и конференции за счёт ликёрной индустрии, между которыми сами учёные продавали бизнесменам идею о "супер-исследовании", которое докажет всем, что алкоголь - это классно

- авторы будущей работы многократно отрицали, что имели какие-либо контакты с представителями индустрии

- однако, договор-таки был. И согласно ему, учёные должны были вручную исключить всех людей, которые получили бы вред от алкоголя, чтобы показать, что алкоголь полезен

- с другой стороны, они должны были подобрать именно тех, кто наиболее вероятно получит пользу

- они должны были плохо контролировать, сколько алкоголя потребляла "воздерживающаяся" группа, чтобы показать, что не потребляющие вообще не получают пользы для здоровья

- они должны были исследовать строго те исходы, которые представители индустрии считали наиболее вероятными кандидатами на позитивный результат

- формулировка результатов как "потенциальная польза", а не "вред" или "польза"

- условия, на которые учёные, тем не менее, согласились были в том числе в том, что ни один из видов алкоголя не будет представлен как более или менее полезный: пиво, вино, водка, ликёр — всё должно быть одинаково "полезно"

К слову, ведущий автор уже написал около сотни работ о пользе умеренного потребления алкоголя

По итогу, NIH были вынуждены закрыть исследование после шумихи в СМИ и внутреннего расследования...

———

Вероятность такого же масштабного исследования, способного показать или опровергнуть-таки наконец пользу алкоголя, после этого скандала почти равна нулю.

А для всех нас это урок: даже очень качественные РКИ, показывающие какую-то пользу, могут быть просто купленным текстом на каком-то сайте в интернете, и не больше.