Техножрица 👩‍💻👩‍🏫👩‍🔧 – Telegram
Техножрица 👩‍💻👩‍🏫👩‍🔧
14K subscribers
1.44K photos
64 videos
28 files
765 links
Люблю высокие технологии и кушать.

Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.
Download Telegram
Помните, была тема с дипфейком Ким Кардашьян, объясняющей коротенькие темы из математики? Так вот, эти видео никуда не делись, а продолжают регулярно выходить. 💜

Замена переменной в интеграле:
https://youtu.be/4fF6NydCNuw?si=ydOJV2NpgbYq594y

Вывод производной x² из определения:
https://youtu.be/qPhLWfn-t_4?si=-uIogJ_sufxK-FNB

Цепное правило:
https://youtu.be/ulbmQJG5GrA?si=O5IHessFBNUF2pk4

Забавно и мило 😀

#математика
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰33😁12🔥84🤔3🤡32👍2
Поставил третьей моделью gpt-4o в @saiga_igusev_bot, можно пользоваться, запросы и ответы собираю. Не забудьте переключить модель и поставить пустой системный промпт, а то она будет думать, что она Сайга.

Пока без картинок.
🔥22👍7🥰6🤡21
Forwarded from Сиолошная
С утра читаю отзывы людей (негативные опущены, они тоже есть):
— Вау, такой голос! Как живое!
— Невероятно, всё утро веду диалог, мне теперь живые люди не нужны!

Штука в том, что свежая модель на данный момент для пользователей генерирует лишь текст. Генерацию голоса новой моделью, а также создание картинок завезут позднее, «в ближайшие недели».
Представьте, что будет когда включат эту функциональность, как люди обрадуются 😀

То есть как работало мобильное приложение ChatGPT раньше:
— Одна модель слушает вас, переводит речь в текст. На этом этапе теряются все эмоции, никаких тегов <вздох> или *радостно* там нет — просто текст
— Текст подаётся в GPT-4-Turbo (вторую модель) на вход (как будто бы вы сами написали сообщение своими руками)
— Эта модель генерирует ответ текстом
— Этот текст озвучивается третьей моделью. Она не может петь, шептать, играться интонацией. Если в запросе попросите её это сделать — она не будет следовать инструкции

Насколько я понимаю, на сегодняшний день эта функциональность сохраняется — несмотря на то, что модели с номерами 1 и 3 можно заменить на новую GPT-4o (она может нативно слушать вас и генерировать голос сразу, без вспомогательных средств). OpenAI не выкатывают всё сразу. А вот модель 2 как раз заменили. То есть сами ответы могут показаться умнее, уровень понимания тоже повысился — потому что LLM стала мощнее. И скорость выросла.

Не верите? Попробуйте попросить отвечать медленнее/быстрее, или даже шёпотом.

Sorry to disappoint you 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27😁8👍54🤡2🎉1🤮1💩1
👍53😁48🙏8😈7🤡33🔥2💯2🍓1🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
Автор текста: gpt4o ( https://news.1rj.ru/str/NeuralShit/5500 ), автор музыки: suno.ai .

В честь дедлайна абстракта на нейрипс приоткрою комменты, если опять начнется треш - будут либо баны, либо закрытие до финального дедлайна (через 6 дней).
😁51🤡10🔥85👍2🥰1💩1🥴1
Возвращаясь к обсуждению репоста https://news.1rj.ru/str/tech_priestess/1507 , который вызвал такое сильное непонимание. Я попробую объяснить своими словами, в чем я лично вижу идею behavioural interview и почему не вижу ничего зазорного в том, чтобы серьезно к нему относиться и тщательно готовиться.

Behavioural interview по своему смыслу направлен на выявление софт скиллов, в частности, вашей способности эффективно доносить свои мысли, взаимодействовать с другими членами вашей команды и при необходимости организовывать работу коллег так, чтобы достигалась поставленная цель ("leadership").

Отвечая на вопрос, зачем это нужно программисту, ML инженеру или исследователю. Это нужно затем, что в корпорации люди чаще всего работают не поодиночке, а делают вместе крупные совместные проекты (которые порой бывают частью еще более крупных проектов и так далее). И в таком типе работы крайне важно, чтобы взаимодействие между отдельными участниками шло эффективно. В противном случае, один будет делать одно, другой - другое, а результата не будет, даже если каждый из участников, взятый в отдельности, является отличным специалистом с сильными хард скиллами.

Чтобы это пояснить, можно привести пример с распределенными вычислениями. Допустим, у вас есть несколько вычислителей, и вы распределяете по ним решение какой-то большой задачи, разбивая её на подзадачи и отправляя эти подзадачи на каждый из вычислителей. Если алгоритм разбиения задачи на подзадачи и распределения этих подзадач написан плохо (например, из-за плохого дизайна алгоритма одному вычислителю часто приходится должно ждать ответа другого, и пока он ждет, он в это время ничего не делает; или два вычислителя дублируют работу друг друга; или между вычислителями по той или иной причине слишком медленно и невовремя передаются данные), то толку от мощности этих вычислителей будет мало.
Так вот, когда вы и другие разработчики/исследователи из вашей команды, выстраиваете между собой рабочие взаимодействия для решения задач, вы как бы на ходу придумываете, реализуете и при необходимости корректируете алгоритм распределенных вычислений, который должен будет максимально эффективно утилизировать ваши мозги. И на behavioral interview надо на примерах из вашей рабочей практики показать, что вы в этом хороши, даже несмотря на то, что вычислители-люди (в отличие от процессоров и видеокарт) могут быть сколь угодно своенравными и непредсказуемыми.
Например, на интервью может понадобиться вспомнить пример, который показывает, что в случае конфликта вы сделали все от вас зависящее, чтобы работа не стопорилась на долгий и выматывающий всех скандал, а вместо этого быстро пришли к решению и продолжили выполнение задач. Или, если вы руководитель, может понадобиться вспомнить примеры, которые как-нибудь демонстрируют, что подчиненные вам доверяли и не стеснялись честно говорить о задержках и проблемах в работе (возвращаясь к примеру с вычислителями, это нужно для того, чтобы вовремя скорретировать алгоритм или просто быстро кинуть на простаивающий (выполняющий не приоритетную задачу) вычислитель ту подзадачу, которую не смог решить тот, у которого проблемы). И так далее, и тому подобное, мне дальше лень фантазировать, думаю, и так мысль ясна.

Впрочем, тут читатель может воскликнуть:
- Но погодите! Я такой классный специалист, что мне не нужно учиться работать в команде, я сам заменяю собой целую команду!
Отвечаю на это возражение: в корпе проект часто бывает настолько большим, что 1 человек чисто физически будет не способен сделать его сделать в одиночку, даже если он буквально Альберт Эйнштейн.
Кроме того, следует помнить, что умных людей в мире, может, и меньше, чем глупых, но все равно как минимум несколько миллионов наберется. Так что каким бы "🤓" вы ни были, в собеседованиях в FAANG вы будете конкурировать с сотнями таких же "🤓". И в этой конкуренции даже малейшее преимущество, и по хард, и по софт скиллам будет играть свою роль.

#карьера #рассуждения
Please open Telegram to view this post
VIEW IN TELEGRAM
57👍3115🤡8🔥4🤮1💩11
И еще немного про сквернословие 🙏
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1011351
Forwarded from New Yorko Times (Yury Kashnitsky)
Советы вкатывающимся в Data Science c невыдающимся резюме
#career

Мир становится жесток, да, долго и сложно. Но можно. Собрал несколько рекомендаций (не исчерпывающий список, по убыванию приоритета):

- Рефералы, рефералы и еще раз рефералы a.k.a. кумовство. Вот правда, благодаря знакомым в принципе можно попасть на такие позиции, на которые в норме бы ваше резюме вообще не рассмотрели. Ничего страшного, если пройдете. Да, будут синдром самозванца, но потом можно и нагнать. О том, как правильно нетворкаться, – неплохо написано в посте “А как собеседоваться в 2023?” (правда, там описана версия для экстравертов 80-го левела, вариант с чуть меньшей соцактивностью тоже подойдет);

- Первое на что смотрят в резюме – реальный опыт работы. И его не заменишь курсам/сертификатами/профилями на литкоде или кэггле. Так что тут лучшее, что можно посоветовать – искать сторонние проекты, чтоб этот опыт получить. Например, HuggingFace инициирует проекты, где любой желающий может подключиться (а-ля обучения берта для тамильского язык, мой коллега там участвовал). Тот же open source. Еще можно найти команду для прикладного проекта в рамках курса (например, такая активность была в курсе ods.ai по MLOps). Это не быстрый путь, знаю, но это чуть ли не единственное, что может выделить одного кандидата на фоне других при прочих равных условиях;

- Если у вас нет Data Science опыта, но есть релевантный опыт в разработке или аналитике, может быть реально поучаствовать в Data Science проектах в компании, где вы уже работаете. Если наберется track record из 2-3 таких проектов, то уже проще будет и формально перейти на DS-позицию. Иногда для этого надо чем-то пожертвовать, например, немного проиграть в деньгах или в должности;

- Как ни банально звучит, первым делом смотрят на резюме, так что его надо слегка прожарить. Сервис ResumeWorded прям хорош (пост).

Что скорее не поможет:

- Набивать титулы типа Kaggle Competitions Master. Тут можно потратить уйму времени и в результате отклик может не обрадовать. Эйчары не сильно различают грандмастеров в Notebooks и соревнованиях, так что ваша лычка может быть не так уж и заметна. Есть, конечно, исключения, например, команды с большим представительством Kaggle Competitions Grandmasters (H2O, Nvidia Rapids), но среднему человеку я не порекомендую такой путь развития (мне он тоже не подходит). При всем сказанном, получить немного опыта на Кэггле – однозначно здорово.

- Получать охапки сертификатов. К ним отношение противоречивое, но если у вас нет релевантного опыта работы, скорее всего сертификаты не спасут ситуацию.
👍36🔥103🤣2
Forwarded from Stolen memes (Maksim Artemev)
😁63236👍2🔥22❤‍🔥1🤔11
Единственная область, в которой все эти люди могут работать в одной команде, и при этом говорить, что работают по специальности 🌚
💯79😁416🤡431
А вы заметили, как модно после популяризации удаленки стало чморить обычных офисных сотрудников, ездящих в офис 4-5 дней в неделю на метро и сидящих там по восемь часов? А уж если твой офис представляет из себя классический серый оупенспейс, не раскрашен в яркие цвета и содержит недостаточное количество свистоперделок, ооо... соевик-стартапер обязательно скажет, что ты работаешь в стойле, как скот, а компания твоя - говно.
...
Но какого, я вас спрашиваю, хрена?
Почему пять-семь лет назад я точно так же работала в совершенно аналогичных корпоративных офисах, и тогда к такой работе окружающие относились нормально? Какого хрена теперь, когда я рассказываю о своем корпоративном образе жизни людям с гибким графиком или стартаперам, мне надо терпеть в лучшем случае жалостливые взгляды, а в худшем - выслушивать детские дразнилки про скот, "серую массу" и тому подобный бред?
Я прям блин чувствую это социальное давление, которое как бы говорит, что для того, чтобы быть крутым айтишником, ты должен работать, в идеале, с пляжа на Бали (почему?! никогда этого не понимала), или, на крайняк, хотя бы иметь гибридный формат работы. А если ты работаешь в обычном оупенспейсе, то ты лох.
...
Время от времени я прохожу собеседования в другие компании, чтобы держать себя в форме, но пока все еще решаю остаться на текущем месте, потому что мне нравятся коллеги и кажется, что это место чуть больше других подходит для выполнения моих долгосрочных целей в ресерче.
Ну или потому что я лохушка, серая масса и скот. Иметь какие-либо чувства, цели и мечты и ценить их выше, чем красивый офис и гибридную работу - это же теперь признак серой массы и скота. 🤷‍♀️

#о_себе
Please open Telegram to view this post
VIEW IN TELEGRAM
12177🤡3017👍10👏8🤔65🔥4😁4😱3
Пояснение к предыдущему посту на всякий случай: я совсем даже не против удаленной и гибридной работы. Просто против того, чтобы считать людей, у которых не такой режим работы, как вам нравится, и не такое помещение для работы, как вам нравится, ниже себя.
👍8514🤡53👌3🤮1💩1😍1
В боте (@saiga_igusev_bot) в gpt-4o можно теперь засылать картинки. Но бот их не генерирует, если что.
🔥29🥴4🤡2🤓2👍1😁1🤮1💩1
Forwarded from Tati's Wonderland (Tanya)
#карьера #career #interview #faang

Behavioural interviews in FAANG+

10. Scope / масштаб
Важно показывать масштаб проектов на определённый уровень. Часто самый первый вопрос - проект, которым гордитесь. Это возможность показать масштаб, влияние и импакт.
Будьте избирательны и выбирайте проекты с достаточным масштабом и количеством подчинённых/ менти.
На менеджера первого уровня/staff по IC ожидается 5-10 direct report/супервайзить 5-10 человек. На sr manager/sr staff - уже несколько команд и влияние на 20 человек, principle/director - 50+ человек.
Это размыто, но порядок цифр примерно такой.
Если вы тех лид команды с 2мя людьми вне фаанга - это синьор в фаанге, поэтому выбирайте проекты, где вы лидили 5+ человек из разных команд, если хотите выше.
Приведу пример в комментариях.

11. Какой сигнал хочет получить интервьюер?
Каждый вопрос задан, чтобы считать какой-то сигнал. В behave это чуть менее очевидно, чем в дизайнах. Думайте, "what is the question behind the question?", какой сигнал хочет получить интервьюер, на какой принцип лидества направлен вопрос. И дайте ему/ей этот сигнал или принцип.
Если считывать сложно, готовтесь! По основным вопросам полно разъяснительных бригад в интернете.

12. Будьте аунтентичны
Из курса психологии мы знаем, что найм - это субъективное эмоциональное решение (как большинство решений).
Важно выделяться из череды кандидатов. Подумайте, какую аутентичную часть себя вы готовы показать.
Пример, на вопрос как развиваю soft skills в Мета я ответила, что занимаюсь с психологом и психотерапевтом. Это разбудило моего интервьюера, интервью прошла отлично.
В Shutterstock я рассказывала, что сама художник и мы смотрели на мою галерею картин. Получила офер.
Не бойтесь быть собой.

13. Адаптируйте вопросы
Если вопрос оказался не в совсем удобной форме, перефразируйте его как вам надо. Примеры в комментариях.

14. Ваши вопросы
Вопросы, которые задаете Вы тоже очень важны. После определённого уровня ваши вопросы становятся важнее ваших ответов. Подготовте их заранее, исследуя команду и компанию.

Моя презентация, которую я сделала 2 года назад для подготовки к behave, там есть детали.

Всем удачи на всяких интервью.
Примеры в треде.
👍36😁4🤡32🔥1🤮1💩1🥱1
Ставь "🥴" если тоже собираешься отправлять статью на NeurIPS в течение последнего часа до дедлайна
🥴8737🫡28🥰11🤡94😁33
Ставь "🏥" если отправил статью и сразу отъехал в психическую больницу
Please open Telegram to view this post
VIEW IN TELEGRAM
154🫡2218😁44💩2👻211🥴1😘1
Между тем, на 25 мая (суббота) запланирован мой доклад на Data Fest в офисе VK, зал А1:
https://ods.ai/events/fest2024-vk
Доклад называется "Как одурачить детекторы LLM-контента".
Предварительно доклад планируется на 12:25 (13:25? время может измениться).
Регистрируйтесь и заходите послушать.
🔥922012👀33🤮2🤡2👍1💩1
Forwarded from Kali Novskaya (Tatiana Shavrina)
🌸5 заповедей бенчмарков, которые больше не работают в 2024 🌸
#nlp #про_nlp #nlp_papers #ai_alignment

Пара мыслей вслух про то, как меняется процедура оценки языковых моделей — и наши ожидания от них.

🌸1. Датасеты и бенчмарки всегда живут дольше, чем модели. По крайней мере, так было раньше. Теперь это не так, бенчмарки устаревают за месяц — тесты оказываются в обучающей выборке, хакнуты кэгл-методами, и т.д.

🌸2. Тестсет может быть открытым, можно выкладывать ответы, разработчики же честные. Честные! Но потом это все попадает в обучающую выборку непроизвольно, с краулингом сети. Контаминация открытого тестсета рано или поздно неизбежна, а учитывая п.1, это время очень сократилось.

🌸3. Новый датасет = более надежный результат. Многие датасеты составляются с помощью фильтрации открытых данных, разметки, часто получавтоматической, данных, которые уже были в сети, соответственно, модели их уже видели. Более надежный результат тестрования гарантирован, только если новый датасет составляется людьми с нуля! Иначе риск контаминации очень велик — см статьи из поста и статью Scale AI. Любые оценки моделей без теста на контаминацию можно смело выкинуть.

🌸4. Разработчики моделей сами прогоняют свою модель и подбирают лучшие параметры. Тоже нельзя сказать, что это верно. Во всех крупных лидербордах и раньше надо было прислать ссылку на код и модель, а теперь и вовсе, честная оценка возможна в условиях контейнернго соревнования — разработчики отдают контейнер организаторам лидерборда, те его запускают и сравнивают с остальными на закрытом тестсете, который разработчики не видели. Перебор гиперпараметров в таком случае сделать нельзя. См Chatbot Arena

🌸5. Однократной оценки достаточно. Во-первых, модели постоянно обновляются, а если они еще и ходят в интернет или используют RAG/обновляемый индекс знаний, то и проверять их надо постоянно во избежание регресса. В-вторных, side-by-side соравнениями из п.4 и AB-тестами оценки можно запускать постоянно — была бы инфраструктура и оценивающие люди. Инфраструктуру и сообщество сейчас во многом обеспечивает HuggingFace— на ChatBot Arena уже больше миллиона оценок, хотя несколько месяцев назад все чуть не закрылось!

С какими проблемами при оценке моделей вы сталкивались?

🟣Мой чеклист отсюда все еще актуален — для продакшена бенчмарков мало, еще нужна комбинация из оффлайн и онлайн метрик.
Please open Telegram to view this post
VIEW IN TELEGRAM
💯12👍3🤡2🫡21🤮1💩1🙏1
Мама Кандинского #внезапный_киберпанк
😁24🤡4🤮2💩1