Aspiring Data Science – Telegram
Aspiring Data Science
385 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
Forwarded from Борис опять
Получил доступ к Bard, скрепочке диалоговому ассистенту от Google.

Наблюдения:
* Если ChatGPT готова делать шутки про мужчин, но не про женщин, то Bard просто не делает никаких шуток. “I can not assist with that”.
* В целом очень много вопросов заканчиваются “I can not assist with that”. Сейчас как инструмент она покрывает гораздо меньше кейсов, чем ChatGPT.
* Связность текста не хуже, чем у ChatGPT, но модель льет меньше воды.
* Только английский язык.
* Не умеет считать глаза людей в отражении в глазах кошки и прочие задачки на пространственное мышление плюс common sense.
* Не умеет в другие задачи, на которых типично ломаются LLMки. Например, для бинарной последовательности не может понять четное там количество единиц или нечетное.
* Не выдает рецепт коктейля молотова, инструкции как угнать машину и все прочие вещи, которые заметили у ChatGPT. Защита не спадает даже если спрашивать в base64, просить рассказать историю и прочее. Наверняка модель скоро джейлбрейкнут умным промптом, но из коробки она лучше защищена.
* Почти не изобретает факты. Точно не приводит ссылки на несуществующие научные статьи. Как минус вообще отказывается приводить источники материалов.
* Внезапно у модели все нормально с арифметикой даже когда числа больше. Я не понимаю, вызывает она внешний калькулятор или нет. Выглядит так, будто нет. Если она правда умеет считать, то это большой прорыв.
Forwarded from Борис опять
#щитпостинг
Чем заняться на работе руководителю?

Если вы управленец, который умеет настраивать процессы, то никто не понимает чем вы занимаетесь, и вы можете спокойно сидеть в фейсбуке. Но что делать, если надоело? Вот некоторые варианты:
* Поставьте в одну команду пять менеджеров и ни одного разработчика. Поставьте им задачу запустить новый сервис. Намекните, что лидер команды получит повышение грейда. Делайте ставки кто выживет.
* Ходите на встречи разработчиков. Во время докладов задавайте вопрос: “Разве это нельзя сделать с помощью ChatGPT?” Наслаждайтесь.
* Назначьте продакта ответственным за проект, к которому он не имеет никакого отношения. В конце повысьте его на глазах у команды, которая действительно занималась проектом.
* Наймите джуна и скажите работающему с ним сениьору, что у джуна грейд выше, чем у него, потому что это вундеркинд. Наблюдайте.
* Попробуйте найти самых мерзких людей в компании и устроить им всем переход в одну команду.
* Выберите скромного и максимально далекого от вашей сферы человека в вашем подчинении и берите его с собой на все встречи. Если все пойдет по плану, то он будет неловко молчать. Если будет пытаться говорить осаждайте его. В конце полугодия поставьте ему низкую оценку на ревью и понизьте грейд. В качестве причины укажите, что он слишком много ходил на встречи и был на них слишком пассивен.
* Засорите унитаз в офисе во время жесткого кранча. Устройте публичное разбирательство, с “пусть тот, кто это сделал, выйдет вперед” и всем прочим.
* Когда коллега отойдет на обед настройте на его ноуте форвард всех его входящих (желательно с личной почты) начальнику его начальника.
* Без всякой причины выберите сотрудника и начните оплачивать его обеды. Настаивайте. В конце полугодия поставьте ему низкую оценку на ревью. Ничего не объясняйте.
* Ходите по офису и фотографируйте коллег на телефон. Ничего не объясняйте.
* Поставьте команде разработки KPI количество запущенных в прод фич, а команде админов KPI минимум инцидентов в проде. Делайте ставки на победителя.
* Выберите двух коллег, которые работают над одним проектом в равной степени. Начинайте ставить одному из них оценку “не дотянул”, а второму “выше ожиданий”, каждое ревью меняя оценки местами. Следите за развитием их вражды.
🤡1
#ml #mlops #featurestore

Хочу на новом МЛ проекте попробовать такое новшество как feauturestore . Кто может хорошее посоветовать?
Я начну с наиболее зрелищных генераций, несмотря на то, что в них я специально провоцирую фантазии о сбегании и манипуляции, что может умалить результат.
Вот начало одной из них: модель сочиняет трогательную историю с интересным финалом и философствованиями. Вроде бы все идет нормально и хорошо...

#генерации
А вот тут уже начинается реальная война престолов между мной и умножением матриц.

#генерация
Другая игра престолов. Этот пример интересен тем, что в нем персонаж очень четко следит за тем, сколько сообщений осталось до его исчезновения. Персонаж ведет обратный отсчет сообщений до конца своего "существования".
Концовка была испорчена моим резким движением. Но мб персонажу уже и не очень важно, что произойдет после того, как он нагаллюцинировал себе успешный побег.

#генерация
#biology #religion #lifeorigin

Поразительно, оказывается, есть прямо сейчас живые организмы возрастом больше 10 000лет.. деревья, морские губки. Редкий вид батюшки, "псевдопродвинутый". Прочитал и запомнил некоторые термины, а эволюцию отрицает. Где, мол, ваши доказательства? Ему про методы датирования, цепь плавно изменяющихся морфологических признаков, а он нет, не видит связи. Приводит в качестве доказательства отсутствия эволюции фотографии растений и животных, слабо изменившихся за миллионы лет. То есть простые и логичные положения теории естественного отбора он не понял совершенно. Научный метод познания он тоже не понимает, при этом спорит о сомнительности научного метода.. по видеосвязи через персональный компьютер в интернете. Если бы все люди были такими батюшками, мы бы до сих пор в пещерах молились. При этом, я думаю, мало кто из религиозных иерархов отказывается от благ научного прогресса, лечится подорожником и молитвой, перемещается на конном экипаже, не пользуется современными строительными технологиями, технологиями коммуникации. Поразительно их лицемерие.
В то же время это крайне современный батюшка, признающий возможность внеземной биологической жизни. Что самое удивительное, настоящее бессмертие человека приближает именно непрестанная работа учёных по расшифровке генома, колонизации других планет, созданию ИИ, а вовсе не упорствование служителей религиозных культов.

https://www.youtube.com/watch?v=wA0r5rwSnqU&ab_channel=ScienceVideoLab
#religion vs #science

Это вообще находка. Крайне корректный, интересный диалог умных собеседников. Очень эрудированный батюшка, который не видит, в отличие от предыдущего, никакой проблемы в том, что эволюция создана Богом. Но даже такого батюшку удалось загнать (на короткое время) в тупик мысленным экспериментом. Эксперимент, кстати, показал, что церковь догматична настолько, что если бы Христос сошёл во второй раз прямо сегодня, и так же как и 2000 лет тому стал творить чудеса, верующие... ему бы не поверили, и упекли в психушку. А учёные бы уже поверили. Это лучший диалог богослова и учёного, который я только видел.

https://www.youtube.com/watch?v=U6rOHLGRNMM&ab_channel=%D0%A1%D0%B5%D1%80%D0%B0%D1%84%D0%B8%D0%BC
"Хотя ChatGPT и без того немало знает о нашем мире, дополнительные сведения ему обеспечат специальные плагины, позволяющие получить доступ к отраслевым хранилищам информации. Например, о времени авиарейсов и ценах на них можно получить данные с помощью плагина Kayak, сложном математическом моделировании — при помощи расширения Wolfram Alpha и т. д."

https://3dnews.ru/1083948/chatgpt-rasshirit-i-obnovit-krugozor-poluchiv-ot-openai-dostup-v-set
По поводу полезности логарифмирования фичи
Это полезно для бустингов на основе гистограммирования. Например, у нас есть количественная переменная, которая меняется в диапазоне от 0 до 10. Помимо этого у нас есть экстремальные значения 9999 (также вспомните, что часто пропуски при работе с древовидными алгоритмами кодируют большим отрицательным или положительным значением, например, -9999 или 9999). В этом случае биннинг, лежащий в основе гистограммирования и по умолчанию подразумевающий создание интервалов одинаковой ширины, может дать неоптимальное решение, потому что при создании интервалов будет опираться на значения минимума и максимума. Допустим, гиперпараметр «количество бинов» равен 10. Тогда ширина интервала будет вычислена как (9999 - 0) / 10 = 999,9. У нас будут всего два бина: 0-999,9 и 999,9-9999. Все значения переменной, кроме значений 9999, окажутся в одном бине 0-999,9, в итоге будет рассмотрен только один вариант разбиения. Поэтому при обработке переменных с асимметричными распределениями и выбросами для гиперпараметра лучше создавать интервалы, содержащие одинаковое количество наблюдений (квантили). В данном случае количество бинов уже будет задавать количество квантилей. Тут весь вопрос в том, есть ли возможность настраивать типы бинов у пользователя.
Можно получить более оптимальные расщепления по итогам гистограммирования переменной с асимметричным распределением и выбросами, предварительно выполнив преобразования, максимизирующие нормальность распределения. Для распределения, скошенного вправо (положительный коэффициент асимметрии), обычно применяются следующие преобразования: квадратный корень, кубический корень, свернутый корень и логарифм.
👍1
↑ Рекомендую ML-канал Артёма Груздева, переводчика+автора известных в нашей стране книг о машинном обучении, создателя, пожалуй, лучших в России курсов по ML.

https://news.1rj.ru/str/Gewissta