Aspiring Data Science – Telegram
Aspiring Data Science
386 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
#trading

Лидер.
😍2
#diet

Прельстился в магазине сладкой водичкой по скидке. Дома после жадного свинчивания крышки двухлитровая бутыль извергла такой столб содержимого, что липкой сладкой хренью забрызгало всё в радиусе полутора метров, включая меня, ноут, кресло и внешнюю клаву. Теперь залипает часть кнопок. А ведь мне даже не понравился вкус.
#atms #ml #sberbank

Про придумывание истории после перемещения банкомата кажется бредом, про подбор лагов на CV интересная идея, но не раскрыта.

https://www.youtube.com/watch?v=s7cYqaiA2mE&t=3s
🤔1
#mlops #dvc

Уже в который раз смотрю материалы про dvc, и никак не могу понять, нафига это нужно. А вы пользуетесь DVC или каким-либо другим инструментом версионирования данных?

https://www.youtube.com/watch?v=FbIyKjOdiI8
#towardsdatascience

Немного помоев в лицо. Видимо, моя работа слишком хороша для них.

"Hi Anatoly,

Thank you for considering Towards Data Science. Our team has decided not to publish the post you shared with us, but we appreciate the chance to read your work.
👀1
#statistics #informationtheory #entropy #python #featureselection #featureengineering

Ну да ладно, пока просто в личном блоге опубликую, оказывается, вроде потом можно будет статью прикрепить к паблику.

https://medium.com/@fingoldo/15819b261de0
2
#hardware

"Компания Seagate представила свой самый ёмкий жёсткий диск с технологией обычной магнитной записи (CMR). Новинка IronWolf Pro 22TB имеет объём 22 Тбайт. Компания оценила HDD в $600, однако в настоящий момент он доступен в продаже по цене $400."

https://3dnews.ru/1085053/seagate-vipustila-gyostkiy-disk-ironwolf-pro-obyomom-22-tbayt-on-predlagaetsya-po-znachitelnoy-skidke
Forwarded from Борис опять
#лабораторный_журнал

Мы запустили наш проект.

Со стороны выглядит неприлично просто. На одном экране видишь карту фабрики и статус локаций с растениями. По клику на локацию переходишь в инструмент разметки. Если отмечаешь там проблему, то на карте иконка становится красной. Размечаешь как отсутствие проблемы — становится зеленой.

Удивительно как много сложности скрывается за этим фасадом. Пользователю не видно, что для этой простой работы нужно было связать между собой изображения, данные о засеянных продуктах и данные о прогонах робота. Не видно как нам пришлось связывать координаты фотографий от робота с локацией на фабрике. Не видно и всех бекграунд джоб, мониторинговых штук и прочей обвязки.

Показали результат агрономам. Я постоянно ожидаю, что мне скажут: “Это все очень круто, вы молодцы, но это не то, что нужно.” Но нет: им снова понравилось. С понедельника они будут это использовать. Во время демонстрации мы даже вместе нашли проблему с растениями на фото и агрономы пошли разбираться. Вообще постоянно ожидаю, что мы что-то не учли, но все подозрительно хорошо работает и даже с первого раза.

Тем временем у нас накопилось более 400к свеженьких фотографий. Примерно по 60к поступает каждый день. Благодаря тому, что мы связали изображения с данными о растениях, мы уже можем обучать модели на некоторые задачи. Например, предсказывать возраст растения и классифицировать тип. Это позволит претрейнить модели для других задач. С такими объемами даты нам даже доступен self-supervised learning. Уверен, что скоро у нас будет самая крутая модель для растений среди всех компаний занимающихся вертикальными фермами, если не вообще в мире. Мы начинаем делать ML!

Теперь я могу сказать, что есть компания, где я сделал ML с нуля.
🏆4👍1