ну что котаны и котанессы, сегодня у нас очередной урок про нейросеточки
подписался я значит за бешенные бабки на обучение по RL. сначала херота какая то, марковские процессы , монте карлы и прочиее временные различия
две недели короче ждал пока начнется атари и dqn
мои самые влажные фантазии реализовались , пришлось даже планшет с контроллером задвинуть. как в старые добрые, коллаб до 3 ночи
подписался я значит за бешенные бабки на обучение по RL. сначала херота какая то, марковские процессы , монте карлы и прочиее временные различия
две недели короче ждал пока начнется атари и dqn
мои самые влажные фантазии реализовались , пришлось даже планшет с контроллером задвинуть. как в старые добрые, коллаб до 3 ночи
вобщем примерно состояние LLM - она сама тебе предлагает задачу МППР. сама ее описывает ( среда, действия итд). сама пишет код. сама исправляет в нем ошибки ( у меня была всего 1 , но по идее с этим и коллаб сам уже умеет справляться в него сука тоже уже встроили помощника). а я только наслаждаюсь результатом и охуеваю о того, до чего дошел прогресс.
если кто хочет сам поиграться - то вот можно начать с радуги https://docs.cleanrl.dev/rl-algorithms/rainbow/
самое интересное, что это всего то 2018 год ( т.е. практически вчера)
самое интересное, что это всего то 2018 год ( т.е. практически вчера)
Forwarded from I’m CEO, beach
Команда, я пересмотрел фильм «Матрица». Всё очень круто, но я так и не понял, зачем он променял комфортную и классную работу в офисе на кучу проблем. Просьба ко всем, если вам предложат красную или синию таблетку - просто выпейте глицин и витамин D. Всем правильного выбора!
💯1
Forwarded from I’m CEO, beach
Команда, собеседовал сейчас кандидата. Я спросил сколько он хочет зарабатывать в месяц, а он сказал 10 миллионов. Вот это масштаб личности! Давайте его срочно возьмем. Но предложите ему пока 25 тысяч с испытательным сроком на 20 лет. Нам нужны люди, которые верят в мечты и погашение ипотеки!
🔥1👏1🤣1