Для поддержания баланса фото и рисунков в мире я конвертирую обратно фотки из этого поста. AI-Thanos.
Сегодня я узнал, что все это время в colab/jupyter/python shell можно было вызывать функции через слеш, передавая аргументы без скобочек, разделяя пробелами.
/print 'FML' 'Facepalm' ':D'
/print 'FML' 'Facepalm' ':D'
Forwarded from Мишин Лернинг
👾 EfficientZero: Быстрый, Умный и Доступный RL
RL добился успеха во многих задачах. Однако известные методы требуют для обучения миллионов (или даже миллиардов) шагов.
В последнее время мы наблюдаем прогресс в разработке эффективных алгоритмов RL, но работа таких эффективных (по количеству семплов) алгоритмов не дотягивала до человеческого уровня даже в Atari
В пейпере предлагается RL модель основанная на MuZero, которую назвали EfficientZero.
Метод достигает 116% от медианной производительности человека в тесте Atari 100k всего за два часа игры в реальном времен!
Это первый раз, когда алгоритм достигает сверхчеловеческой производительности в играх Atari, используя относительно небольшой объём данных для обучения.
Производительность EfficientZero также близка к производительности DQN (200 миллионов кадров), при этом требует в 500 раз меньше семплов самой игры.
💻 code soon 📰 paper
RL добился успеха во многих задачах. Однако известные методы требуют для обучения миллионов (или даже миллиардов) шагов.
В последнее время мы наблюдаем прогресс в разработке эффективных алгоритмов RL, но работа таких эффективных (по количеству семплов) алгоритмов не дотягивала до человеческого уровня даже в Atari
В пейпере предлагается RL модель основанная на MuZero, которую назвали EfficientZero.
Метод достигает 116% от медианной производительности человека в тесте Atari 100k всего за два часа игры в реальном времен!
Это первый раз, когда алгоритм достигает сверхчеловеческой производительности в играх Atari, используя относительно небольшой объём данных для обучения.
Производительность EfficientZero также близка к производительности DQN (200 миллионов кадров), при этом требует в 500 раз меньше семплов самой игры.
💻 code soon 📰 paper
О, гугл наконец добавил монтирование google drive в colab без ручной копипасты токена.
Forwarded from Технопонедельник
This media is not supported in your browser
VIEW IN TELEGRAM
Сгенирировал картинки на сберовской dalle + простая нейронка для 3д паралакса
Я на свидании: участвую в международных опенсорс-проектах в сфере ИИ.
Я на самом деле:
Я на самом деле: