GPT для Dota 2
Смотрел на досуге The International и задавался вопросами:
- Какое аое у сна наги?
- Что меняли сфу в последних 5 патчах?
- Что дает и сколько стоит свифт блинк?
Плюс мне хотелось пощупать GPT 5 через API. В итоге за пару вечеров завайбкодил себе telegram-бота с RAG по доте.
Сначала в качестве источника данных использовал игровые wiki-сайты. Проблема в том, что там часто попадается устаревшая информаци. Поэтому я стал напрямую парсить файлы из игры.
Попробовал retriever на эмбедингах от LlamaIndex. Быстро стало понятно, что не работает, когда в вопросе используются алиасы по типу “сф” вместо Shadow Fiend. Плюс иногда информация про сфа может встретиться рядом с инфой про другого персонажа, например в патчноуте, что тоже приводит к ошибкам.
В итоге сошелся к пайплайну из 3 шагов:
1. Распознование и нормализация сущностей: сф -> Shadow Fiend
2. Добавление информации по персонажу в промпт
3. Генерация финального ответа
Для 1 и 3 пунктов использую gpt-5-mini с reasoning_effort=low. При таких настройках стоимость ответа около $0.005. Локально отрабатывает секунд за 7. В облаке чуть дольше, потому что крутится в контейнере с 1 CPU и 1 GB RAM.
И вроде бы это все, что нужно для счастья. Но я вошел во вкус и стало мало. При такой архитектуре не получается отвечать на вопросы:
- топ-3 самых дорогих по мане ульты
- какие предметы дают лайфстил?
- у каких нейтралов есть стан?
В итоге я решил собрать граф с онтологией игры и дать LLM доступ к интерпретатору, чтобы она могла писать запросы. Получился полноценный дота-агент. Но это уже совсем другая история, которую я расскажу в следующий раз.
Смотрел на досуге The International и задавался вопросами:
- Какое аое у сна наги?
- Что меняли сфу в последних 5 патчах?
- Что дает и сколько стоит свифт блинк?
Плюс мне хотелось пощупать GPT 5 через API. В итоге за пару вечеров завайбкодил себе telegram-бота с RAG по доте.
Сначала в качестве источника данных использовал игровые wiki-сайты. Проблема в том, что там часто попадается устаревшая информаци. Поэтому я стал напрямую парсить файлы из игры.
Попробовал retriever на эмбедингах от LlamaIndex. Быстро стало понятно, что не работает, когда в вопросе используются алиасы по типу “сф” вместо Shadow Fiend. Плюс иногда информация про сфа может встретиться рядом с инфой про другого персонажа, например в патчноуте, что тоже приводит к ошибкам.
В итоге сошелся к пайплайну из 3 шагов:
1. Распознование и нормализация сущностей: сф -> Shadow Fiend
2. Добавление информации по персонажу в промпт
3. Генерация финального ответа
Для 1 и 3 пунктов использую gpt-5-mini с reasoning_effort=low. При таких настройках стоимость ответа около $0.005. Локально отрабатывает секунд за 7. В облаке чуть дольше, потому что крутится в контейнере с 1 CPU и 1 GB RAM.
И вроде бы это все, что нужно для счастья. Но я вошел во вкус и стало мало. При такой архитектуре не получается отвечать на вопросы:
- топ-3 самых дорогих по мане ульты
- какие предметы дают лайфстил?
- у каких нейтралов есть стан?
В итоге я решил собрать граф с онтологией игры и дать LLM доступ к интерпретатору, чтобы она могла писать запросы. Получился полноценный дота-агент. Но это уже совсем другая история, которую я расскажу в следующий раз.
👍9🔥7😁4
Переезжаю в Дубай, или краткий рассказ про американские горки с О-1 визой
В детстве меня завораживали картинки из голливудских фильмов: небоскрёбы, океаны, спецэффекты. Позже стал притягивать вайб Кремниевой долины: деньги, технологии, влияние. Под воздействием этих и других факторов летом 2022 года я решил попробовать построить карьеру в США.
Первая мысль была — чего мелочиться, надо быть фаундером стартапа! Запустил эксперимент с artifactory.ai и выяснил, что всё не так радужно. Для GenAI-проектов нужны деньги. Зарабатываются они долго, рейзятся тяжело. То, что я находился в маленькой экономике Литвы с русским паспортом, тоже не ускоряло развитие. Когда я посмотрел на стоимость аренды и жизни в Калифорнии, закрыл проект и решил устраиваться на работу.
Из интересного: пока занимался своим проектом, была мотивация «светить лицом» — выступать на конференциях, ходить на подкасты, писать статьи, потому что всё это конвертировалось в деньги. Параллельно добавил судейства и комментарии журналистам — бесполезные с точки зрения монетизации активности, но они шли в зачёт для О-1.
К середине 2023 года у меня накопилось достаточно доказательств. Теперь нужно было найти удалённую работу в США. Первая мысль: да я же ex-CPO GOSU.AI, да я был директором по AI в SberGames — ща на изичах залечу манагером. Реальность оказалась такой, что все мои заслуги в СНГ для американцев — пустой звук. Вдобавок у меня средненький английский и отсутствует локальный нетворк — классический ред флаг.
В итоге я стал искать работу как ML Engineer. Решил пару сотен задач на leetcode, разобрал с друзьями десяток system design’ов, написал STAR-истории для behavioral и начал подаваться. В моём случае сработал wellfound.com. Так я стал вторым сотрудником в uthana.com. Не так престижно, как условный OpenAI или Google, но и я к тому моменту уже три года не писал продакшн-код.
Что было дальше, я писал в посте про переезд. Кратко: мне одобрили петицию, но посадили на проверку в посольстве. Год ждал, начали выгонять из Литвы, приехал в США по туристической визе и подал на смену статуса.
Нюанс был в том, что юристы предложили не просто подать на смену статуса, а переподать петицию — чтобы было 3, а не 2 года до следующего обновления документов. Аргумент: прошлую же одобрили, всё будет збс. Я согласился, но процесс затянулся, пришли Трамп с Маском, уволили бюрократов, закрыли границы, закрутили миграционную политику. В итоге пару недель назад я получил отказ. Видимо, в этом году стал менее талантливым, чем в прошлом.
Так и получилось, что в середине октября я собираю монатки и вместе с семьёй переезжаю в Дубай.
Сначала, конечно, хотелось приуныть. Мол, надо забыть про Штаты: визу не дают, за H-1B Трамп ввёл плату $100k в год, нам с женой скоро будет по 30, дочери почти 4, пора думать о школе, пускать корни, покупать дом/квартиру, а не сливать деньги на переезды и вот это вот всё…
Но потом настал вечер, была хорошая погода. Я взял велосипед, покатался пару часов — стало легче. На следующий день после работы дошёл за 3 минуты до бассейна, проплыл километр — стало ещё чуть легче. На выходных поехал к ребятам на барбекю, а там разработчик, который уже 10 лет в стране, рассказывает, как он торгуется с $600k/y до $750k/y. И стало совсем хорошо, потому что такого сочетания комфортной погоды, людей и возможностей, как в Калифорнии, я нигде не видел. Так что будет повод вернуться. Но а пока: Хабиби Кам ту Дубай.
В детстве меня завораживали картинки из голливудских фильмов: небоскрёбы, океаны, спецэффекты. Позже стал притягивать вайб Кремниевой долины: деньги, технологии, влияние. Под воздействием этих и других факторов летом 2022 года я решил попробовать построить карьеру в США.
Первая мысль была — чего мелочиться, надо быть фаундером стартапа! Запустил эксперимент с artifactory.ai и выяснил, что всё не так радужно. Для GenAI-проектов нужны деньги. Зарабатываются они долго, рейзятся тяжело. То, что я находился в маленькой экономике Литвы с русским паспортом, тоже не ускоряло развитие. Когда я посмотрел на стоимость аренды и жизни в Калифорнии, закрыл проект и решил устраиваться на работу.
Из интересного: пока занимался своим проектом, была мотивация «светить лицом» — выступать на конференциях, ходить на подкасты, писать статьи, потому что всё это конвертировалось в деньги. Параллельно добавил судейства и комментарии журналистам — бесполезные с точки зрения монетизации активности, но они шли в зачёт для О-1.
К середине 2023 года у меня накопилось достаточно доказательств. Теперь нужно было найти удалённую работу в США. Первая мысль: да я же ex-CPO GOSU.AI, да я был директором по AI в SberGames — ща на изичах залечу манагером. Реальность оказалась такой, что все мои заслуги в СНГ для американцев — пустой звук. Вдобавок у меня средненький английский и отсутствует локальный нетворк — классический ред флаг.
В итоге я стал искать работу как ML Engineer. Решил пару сотен задач на leetcode, разобрал с друзьями десяток system design’ов, написал STAR-истории для behavioral и начал подаваться. В моём случае сработал wellfound.com. Так я стал вторым сотрудником в uthana.com. Не так престижно, как условный OpenAI или Google, но и я к тому моменту уже три года не писал продакшн-код.
Что было дальше, я писал в посте про переезд. Кратко: мне одобрили петицию, но посадили на проверку в посольстве. Год ждал, начали выгонять из Литвы, приехал в США по туристической визе и подал на смену статуса.
Нюанс был в том, что юристы предложили не просто подать на смену статуса, а переподать петицию — чтобы было 3, а не 2 года до следующего обновления документов. Аргумент: прошлую же одобрили, всё будет збс. Я согласился, но процесс затянулся, пришли Трамп с Маском, уволили бюрократов, закрыли границы, закрутили миграционную политику. В итоге пару недель назад я получил отказ. Видимо, в этом году стал менее талантливым, чем в прошлом.
Так и получилось, что в середине октября я собираю монатки и вместе с семьёй переезжаю в Дубай.
Сначала, конечно, хотелось приуныть. Мол, надо забыть про Штаты: визу не дают, за H-1B Трамп ввёл плату $100k в год, нам с женой скоро будет по 30, дочери почти 4, пора думать о школе, пускать корни, покупать дом/квартиру, а не сливать деньги на переезды и вот это вот всё…
Но потом настал вечер, была хорошая погода. Я взял велосипед, покатался пару часов — стало легче. На следующий день после работы дошёл за 3 минуты до бассейна, проплыл километр — стало ещё чуть легче. На выходных поехал к ребятам на барбекю, а там разработчик, который уже 10 лет в стране, рассказывает, как он торгуется с $600k/y до $750k/y. И стало совсем хорошо, потому что такого сочетания комфортной погоды, людей и возможностей, как в Калифорнии, я нигде не видел. Так что будет повод вернуться. Но а пока: Хабиби Кам ту Дубай.
Telegram
Дмитрий Савостьянов Вещает
О-1 виза в США
Похоже тема вам интересна, поэтому продолжим. О-1 виза предназначена для людей с «экстраординарными способностями» в области науки, образования, бизнеса, спорта, искусства, телевидения и кино.
Разработчики подаются по научному треку, а менеджеры…
Похоже тема вам интересна, поэтому продолжим. О-1 виза предназначена для людей с «экстраординарными способностями» в области науки, образования, бизнеса, спорта, искусства, телевидения и кино.
Разработчики подаются по научному треку, а менеджеры…
❤26😢5🙏2🤝2🕊1
Дмитрий Савостьянов Вещает
GPT для Dota 2 Смотрел на досуге The International и задавался вопросами: - Какое аое у сна наги? - Что меняли сфу в последних 5 патчах? - Что дает и сколько стоит свифт блинк? Плюс мне хотелось пощупать GPT 5 через API. В итоге за пару вечеров завайбкодил…
А есть тут дотеры, которые еще катают пабы? Ищу пару человек, кто готов потестить мои наработки по DotaGPT. Поставьте плз плюсик в комменты, я вам в лс скину ссылку на тг-бота.
Потестил Sora 2 — новую видео-модель от OpenAI. Работает бодро, ставлю лойс.
Доступно на iOS в США (мб с VPN пустит) по ссылке. Если кому-то нужен инвайт, этот код можно ввести еще пару раз:63FM5X
Доступно на iOS в США (мб с VPN пустит) по ссылке. Если кому-то нужен инвайт, этот код можно ввести еще пару раз:
❤5👍1😁1
Интересный график. Я не ожидал, что влияние уже сейчас настолько сильное.
Forwarded from GPT/ChatGPT/AI Central Александра Горного
Потрясающий коллаж: количество открытых вакансий в США на фоне цены акций.
"AI не захватит ваши рабочие места", да-да-да.
"AI не захватит ваши рабочие места", да-да-да.
🤯5👍2😐2
Дубай неплох.
Летели прямым рейсом — 16 часов. Первая мысль при выходе из аэропорта: «еб*ть, жара». Лос-Анджелес избаловал погодой — там холодный океан и всегда +25.
Забавно, но спасает джетлаг: мы спим два раза в сутки, просыпаемся в семь вечера и в шесть утра. В это время на улице действительно приятно.
На первый месяц сняли Airbnb в Dubai Hills. Чтобы вы понимали уровень руссификации района — я в первый же день в парке случайно встретил товарища, с которым десять лет назад работал в SAS.
Цены на аренду здесь как в Калифорнии, если платить за шесть-двенадцать месяцев вперёд. Если брать помесячно — ценник зашкаливает. Осуждаю. Зато доставка стоит вменяемых денег — можно, как в Москве, заказывать хоть каждый день.
Когда переезжал в ЛА, первый месяц днём работал айтишником, а вечером — грузчиком и хэндимэном: собирал мебель, покупал телевизор, диван, столы, стулья, посуду — короче, весь дом.
Дубайск в этом плане вообще халява. Квартиры часто сдаются с мебелью. Машину можно арендовать через чатик в телеграме — и её доставят прямо к дому. Мне остаётся только сидеть на диване и ковырять в носу. Кстати, про диван — он провонял потным дядькой, который до нас на нем провел лето. Так что в квартирах без мебели всё же есть свои плюсы.
Летели прямым рейсом — 16 часов. Первая мысль при выходе из аэропорта: «еб*ть, жара». Лос-Анджелес избаловал погодой — там холодный океан и всегда +25.
Забавно, но спасает джетлаг: мы спим два раза в сутки, просыпаемся в семь вечера и в шесть утра. В это время на улице действительно приятно.
На первый месяц сняли Airbnb в Dubai Hills. Чтобы вы понимали уровень руссификации района — я в первый же день в парке случайно встретил товарища, с которым десять лет назад работал в SAS.
Цены на аренду здесь как в Калифорнии, если платить за шесть-двенадцать месяцев вперёд. Если брать помесячно — ценник зашкаливает. Осуждаю. Зато доставка стоит вменяемых денег — можно, как в Москве, заказывать хоть каждый день.
Когда переезжал в ЛА, первый месяц днём работал айтишником, а вечером — грузчиком и хэндимэном: собирал мебель, покупал телевизор, диван, столы, стулья, посуду — короче, весь дом.
Дубайск в этом плане вообще халява. Квартиры часто сдаются с мебелью. Машину можно арендовать через чатик в телеграме — и её доставят прямо к дому. Мне остаётся только сидеть на диване и ковырять в носу. Кстати, про диван — он провонял потным дядькой, который до нас на нем провел лето. Так что в квартирах без мебели всё же есть свои плюсы.
😁12🔥1
Дмитрий Савостьянов Вещает
А есть тут дотеры, которые еще катают пабы? Ищу пару человек, кто готов потестить мои наработки по DotaGPT. Поставьте плз плюсик в комменты, я вам в лс скину ссылку на тг-бота.
Обновил GPT для Dota 2.
Причесал внешний вид сообщений и добавил хранение истории. Кажется начинает вырисовываться что-то прикалдесное.
Дальше подумываю завести машину лернинга, чтобы модель совершала меньше ошибок в запросах к игровой базе данных и за счет этого быстрее отвечала.
Причесал внешний вид сообщений и добавил хранение истории. Кажется начинает вырисовываться что-то прикалдесное.
Дальше подумываю завести машину лернинга, чтобы модель совершала меньше ошибок в запросах к игровой базе данных и за счет этого быстрее отвечала.
👍6❤1
Конец медового месяца.
Что могу сказать про Дубай месяц спустя. Мне доводилось заниматься оформлением документов в трёх странах: Литве, США и ОАЭ. В Дубае оказалось проще всего получить ВНЖ. Мне не пришлось открывать здесь компанию, доказывать экстраординарность, клясться в любви и верности. Я просто принёс справку о зарплате, прошёл медосмотр и получил virtual work visa на год. На всё про всё ушло три недели.
Из плохих новостей — сам процесс оформления стоит ~$10k на семью из трёх человек. Половина — госпошлины, вторая половина — комиссия помогающей конторы. Не хотелось бы платить столько каждый год.
Дальше больше: когда снимаете квартиру, вы платите чеками за 3–6 месяцев вперёд + 10% депозит от суммы годовой аренды + 5% комиссии риелтору в первый месяц. Итого, чтобы снять 2 bedroom в приличном районе, сходу отдаёте ~$25k.
Но и это ещё не всё. При оформлении долгосрочной аренды оплату просят чеком от местного банка. ВНЖ я получил 10 дней назад, а счёт мне до сих пор не открыли. И это при том, что у меня есть счета в Литве и США, банковские выписки и ЗП от американской компании.
Поэтому пока я не могу заплатить за долгосрочную аренду, приходится перебиваться Airbnb-квартирами, которые легко могут выходить в ~$2к в неделю.
Так что Америка, Дубай — звучит заебись, конечно. Но стоит всё это удовольствие недёшево.
Что могу сказать про Дубай месяц спустя. Мне доводилось заниматься оформлением документов в трёх странах: Литве, США и ОАЭ. В Дубае оказалось проще всего получить ВНЖ. Мне не пришлось открывать здесь компанию, доказывать экстраординарность, клясться в любви и верности. Я просто принёс справку о зарплате, прошёл медосмотр и получил virtual work visa на год. На всё про всё ушло три недели.
Из плохих новостей — сам процесс оформления стоит ~$10k на семью из трёх человек. Половина — госпошлины, вторая половина — комиссия помогающей конторы. Не хотелось бы платить столько каждый год.
Дальше больше: когда снимаете квартиру, вы платите чеками за 3–6 месяцев вперёд + 10% депозит от суммы годовой аренды + 5% комиссии риелтору в первый месяц. Итого, чтобы снять 2 bedroom в приличном районе, сходу отдаёте ~$25k.
Но и это ещё не всё. При оформлении долгосрочной аренды оплату просят чеком от местного банка. ВНЖ я получил 10 дней назад, а счёт мне до сих пор не открыли. И это при том, что у меня есть счета в Литве и США, банковские выписки и ЗП от американской компании.
Поэтому пока я не могу заплатить за долгосрочную аренду, приходится перебиваться Airbnb-квартирами, которые легко могут выходить в ~$2к в неделю.
Так что Америка, Дубай — звучит заебись, конечно. Но стоит всё это удовольствие недёшево.
🫡12😭4❤2🤔1
Добрался до нового подкаста с Ильей Суцкевером. Сделал заметки о том, что мне показалось интересным.
Сейчас люди скейлят RL и создают много специализированных сред. Но кто «сильнее»: студент, который провёл 10 000 часов и тащит в competitive programming, или тот, кто потратил всего 100 и тоже показывает бодрый уровень?
Value function в RL позволяет не ждать конца траектории и прикинуть, стоит ли идти дальше. В шахматах потеря фигуры — сильный сигнал ещё до конца партии. Можно учиться и без value function, но тогда процесс гораздо медленнее.
Человек без эмоций мог решать пазлы, но не мог принимать даже базовые решения вроде выбора носков — не говоря уже о финансах.
Эволюция дала людям сильные priors: зрение, слух, locomotion (умение ходить и ориентироваться в пространстве).
Подросток учится водить. У него нет формального reward и контролируемой среды в RL-смысле, но есть позитивное подкрепление и ожидание подкрепления через эмоции. Не нужно час ехать до точки B: достаточно маленькой победы — тронуться с места.
Трансформер обучался на 8–64 GPU. Не было ни одного эксперимента больше 64; «по нынешним меркам как сколько? 2 GPU?» (с)
Pretrain хорош тем, что не надо выбирать данные: модели дают всё, что есть. Текст — проекция мира и человеческой деятельности. С ростом модели, компьюта и данных pretrain улучшает почти всё сразу — своего рода рецепт к AGI. RL, наоборот, уводит в нишевые юзкейсы, получается Narrow AI. См. аргумент в начале про competitive programming.
Из недавнего подкаста с Карпатым: большие датасеты ведут к запоминанию фактов и галлюцинациям. Хотелось бы небольшие модели с высоким интеллектом, не перегруженные фактами.
AGI по OpenAI — система, способная выполнять любую человеческую работу. Superintelligence по Суцкеверу — система, которая может научиться выполнять любую человеческую работу.
Хороших идей меньше, чем компаний. Все зациклились на self-improving AI, но нужен AI, robustly aligned to care about sentient life. Потому что в какой-то момент AI сам станет разумной жизнью, и «особей» AI будет больше, чем людей.
Если сделать тысячи копий Ильи, будет ли прогресс? Возможно, нет: разнообразие людей, мнений и идей важнее. А pretrain «на всём интернете» может убивать diversity.
Self-play был привлекателен тем, что позволял учить без заботы о данных — нужен только compute. Но ранние реализации выходили слишком нишевыми: можно играть в доту, но обобщение слабое.
Соревнования между агентами могут создать необходимость дифференциации, чтобы агенты отличались друг от друга. Аналогия с рынками и маркетингом.
Из подкаста с Карпатым: если использовать LLM как reward-модель для других LLM, RL быстро находит баги в предсказаниях самой LLM, и обучение коллапсирует.
Мы не знаем, как строить superintelligence, но стоит фокусироваться на understanding of reliable generalisation — этим занимается SSI.
Когда люди делегируют всё персональному AI, они потеряют контроль и вовлечённость. Нейроинтерфейс «человек+AI» — потенциально может это исправить.
Как эволюция заложила социальные желания? С едой всё понятно: химия, запах, аппетит. Но почему людям важно общаться с успешными и получать одобрение? Как за сравнительно короткий срок это «закодировалось» в мозге? Хороших ответов пока нет.
Моя мысль (не дает прямого ответа, как это кодируется в мозге): выживание — распознавание намерений других и классификация «свой/чужой». Размножение — поиск более «успешной» особи, повышающий шанс выживания и успешного потомства. Понятие «успешности» не жёстко прошито и трактуется культурой по-разному на разных этапах эволюции.
Подход Ильи к ресёрчу: смотреть, как устроены люди и мозг, и переносить принципы в deep learning. Если что-то надёжно работает у нас, есть смысл верить, что это сработает в ИИ. Эта вера помогает не сдаваться в периоды неудачных экспериментов.
https://youtu.be/aR20FWCCjAs?si=pNDsCuMAXgONsXGY
Сейчас люди скейлят RL и создают много специализированных сред. Но кто «сильнее»: студент, который провёл 10 000 часов и тащит в competitive programming, или тот, кто потратил всего 100 и тоже показывает бодрый уровень?
Value function в RL позволяет не ждать конца траектории и прикинуть, стоит ли идти дальше. В шахматах потеря фигуры — сильный сигнал ещё до конца партии. Можно учиться и без value function, но тогда процесс гораздо медленнее.
Человек без эмоций мог решать пазлы, но не мог принимать даже базовые решения вроде выбора носков — не говоря уже о финансах.
Эволюция дала людям сильные priors: зрение, слух, locomotion (умение ходить и ориентироваться в пространстве).
Подросток учится водить. У него нет формального reward и контролируемой среды в RL-смысле, но есть позитивное подкрепление и ожидание подкрепления через эмоции. Не нужно час ехать до точки B: достаточно маленькой победы — тронуться с места.
Трансформер обучался на 8–64 GPU. Не было ни одного эксперимента больше 64; «по нынешним меркам как сколько? 2 GPU?» (с)
Pretrain хорош тем, что не надо выбирать данные: модели дают всё, что есть. Текст — проекция мира и человеческой деятельности. С ростом модели, компьюта и данных pretrain улучшает почти всё сразу — своего рода рецепт к AGI. RL, наоборот, уводит в нишевые юзкейсы, получается Narrow AI. См. аргумент в начале про competitive programming.
Из недавнего подкаста с Карпатым: большие датасеты ведут к запоминанию фактов и галлюцинациям. Хотелось бы небольшие модели с высоким интеллектом, не перегруженные фактами.
AGI по OpenAI — система, способная выполнять любую человеческую работу. Superintelligence по Суцкеверу — система, которая может научиться выполнять любую человеческую работу.
Хороших идей меньше, чем компаний. Все зациклились на self-improving AI, но нужен AI, robustly aligned to care about sentient life. Потому что в какой-то момент AI сам станет разумной жизнью, и «особей» AI будет больше, чем людей.
Если сделать тысячи копий Ильи, будет ли прогресс? Возможно, нет: разнообразие людей, мнений и идей важнее. А pretrain «на всём интернете» может убивать diversity.
Self-play был привлекателен тем, что позволял учить без заботы о данных — нужен только compute. Но ранние реализации выходили слишком нишевыми: можно играть в доту, но обобщение слабое.
Соревнования между агентами могут создать необходимость дифференциации, чтобы агенты отличались друг от друга. Аналогия с рынками и маркетингом.
Из подкаста с Карпатым: если использовать LLM как reward-модель для других LLM, RL быстро находит баги в предсказаниях самой LLM, и обучение коллапсирует.
Мы не знаем, как строить superintelligence, но стоит фокусироваться на understanding of reliable generalisation — этим занимается SSI.
Когда люди делегируют всё персональному AI, они потеряют контроль и вовлечённость. Нейроинтерфейс «человек+AI» — потенциально может это исправить.
Как эволюция заложила социальные желания? С едой всё понятно: химия, запах, аппетит. Но почему людям важно общаться с успешными и получать одобрение? Как за сравнительно короткий срок это «закодировалось» в мозге? Хороших ответов пока нет.
Моя мысль (не дает прямого ответа, как это кодируется в мозге): выживание — распознавание намерений других и классификация «свой/чужой». Размножение — поиск более «успешной» особи, повышающий шанс выживания и успешного потомства. Понятие «успешности» не жёстко прошито и трактуется культурой по-разному на разных этапах эволюции.
Подход Ильи к ресёрчу: смотреть, как устроены люди и мозг, и переносить принципы в deep learning. Если что-то надёжно работает у нас, есть смысл верить, что это сработает в ИИ. Эта вера помогает не сдаваться в периоды неудачных экспериментов.
https://youtu.be/aR20FWCCjAs?si=pNDsCuMAXgONsXGY
❤6
Творческий порыв.
Сегодня проснулся в 3 утра и не мог уснуть. Плевал в потолок и думал, чем бы заняться. В какой-то момент задумался: а что, если бы я был профессором? Как выглядели бы мои лекции?
И, знаете, бывает у меня порой непреодолимое желание пошалить. Навалить кринжа, дать волю Дмитрию Альфа-Матач Михайловичу — такого, что покажешь жене, и её с первых секунд накрывает испанский стыд.
Дамы и господа, встречайте: моя авторская лекция по матану — без подготовки, (почти) монтажа и перезаписи. Бегите смотреть и искать ошибки, пока не удалил.
https://youtu.be/P03P5UNGiBw
Сегодня проснулся в 3 утра и не мог уснуть. Плевал в потолок и думал, чем бы заняться. В какой-то момент задумался: а что, если бы я был профессором? Как выглядели бы мои лекции?
И, знаете, бывает у меня порой непреодолимое желание пошалить. Навалить кринжа, дать волю Дмитрию Альфа-Матач Михайловичу — такого, что покажешь жене, и её с первых секунд накрывает испанский стыд.
Дамы и господа, встречайте: моя авторская лекция по матану — без подготовки, (почти) монтажа и перезаписи. Бегите смотреть и искать ошибки, пока не удалил.
https://youtu.be/P03P5UNGiBw
YouTube
Введение в МАТЕМАТИЧЕСКИЙ АНАЛИЗ для ВЗРОСЛЫХ МУЖИКОВ
Авторский взгляд на то, как читать лекции, которые оставляют после себя бархатное послевкусье. Все факты вымышленные, а доказательства неверные. Если хотите научиться математике, лучше пропустите это видео.
---
Не подписывайтесь на мой телеграм, ведь там…
---
Не подписывайтесь на мой телеграм, ведь там…
2🔥12👍8😁4❤3
Про историю AI
В Америке я играл в футбол с мужиками по субботам. После игры мы садились на раскладные стулья на парковке, доставали из машин кальян и пивас, и зависали. С теплотой вспоминаю эти вечера и с кайфом залетел бы еще.
В Дубае суть вечеринок осталась прежней: берем пивас и болтаем за жизнь, но слегка поменялись декорации. Здесь я попал в тусовку олдов ODS, которые зависают на виллах с ламбой в гараже, выходят в море на яхтах и жестко флексят. Фотка прилагается.
Драйвером и организатором наших тусовок является некий Роман (второй слева на фотке). Он читает этот канал еще с тех пор, как здесь было 30 подписчиков. Катает в доту под блюз-каверы на Пашу Техника. Является сооснователем компании Optic, про которую вы могли слышать в недавнем выпуске у Дудя.
Человек-легенда, мэтр, почти лысый из бразерс — Роман Доронин. Под фразу “А хули, нет?” он запустил свой канал, где будет рассказывать про себя, про историю AI и людей, которые его создавали.
Будет интересно. В худшем случае — нет. Пока не подпишешься, не узнаешь. Вперед: https://news.1rj.ru/str/doronin_aiforfriends
В Америке я играл в футбол с мужиками по субботам. После игры мы садились на раскладные стулья на парковке, доставали из машин кальян и пивас, и зависали. С теплотой вспоминаю эти вечера и с кайфом залетел бы еще.
В Дубае суть вечеринок осталась прежней: берем пивас и болтаем за жизнь, но слегка поменялись декорации. Здесь я попал в тусовку олдов ODS, которые зависают на виллах с ламбой в гараже, выходят в море на яхтах и жестко флексят. Фотка прилагается.
Драйвером и организатором наших тусовок является некий Роман (второй слева на фотке). Он читает этот канал еще с тех пор, как здесь было 30 подписчиков. Катает в доту под блюз-каверы на Пашу Техника. Является сооснователем компании Optic, про которую вы могли слышать в недавнем выпуске у Дудя.
Человек-легенда, мэтр, почти лысый из бразерс — Роман Доронин. Под фразу “А хули, нет?” он запустил свой канал, где будет рассказывать про себя, про историю AI и людей, которые его создавали.
Будет интересно. В худшем случае — нет. Пока не подпишешься, не узнаешь. Вперед: https://news.1rj.ru/str/doronin_aiforfriends
1👍5😁3❤2