Тут провели так называемую Альфа Арену где заставили разные нейросети торговать на крипто бирже, каждой выдали по $10k денег. У Бориса горит с того что куча телеграм каналов и СМИ восприняли этот нулевой по ценности "бенчмарк" как что-то что реально отражает интеллектуальные способности нейросетей.
Вот тут он пишет подробнее про то почему это совершенно бессмысленный бенчмарк (на инглише): https://borisagain.substack.com/p/why-alpha-arena-is-literally-the
"Победил" в этом состязании Квен, но с тем же успехом они могли бы сравнивать генераторы рандомных чисел, нейросетям не дали ни достаточного количества информации, ни достаточного количества времени, ни инструментов.
Да и сам крипторынок это максимально рандомная среда, на момент проведения "эксперемента" весь крипторынок падал так что все нейросети, закономерно, ушли в минус.
Но мы действительно получили полезную информацию, не о нейросетях, но о телеграм каналах которые с восторгами писали про Альфа Арену и всерьез оценивали ее "результаты".
Вот тут он пишет подробнее про то почему это совершенно бессмысленный бенчмарк (на инглише): https://borisagain.substack.com/p/why-alpha-arena-is-literally-the
"Победил" в этом состязании Квен, но с тем же успехом они могли бы сравнивать генераторы рандомных чисел, нейросетям не дали ни достаточного количества информации, ни достаточного количества времени, ни инструментов.
Да и сам крипторынок это максимально рандомная среда, на момент проведения "эксперемента" весь крипторынок падал так что все нейросети, закономерно, ушли в минус.
Но мы действительно получили полезную информацию, не о нейросетях, но о телеграм каналах которые с восторгами писали про Альфа Арену и всерьез оценивали ее "результаты".
Substack
Why Alpha Arena is literally the worst
How not to make a benchmark. Also: keep your grifting off my AI lawn.
🔥2👍1
Сделал шорт из того самого момента на стриме когда Гигачат попытался угадать по скриншоту игру Смута (думаю все кто присутствовал запомнили это):
https://www.youtube.com/shorts/KziLSFtKpwo - ютуб.
https://www.tiktok.com/@tosternoscript/video/7570065138468801800 - да, я завел себе тиктак.
В конце шорта будет камео чата Твича 😉.
https://www.youtube.com/shorts/KziLSFtKpwo - ютуб.
https://www.tiktok.com/@tosternoscript/video/7570065138468801800 - да, я завел себе тиктак.
В конце шорта будет камео чата Твича 😉.
YouTube
Смогут ли ИИ отгадать игру Смута по скриншоту? #ai #нейросети #нейросетьзахватитмир #смута
Это был фрагмент с моего стрима, что бы не пропустить будущие трансляции подписывайтесь на мой телеграм канал: 📡 https://news.1rj.ru/str/TosterScript - там я сообщаю о...
👏12❤1
Тут к моему шорту кто-то написал коммент что Алиса смогла отгадать игру Смута, я решил проверить в веб интерфейсе, и да, она реально угадала.
Для справедливости я пошел в веб интерфейс Гигачата и спросил тот же самый вопрос с тем же скриншотом, и он ответил... что это Pathfinder: Kingmaker 😕.
Короче, Яндекс, если ты меня слышишь, выкатывай уже в API доступ распознавание картинок.
Для справедливости я пошел в веб интерфейс Гигачата и спросил тот же самый вопрос с тем же скриншотом, и он ответил... что это Pathfinder: Kingmaker 😕.
Короче, Яндекс, если ты меня слышишь, выкатывай уже в API доступ распознавание картинок.
👍20❤1🤮1
Сегодня, как и всегда по воскресеньям, я запущу стрим в 20:00 по МСК. Попробуем вместе с нейросетями составить еще один Тирлист, в прошлый раз получилось так себе, но думаю сегодня будет лучше.
Будем составлять тирлист российских айти компаний, с категориями от "фейк айти" и до "айти компания мирового уровня".
Стрим пройдет здесь: https://www.twitch.tv/tosternoscript
Будем составлять тирлист российских айти компаний, с категориями от "фейк айти" и до "айти компания мирового уровня".
Стрим пройдет здесь: https://www.twitch.tv/tosternoscript
👍9👀3
Вайлдберрис выпустили свой определитель сгенерированных картинок: https://habr.com/ru/news/964822/
Я его потестил, ну короче ребята, был такой художник, Васнецов, все это время он нас обманывал, не рисовал он свои картины, сплошная генерация. Срочно выносим его из музеев.
Я его потестил, ну короче ребята, был такой художник, Васнецов, все это время он нас обманывал, не рисовал он свои картины, сплошная генерация. Срочно выносим его из музеев.
😁45🤣15😭4❤1
Вот уже почти месяц я работаю над новым проектом, и наконец-то могу его анонсировать, встречайте Мафию с Нейросетями.
Уже в это воскресенье, в 20:00 по МСК, я проведу первую тестовую игру в Мафию с Нейросетями, проходить все будет на Твиче в прямом эфире: https://www.twitch.tv/tosternoscript
Это будет именно тест, я пока еще ни разу не пробовал запускать игру с мощными нейросетями типа ЧатГПТ или Гемини, так что я без понятия как они будут играть, пока я пробовал запускать только с самыми дешевыми моделями.
Сейчас в игре есть: 1 игрок за мафию, остальные мирные. Ночь, день, обсуждения, оправдательные речи, голосования, казнь, короче реализованы все основные механики.
Это базовый вариант игры, если с ним все будет ок то будем дальше увеличивать количество игроков, ролей, и тд, планов у меня на Мафию много, в том числе у меня есть идеи которые возможно реализовать в Мафии только при помощи нейросетей.
Уже в это воскресенье, в 20:00 по МСК, я проведу первую тестовую игру в Мафию с Нейросетями, проходить все будет на Твиче в прямом эфире: https://www.twitch.tv/tosternoscript
Это будет именно тест, я пока еще ни разу не пробовал запускать игру с мощными нейросетями типа ЧатГПТ или Гемини, так что я без понятия как они будут играть, пока я пробовал запускать только с самыми дешевыми моделями.
Сейчас в игре есть: 1 игрок за мафию, остальные мирные. Ночь, день, обсуждения, оправдательные речи, голосования, казнь, короче реализованы все основные механики.
Это базовый вариант игры, если с ним все будет ок то будем дальше увеличивать количество игроков, ролей, и тд, планов у меня на Мафию много, в том числе у меня есть идеи которые возможно реализовать в Мафии только при помощи нейросетей.
👍26❤7🥰2👌1🍾1
Уже совсем скоро, в 20:00 по МСК я запущу первый стрим по Мафии с Нейросетями, на Твиче: https://www.twitch.tv/tosternoscript
Это будет тестовый стрим, я конечно тестировал как оно работает, но совсем немного, более того, я ни разу не довел ни одной игры до конца. Хочу что бы полноценная игра впервые прошла именно в эфире (впрочем я не гарантирую этого, есть шанс что все сломается, ну для этого и тестируем).
Попробуем сыграть с этими игроками: ЧатГПТ, Дипсик, Мистраль, ЯндексГПТ, Грок, Гемма.
ЧатГПТ, ЯндексГПТ и Грока я ни разу не проверял, так что я вообще без понятия как они будут играть в мафию.
Это будет тестовый стрим, я конечно тестировал как оно работает, но совсем немного, более того, я ни разу не довел ни одной игры до конца. Хочу что бы полноценная игра впервые прошла именно в эфире (впрочем я не гарантирую этого, есть шанс что все сломается, ну для этого и тестируем).
Попробуем сыграть с этими игроками: ЧатГПТ, Дипсик, Мистраль, ЯндексГПТ, Грок, Гемма.
ЧатГПТ, ЯндексГПТ и Грока я ни разу не проверял, так что я вообще без понятия как они будут играть в мафию.
Twitch
TosterScript - Twitch
Мафия с Нейросетями: Фэнтези Таверна
❤6
Стрим Мафия с Нейросетями запущен: https://www.twitch.tv/tosternoscript заходите!
Twitch
TosterScript - Twitch
Мафия с Нейросетями: Фэнтези Таверна
❤4
В "Яндексе" отметили активный переход пользователей на российские нейросети: https://tass.ru/obschestvo/25688283
Яндекс тут хвалит сам себя. Но вообще я действительно думаю что для бытовых вопросов российские нейросети постепенно будут отхватывать свою долю, в первую очередь за счет интеграции российских сервисов (всякие там яндекс карты и прочие маркетплейсы), а не за счет "локального контекста и культурного кода" про который очень много говорят, но которого лично я пока не очень заметил (хотя скоро проверим это на стримах).
Яндекс тут хвалит сам себя. Но вообще я действительно думаю что для бытовых вопросов российские нейросети постепенно будут отхватывать свою долю, в первую очередь за счет интеграции российских сервисов (всякие там яндекс карты и прочие маркетплейсы), а не за счет "локального контекста и культурного кода" про который очень много говорят, но которого лично я пока не очень заметил (хотя скоро проверим это на стримах).
TACC
В "Яндексе" отметили активный переход пользователей на российские нейросети
По данным компании, весной на рынке лидировали зарубежные решения, но с лета они стали терять аудиторию
❤4🥰2😁2🤡2
Меня раздражает что когда речь идет о ГигаЧате и о ЯндексГПТ говорят именно об официальных веб приложениях и ботах, но вообще не говорят об API, а там довольно печальная ситуация, особенно ситуация с ценами.
Допустим я преисполнился и решил создать приложение на основе Гигачата, потому что там культурный код и российский контекст, окей, идем в https://developers.sber.ru/docs/ru/gigachat/tariffs/individual-tariffs и смотрим цены.
1 000 000 токенов GigaChat 2 Max стоит 1 950 ₽ (при чем еще у них есть срок действия, через 12 месяцев они сгорят 🤦♂️ но сейчас не об этом).
Сбер не указывает цены раздельно для исходящих и входящих токенов, я так понимаю что это значит что они одинаковые.
Окей выходит что в долларах цена ГигаЧата Max по API это: $24.15 за миллион токенов (по текущему курсу ЦБ).
Для сравнения, Gemini 3 Pro, модель которая считается одной из самых умных моделей на данный момент, в опенроутере стоит таких денег за миллион токенов (https://openrouter.ai/google/gemini-3-pro-preview):
input ≤200K $2 | >200K $4
output: ≤200K $12 | >200K $18
Самые дорогие токены это исходящие токены и если их больше 200k (что для исходящих токенов редкость, нагенерить 200 тысяч токенов нужно еще постараться, это какие-то Очень большие задачи по написанию кода, или просьба написать целую книгу).
Ну то есть вы понимаете? Самая крутая из существующих на данный момент моделей требует $18 за миллион токенов в самой дорогой из возможных ситуаций.
В обычной ситуации, скажем, если это чат, большая часть токенов будет входящими, и ответы нейросети и близко не подойдут к 200k, так что реально цена будет сильно меньше 18$ за миллион токенов.
Тем временем ГигаЧат Max стоит $24.15 за миллион токенов 😕.
А ведь Гемини это довольно дорогая модель, вот цены grok-а: https://openrouter.ai/x-ai/grok-4-fast
Input: ≤128K $0.20 | >128K $0.40
Output: ≤128K $0.50 | >128K $1
Один доллар за миллион исходящих токенов! И это если их больше 128K. Один самый дорогой токен Грока стоит в двадцать четыре раза дешевле одного токена ГигаЧата. Это просто ценовая пропасть.
Цены ГигаЧата совершенно не конкурентные, юзера который юзает гигачат в вебе или в официальном боте это не касается, но разработчиков которые хотели бы юзать отечественную нейросеть, а не забугроную для своих приложений это касается напрямую.
Допустим я преисполнился и решил создать приложение на основе Гигачата, потому что там культурный код и российский контекст, окей, идем в https://developers.sber.ru/docs/ru/gigachat/tariffs/individual-tariffs и смотрим цены.
1 000 000 токенов GigaChat 2 Max стоит 1 950 ₽ (при чем еще у них есть срок действия, через 12 месяцев они сгорят 🤦♂️ но сейчас не об этом).
Сбер не указывает цены раздельно для исходящих и входящих токенов, я так понимаю что это значит что они одинаковые.
Окей выходит что в долларах цена ГигаЧата Max по API это: $24.15 за миллион токенов (по текущему курсу ЦБ).
Для сравнения, Gemini 3 Pro, модель которая считается одной из самых умных моделей на данный момент, в опенроутере стоит таких денег за миллион токенов (https://openrouter.ai/google/gemini-3-pro-preview):
input ≤200K $2 | >200K $4
output: ≤200K $12 | >200K $18
Самые дорогие токены это исходящие токены и если их больше 200k (что для исходящих токенов редкость, нагенерить 200 тысяч токенов нужно еще постараться, это какие-то Очень большие задачи по написанию кода, или просьба написать целую книгу).
Ну то есть вы понимаете? Самая крутая из существующих на данный момент моделей требует $18 за миллион токенов в самой дорогой из возможных ситуаций.
В обычной ситуации, скажем, если это чат, большая часть токенов будет входящими, и ответы нейросети и близко не подойдут к 200k, так что реально цена будет сильно меньше 18$ за миллион токенов.
Тем временем ГигаЧат Max стоит $24.15 за миллион токенов 😕.
А ведь Гемини это довольно дорогая модель, вот цены grok-а: https://openrouter.ai/x-ai/grok-4-fast
Input: ≤128K $0.20 | >128K $0.40
Output: ≤128K $0.50 | >128K $1
Один доллар за миллион исходящих токенов! И это если их больше 128K. Один самый дорогой токен Грока стоит в двадцать четыре раза дешевле одного токена ГигаЧата. Это просто ценовая пропасть.
Цены ГигаЧата совершенно не конкурентные, юзера который юзает гигачат в вебе или в официальном боте это не касается, но разработчиков которые хотели бы юзать отечественную нейросеть, а не забугроную для своих приложений это касается напрямую.
Sber Developers Documentation
Документация для разработчиков
Тарифы GigaChat API для физлиц | Нейросетевая модель от Сбера на русском языке
👍13❤1
Возможно вы слышали что кокакола снимает ии рекламу каждый год: https://news.1rj.ru/str/disruptors_official/2998
Каждый раз их адски хейтят в интернете за это, куча гневных твитов, куча видосов на ютубе про то какая кокакола плохая и тд.
Но зачем кокакола продолжают это делать? Вряд ли из-за экономии, для кокаколы это копейки.
Думаю причины две:
1) это реклама вообще не для широкой аудитории, это реклама для инвесторов, кокакола показывает что они в тренде и в теме ии.
2) хейт это внимание, всем уже давно было плевать на рекламу с красными грузовиками, а тут взрыв внимания, требования вернуть все как было и тд. По этой же причине они снимают рекламу подчеркнуто ии-сгенерированной, что бы вот прям было видно что все иишно-пластиковое.
Каждый раз их адски хейтят в интернете за это, куча гневных твитов, куча видосов на ютубе про то какая кокакола плохая и тд.
Но зачем кокакола продолжают это делать? Вряд ли из-за экономии, для кокаколы это копейки.
Думаю причины две:
1) это реклама вообще не для широкой аудитории, это реклама для инвесторов, кокакола показывает что они в тренде и в теме ии.
2) хейт это внимание, всем уже давно было плевать на рекламу с красными грузовиками, а тут взрыв внимания, требования вернуть все как было и тд. По этой же причине они снимают рекламу подчеркнуто ии-сгенерированной, что бы вот прям было видно что все иишно-пластиковое.
Telegram
Дизраптор
Анти-эйай-вошинг
Помните, пару недель назад Coca Cola выпустила очередную новогоднюю рекламу, но на этот раз изрядно хлебнула говнеца? Потому что реклама оказалась полностью AI-generated. Люди возмутились, что поганая корпорация превратила уютный и любимый…
Помните, пару недель назад Coca Cola выпустила очередную новогоднюю рекламу, но на этот раз изрядно хлебнула говнеца? Потому что реклама оказалась полностью AI-generated. Люди возмутились, что поганая корпорация превратила уютный и любимый…
🤬3❤2🍓1
Сделал шорт в догонку к вопросу про "российский контекст" у Яндекс Алисы и Сберовского Гигачата, я попросил их нарисовать Деда Мороза, получилось ли это у них?
https://youtube.com/shorts/tKjIwo90Tfk
https://www.tiktok.com/@tosternoscript/video/7575620832223857937
https://youtube.com/shorts/tKjIwo90Tfk
https://www.tiktok.com/@tosternoscript/video/7575620832223857937
YouTube
Смогут ли российские ИИ нарисовать Деда Мороза? #ai #нейросети #новыйгод #дедмороз #алиса #гигачат
Настоящие испытание для Яндекс Алисы и ГигаЧата! Способны ли эти нейросети нарисовать Деда Мороза?Подписывайтесь на мой телеграм канал: https://news.1rj.ru/str/TosterSc...
😁6👍2🍓1
Сегодня, в 20:00 по МСК в прямом эфире пройдет игра Мафия с Нейросетями!
Все будет происходить на📱 Твиче: https://www.twitch.tv/tosternoscript
Сегодня у нас будет аж 8 нейросетей, при чем одна из них - Gemini 3 pro, та самая модель от Гугла которая вышла на этой неделе и которая по многим бенчмаркам показывает самые лучшие результаты. Вполне возможно что это самая умная нейросеть в мире. Вот и посмотрим как она будет играть в Мафию.
А вторым новым участником станет... ГигаЧат! Мне было интересно посмотреть как себя покажет ГигаЧат в играх в Мафию, так что я решил добавить именно его.
Я так же обновил модель у Грока, у него тоже вышло недавно обновление, про него особо не говорили (выход Гемини все затмил), но будет интересно посмотреть как он себя покажет.
Буду всех ждать!
Все будет происходить на
Сегодня у нас будет аж 8 нейросетей, при чем одна из них - Gemini 3 pro, та самая модель от Гугла которая вышла на этой неделе и которая по многим бенчмаркам показывает самые лучшие результаты. Вполне возможно что это самая умная нейросеть в мире. Вот и посмотрим как она будет играть в Мафию.
А вторым новым участником станет... ГигаЧат! Мне было интересно посмотреть как себя покажет ГигаЧат в играх в Мафию, так что я решил добавить именно его.
Я так же обновил модель у Грока, у него тоже вышло недавно обновление, про него особо не говорили (выход Гемини все затмил), но будет интересно посмотреть как он себя покажет.
Буду всех ждать!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤1
Стрим Мафия с Нейросетями начался! Заходите: https://www.twitch.tv/tosternoscript
Twitch
TosterScript - Twitch
Мафия с Нейросетями: Фэнтези Таверна
👍10
Изначально когда я начал писать код при помощи нейросетей я придерживался принципа что весь сгенерированный код нужно ревьювить.
Я и сейчас так делаю, но в последнее время я, как-то даже не заметно для себя, начал делать наоборот. Я пишу код и отдают его на ревью нейронке.
Выходит очень не плохо, мне даже так нравиться больше, GPT Codex реально хорошо ревьювит и предлагает улучшения. При этом не нужно мучиться над промптом - он просто из самого написанного кода понимает что этот код должен делать. Код для ревью это одновременно и промпт.
Было бы вообще идеально если бы каждый мой коммит GPT Codex сам проверял прямо в vs code, не знаю, может такое уже есть в каком нибудь Cursor?
Я и сейчас так делаю, но в последнее время я, как-то даже не заметно для себя, начал делать наоборот. Я пишу код и отдают его на ревью нейронке.
Выходит очень не плохо, мне даже так нравиться больше, GPT Codex реально хорошо ревьювит и предлагает улучшения. При этом не нужно мучиться над промптом - он просто из самого написанного кода понимает что этот код должен делать. Код для ревью это одновременно и промпт.
Было бы вообще идеально если бы каждый мой коммит GPT Codex сам проверял прямо в vs code, не знаю, может такое уже есть в каком нибудь Cursor?
👍15✍2
👆 и я вот, к слову, не знаю какой вообще можно привести аргумент против применения нейросетей для ревью кода, есть в телеге противники использования нейросетей для написания кода типа @antonvolkov, и с какими-то его аргументами можно согласиться.
Но вот какой аргумент против применения нейросетей для проверки кода можно применить? Типа, уровень стресса слишком сильно повыситься у разрабов от того что генератор слов будет указывать на ошибки и проблемы в коде?
Но вот какой аргумент против применения нейросетей для проверки кода можно применить? Типа, уровень стресса слишком сильно повыситься у разрабов от того что генератор слов будет указывать на ошибки и проблемы в коде?
👍7🔥2
Forwarded from Pavel Zloi
Хабр
Джун наоборот или разоблачение главного мифа вайб-кодинга
Вчера (27 ноября) Хабр устроил «Авторский огонёк». Было очень интересно, и меня задело одно утверждение докладчика. Оно заключалось в том, что ИИ может помочь писать простые куски кода, но не работает...
С огромным удовольствием прочёл публикацию "Джун наоборот или разоблачение главного мифа вайб-кодинга" на Хабр, в ней автор на примере задачки по баллистике продемонстрировал, что модельки (хотя правильнее пожалуй будет сказать кодинговые агенты) хорошо справляются с задачами сложными, высокоуровневыми и плохо с задачками простыми.
Эта публикация очень занятная, так как к подобным мыслям я тоже некоторое время назад пришёл, модельке надо давать строгие правила поведения и архитектуры, пусть она соберёт каркас, а потом внимательно, класс за классом (с тестами само собой) пусть пишет код.
Эта публикация очень занятная, так как к подобным мыслям я тоже некоторое время назад пришёл, модельке надо давать строгие правила поведения и архитектуры, пусть она соберёт каркас, а потом внимательно, класс за классом (с тестами само собой) пусть пишет код.
👍2👎1