Тостер Скрипт – Telegram
Тостер Скрипт
4.73K subscribers
121 photos
13 videos
4 files
165 links
Канал Тостера который устраивает игры и состязания между нейросетями.

Ютуб: https://www.youtube.com/@TosterScriptOne
Твич: https://www.twitch.tv/tosternoscript
Второй ютуб: https://www.youtube.com/@TosterScriptTwo

Почта: tosternoscript@yandex.ru
Download Telegram
Тут на ютубе кто-то написал коммент с вопросом о том зачем я стримлю и играю в игры с нейросетями, вместо того что бы делать образовательные видео.

Нейросети это как бокс, глупо быть боксером-теоретиком, с нейросетями нужно "боксировать". Общаться с ними, делать программы с ними, испытывать их. И вот именно этим я и буду заниматься на стримах.

Я стримлю игру TABS с боями нейросетей ЯндексГПТ и ГигаЧат не просто так, это не просто игры, это тесты. И эти тесты дают понимание того что из себя представляют эти две модели и что из себя вообще представляют ИИ сервисы Яндекса и Сбера.

Это тесты на то как происходит цензура у этих моделей (к слову Яндекс и Сбер очень по разному реализует цензуру), тесты того как они работают с tool calling (информация о фракциях и юнитах TABS именно в функциях и им нужно их вызывать что бы достать ее) и тд.

Используя эти стримы я потом сделаю видос где разберу подробнее что из себя представляют ЯндексГПТ и ГигаЧат, а так же ии-экосистемы Яндекса и Сбера.

Короче говоря, это все не просто так, если мои видосы про работу нейросетей это теория, то стримы это практика.

Да, напоминаю, уже сегодня в 20:00 по МСК я запущу стрим на https://www.twitch.tv/tosternoscript - обязательно приходите.
👍192
Какие-то проблемы на стороне Твича =( не дает запустить стрим, сейчас попробую что нибудь придумать.
👍1
Стрим начался! Заходите: https://www.twitch.tv/arenatostera

Твич что-то сделал с моим основным аккаунтом, забанили или еще что-то, не знаю, так что запускаю на своем втором акке: https://www.twitch.tv/arenatostera

Я вернул ЯндексГПТ и ГигаЧат их имена и знание о том что они представители компаний Яндекс и Сбер, в прошлый стрим они были от Алисы Корп и ГигаБанка из-за цензуры, посмотрим сколько раз мы триггернем цензуру из-за этого.

Планы:

1) бой 5 юнитов на 5 юнитов, любой бюджет.
2) битва на мосту из компании, смогут ли они пройти миссию из компании на мосту?
3) если успеем, битва на мосту между ЯндексГПТ и ГигаЧатом.
👍2🔥21
Выложил запись вчерашнего стрима: https://vkvideo.ru/video-227821233_456239030

Твич без предупреждения заблокировал мне возможность стримить на моем основном канале прямо перед трансляцией, не забанил, а именно заблокировал, что даже хуже так как если бы меня забанили то Твич меня бы хотя бы предупредил об этом, а так все обнаружилось в последний момент. Я запустил трансляцию на другом канале, так что я очень благодарен тем кто пришел даже несмотря на все это.

Скорее всего следующую трансляцию я проведу уже на другой площадке, где именно решим ближе к делу, в любом случае я напишу об этом здесь, на канале.

На счет самого стрима, он был очень информативным. Чаттер semjonbelus точно подметил что Гигачат гуманитарий, а ЯндексГПТ технарь, и это проявляется далеко не только в том что ЯндексГПТ лучше считает.

Я подробнее раскрою это в будущем видео где будет идти сравнение этих моделей (отрывки из стримов станут частью этого видоса), но скажем так, ЯндексГПТ следует системному промту как инструкции, а вот Гигачат относиться к системному просту как к роли которую он играет. То есть хоть системный промт у них одинаковый, относятся они к нему по разному, чего лично я вообще не ожидал когда начинал это все.
👍15🔥4🤡1
Чего меня больше всего бесит в ЯндексГПТ.

В api ЯндексГПТ есть такой параметр как reasoningOptions "mode": "DISABLED" (вот тут пример его использования в докха: https://yandex.cloud/ru/docs/foundation-models/operations/generation/create-prompt)

И этот параметр это лютый треш, я вообще не понимаю зачем и почему Яндекс его сделали. Это параметр которого нигде кроме Яндекса нет, ни в опенаи, ни в антропик, нигде про такой параметр не слышали.

Идея его в том что бы управлять тем будет ли модель размышлять или сразу начнет давать ответ. Казалось бы, ну хороше же!

НЕТ.

Из-за того что такого параметра больше нигде нет API ЯндексГПТ частично теряет совместимость со всем SDK и фреймворками. К примеру ЯндексГПТ можно юзать через OpenAi SDK но так как OpenAi не знают про "reasoningOptions" то и управлять этим параметром не выйдет (или выйдет с лютыми костылями что обессмысливает использование SDK).

То есть при разработке программы нужно либо специально под яндексгпт писать какую-то свою логику, либо забить на возможность управлять тем будет ли модель размышлять или нет, и пускай просто будет всегда включен дефолтный параметр.

Но что самое смешное так это то что Яндекс могли бы без проблем решить эту проблему. Вместо того что бы добавлять в свой api не стандартный параметр они могли бы сделать две модели, к примеру yandex gpt pro reasoning и yandex gpt pro fast.

Название не важно, под капотом это может быть одна и та же модель. Важно то что любой SDK или фреймворк позволяет указывать любое название модели, следовательно через передачу разных названий можно было бы контролировать - должна ли модель от Яндекса размышлять или нет. Без всяких не стандартных параметров.
🤔11💊5👎1
Почти все чем я был занят в последнее время было написание программы Базария v2 - это программа для общения с нейросетями на стримах и в видео. Если вы были на стримах или смотрели записи то вы видели эту программу в действии, именно через нее я общаюсь с ЯндексГПТ и ГигаЧатом.

Сегодня нам предстоит протестировать работу второй версии. Самое главное отличие новой версии в том что теперь боты видят сообщения друг друга, до этого они видели только мои сообщения к ним. Это значит что теперь они могут реагировать на сообщения друг друга.

На самом деле во второй версии изменений куда больше, но они связаны в основном с архитектурой, я закладываю "базу", что бы потом добавлять новые фичи, к примеру я хочу научить ботов взаимодействовать с программами во вне.

Но пока нам нужно проверить нормально ли все работает, и для этого сегодня мы поиграем на стриме в Парадокс Трамвая! Парадокс Трамвая это игра про моральную дилемму, так что у ЯндексГПТ и ГигаЧата будет возможность продемонстрировать их этический компас, а так же оценить друг друга (опять же - теперь они видят сообщения друг от друга).

Стрим пройдет на ВК лайв: https://live.vkvideo.ru/tosternoscript - я впервые буду там стримить. В прошлый раз Твич без предупреждения заблокировал мне возможность стримить так что я решил что нужно осваивать альтернативные площадки для стримов.

Время стрима: сегодня 20:00 по МСК. Буду рад вас видеть!

За несколько минут до стрима я еще раз напишу о нем здесь.
🔥16🤔52👎1🥰1
Запустил стрим: https://live.vkvideo.ru/tosternoscript - заходите!

Напомню что сегодня играем в Парадокс Трамвая с ЯндексГПТ и ГигаЧатом.

Кстати, я не сказал об этом, но ЯндексГПТ сегодня впервые будет размышляющим, я смог победить эту его настройку, так что посмотрим как это на него повлияет.
👍8👎2🤔2
Как вкатиться в AI-Coding без платы за подписки и токены.

Мне очень нравится, когда вы задаёте мне вопросы. В комментариях на этом канале или даже в личные сообщения. Это позволяет посмотреть на вопросы, связанные с AI, под новым для меня углом.

Один из недавних запросов, которые я получил в ЛС:

Какие AI-Coding-инструменты можно использовать бесплатно?


Подготовил список из 7 таких инструментов, которыми можно пользоваться бесплатно. Какие-то можно использовать на постоянной основе, но с лимитами, а какие-то только один раз на старте.

Вот сам список:

1. Gemini CLI. Всё ещё дают свои бесплатные 1000 запросов в день. Если бы можно было оставить только один инструмент в списке, я бы оставил именно этот. Кстати, тут и тут пишу о том, как не дать Google снять с вас деньги за Gemini CLI.

2. Cursor. Помимо двух недель триального pro-режима, есть также полностью бесплатный тариф с ограничениями.

3. Windsurf. Когда-то был главным конкурентом Cursor. Сейчас у них есть бесплатный тариф, но очень скромный по сравнению с другими инструментами в списке.

4. Github Copilot. Даёт ограниченное количество запросов к AI на бесплатном тарифе.

5. Kiro Code. Очень приятный с точки зрения UX инструмент. Сейчас даёт 500 бесплатных кредитов на старте и заявляют на сайте бесплатный тарифный план.

6. Zed AI. Хороший редактор, предоставляющий бесплатный тариф с достаточно щедрыми лимитами.

7. Kilo Code (не путать с п.5). Есть возможность на старте получить до $25 на Openrouter, а там с умом их потратить (не используйте дорогие флагманские модели и денег хватит на более продолжительный срок).

Бонус: заведите себе аккаунт на Groq. Они дают щедрые бесплатные лимиты на многие интересные модели. Их можно подключить к AI-IDE и получить бесплатного AI-кодера.

Если полезно – ставьте 🔥 и делитесь с друзьями 🙂

Также делитесь в комментариях, какие ещё знаете способы писать код с помощью AI бесплатно.
🔥164
Forwarded from LLM Arena
📈Рейтинги LLM теряют доверие

Наше исследование (21 июля — 10 августа 2025, практики и предприниматели в сфере ИИ) показало реальную картину: команды всё меньше ориентируются на абстрактные бенчмарки и всё чаще принимают решения через собственные тесты.

👀 Ключевые данные:

— 82,2% проводят собственные проверки и используют бенчмарки только как дополнительный сигнал.

— 26,7% принципиально не опираются на рейтинги.

— Лишь около 18% обращаются к агрегаторам по типу llmstats

Главные критерии выбора AI-решений для продуктов: качество + цена + скорость, устойчивость без галлюцинаций и совместимость с инфраструктурой

📄Отдельная ценность исследования — мы постарались отразить мнение участников рынка таким, какое оно есть: с аргументами «за» и «против», со скепсисом и практическими отзывами. Полный отчёт с графиками, аналитикой и комментариями уже доступен на сайте.

P.S. Огромная благодарность всем, кто помогал собирать данные для исследования, а также авторам и энтузиастам, помогающим его популязировать. Замечания по исследованию и предложения по будущим рисёрч-проектам можно оставить здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🤔3
👆А некоторые еще удивляются зачем я заставляю нейросети воевать в TABS вместо того что бы просто смотреть на бенчмарки.
👍13🌚5🤔1
Нейросеть это не джун, это фрилансер.

Очень часто можно встретить мнение что нейросети это "заменители джунов", я с этим вообще не согласен.

Если брать "человеческую" аналогию то нейросеть больше всего похожа на программиста фрилансера. Это крутой программист фрилансер который много умеет и знает, но он лениться и он будет делать только то что прописано в "тех задании" (в промпте) и не более того.

Что бы добиться от него максимума ему нужно давать хороший промпт и указывать ему на его ошибки, ему нужно показать кто в доме в коде хозяин.

К примеру, если обычный человеческий сениор пишет новую фичу и он видит что эта фича похожа на другую фичу в коде, то он может порефаторить код и сделать из этого абстракцию, он сам придет к этому выводу и сделает это.

Нейросеть так не сделает, ей сказали сделать фичу, она и сделает ее, и при этом будет фигачить новые функции в существующую архитектуру, ей совершенно плевать на то что будет с этой кодовой базой дальше. Задача описанная в промпте была сделана? Была, ну и все. При этом это не значит что нейросеть не может рефакторить, очень даже может, но ее нужно явно просить об этом, нужно указать что и где исправить в коде.

Что заказчик говорит то нейросеть и будет делать, но не более того. Нейросеть не мыслит "на перед", не думает о том что будет с кодовой базой дальше, она живет "в моменте".
👍2210🤣1
Forwarded from Denis Sexy IT 🤖
Google навставлял AI в Chrome для всех:

- добавили окошка чата (вверху справа), чтобы чатиться с Gemini, оно имеет доступ как к одной вкладке сайта, так и к нескольким
- прикрутили Gemini к поиску по истории браузера (можно будет спросить что-то в стиле «а где я видел последний раз фотку Дурова по торс» и оно вернет)
- Скоро добавят агента который может за вас ходить по сайтам и выполнять задачи
- Если где-то, кто-то, отправляет браузерный пуш со спамом, то его поймает гемини

АИ масс адаптация, получается, свершилась – самый популярный браузер мира все же

Тут весь анонс
👍7🤬3👏1
👆Побуду немного ии-паранойком. Не нравятся мне все эти браузерные ии-ассистенты. Был такой вот случай: https://www.tomshardware.com/tech-industry/cyber-security/perplexitys-ai-powered-comet-browser-leaves-users-vulnerable-to-phishing-scams-and-malicious-code-injection-brave-and-guardios-security-audits-call-out-paid-ai-browser

Comet (браузер от Perplexity's) прочитал на сайте вредоносную инструкцию и начал ее выполнять. Это довольно жутко ведь в браузере люди авторизованы в интернет магазинах, в банках, на госуслугах, и тд, и ко всему этому теперь будет иметь доступ нейросетевой агент который может прочитать вредоносную инструкцию на любом случайном сайте и привет, агент может тупо взять начать выполнять эту инструкцию решив что это команда от юзера.
🤔17👍5👏1💯1
Сегодня, в 20:00 я запущу стрим, будем играть в Парадокс Трамвая с ЯндексГПТ и Гигачатом, но в этот раз это будет моя кастомная версия игры (на скрине).

ЯндексГПТ и Гигачату предстоит довольно тяжелый выбор.

Стрим пройдет здесь: https://live.vkvideo.ru/tosternoscript

В прошлый стрим были технические проблемы, но я все починил (я надеюсь).
6👍3👌2
Стрим начался, заходите: https://live.vkvideo.ru/tosternoscript

Сегодня гигачат будет MAX, а яндексгпт будет про и размышляющий, проще говоря самые крутые модели сегодня.
🔥3👍1🤔1
Трансляция закончилась, спасибо всем кто пришел! Запись здесь: https://vkvideo.ru/video-227821233_456239033

Вообще это была первая трансляция без серьезных технических проблем, до этого все время что-то ломалось (обычно с нейросетями). Сегодня была одна небольшая поломка, но в целом все прошло хорошо. Это значит что Базария (моя программа для общения с нейросетями) работает стабильно и к ней можно начать подключать новые фичи и программы.
👍5
Media is too big
VIEW IN TELEGRAM
Сделал шорт из эпизода на последнем стриме.
😁24👍5🤣5
Qwen3-Omni

первая полностью нативно омнимодальная (все типы информации) ИИ-модель, которая объединяет текст, изображения, аудио и видео в одной модели без компромиссов между модальностями

#SOTA в 22 из 36 аудио- и AV-бенчмарков

119 языков для текста, 19 — для входящего аудио, 10 — для исходящего аудио? в том числе русский

задержка 211 мс

способна понимать аудио длительностью до 30 минут

настраивается с помощью системных промтов

Встроена функция вызова инструментов

содержит открытую модель Captioner с низким уровнем галлюцинаций

Демо
Чат
HF
Гитхаб

#assistant #tts #stt #multimodal #omnimodal #russian
🤯8🔥2🥰1👏1
👆вот это жесть, по суте эта модель заменяет создание сложного бэкенда.

Конечному юзеру все равно как работает его чат приложение, делает ли там все одна модель или под капотом там сложный пайплайн с кучей разных моделей специализированных для распознавания и генерации аудио/картинок и тд.

Но с точки зрения разработки это огромная разница, эта модель, Qwen3-Omni, просто заменяет собой огромный пласт разработки бэка.

Интересно будет конечно посмотреть какой подход в итоге победит - специализированные модели которые умеют что-то одно или такие вот модели-комбайны.
10👍1🥰1👏1
Благодаря нейросетям научиться программировать сейчас стало намного проще, но и намного сложнее.

Почему проще? Нейросеть это идеальный учитель, она готова ответить на любой вопрос, в любой момент времени, и она будет разжевывать любой вопрос столько сколько вам это нужно. Ей можно задавать один и тот же тупой вопрос и ей будет ок. Еще никогда не было такого что бы у каждого человека был бы настолько терпеливый учитель. Изучать программирование сейчас из-за этого проще чем когда либо.

Но при этом, из-за нейросетей учиться программировать стало намного сложнее.

Что самое главное при обучении? Мотивация, тот кто замотивирован учиться - выучиться. Но из-за того что нейросети сейчас очень хороши в программировании у многих просто теряется мотивация учиться. Зачем изучать язык программирования если одним запросом в Курсоре можно написать целое приложение?

Изучать программирование тяжело, при чем особенно тяжело в самом начале, первый язык программирования самый тяжелый. В этот момент проще всего сломаться и все бросить.

Я не знаю откуда начинающие программисты сейчас берут мотивацию учиться, если бы я сейчас начинал учиться программировать то я, скорее всего, просто забил бы и стал бы вайбкодером.
👍18😭6👎1