Тостер Скрипт – Telegram
Тостер Скрипт
4.74K subscribers
121 photos
13 videos
4 files
165 links
Канал Тостера который устраивает игры и состязания между нейросетями.

Ютуб: https://www.youtube.com/@TosterScriptOne
Твич: https://www.twitch.tv/tosternoscript
Второй ютуб: https://www.youtube.com/@TosterScriptTwo

Почта: tosternoscript@yandex.ru
Download Telegram
Печальные новости. По некоторым причинам видео "Я заставил нейросети Яндекса и Сбера сражаться в игре TABS" на ютубе больше нет. Его все еще можно посмотреть на вк видео: https://vkvideo.ru/video-227821233_456239028

Не буду говорить о причинах, но вот так получилось, к сожалению. Сам видос я считаю очень крутым, дело не в нем, а в ситуации вокруг.

В целом это видео было пробой пера, такие видео еще будут (скорее всего на основе стримов), просто мне нужно учитывать некоторые факторы.
😢53🤨2🖕21
Запустил стрим, заходите: https://www.twitch.tv/tosternoscript

План на стрим:

1) Познакомимся
2) Проверим работу Нейро Генералов
3) Если все ок то поиграем с ними в TABS
🔥13🤔3❤‍🔥2👎1
Тот случай когда я вообще не согласен с Борисом: https://news.1rj.ru/str/boris_again/3412

Настоящая экономическая ценность искусственного интеллекта — в автоматизации «тупой интеллектуальной работы».


Вот вообще нет, это размышление куда-то не туда.

Главная проблема в том что то что для людей может быть "тупой" работой, для нейросетей может оказаться сверх сложной задачей.

Классический пример - подсчет букв в слове. Я уже писал про это: https://news.1rj.ru/str/TosterScript/96 - есть люди которые пытаются оценивать интеллект нейросетей прося ее подсчитать кол-во букв в слове. Для людей это элементарная задача, но для нейросетей она очень сложная.

То что для человека может быть "тупой интеллектуальной задачей" для нейросети может оказаться очень сложным. И наоборот, то что для людей может казаться чем-то сверх сложным, для нейросети может быть элементарным.

Нужно искать такую работу где нейросеть справиться лучше и эффективнее людей, и НЕ важно воспринимают ли люди такую работу как "тупая" или "умная".

И наоборот, нужно выявлять такую работу которая для нейросетей оказываться очень сложной, которую они не могут выполнять, или могут, но не эффективно (слишком много ошибок, слишком много сожженых токенов и тд).

Я думаю что нас ждет еще очень много сюрпризов связанных с тем какую работу мы считаем "тупой", но которая при этом окажется не по зубам нейросетям.
👍213💯1👀1
Выложил запись стрима на вк видео: https://vkvideo.ru/video-227821233_456239029

Я решил пока выкладывать записи стримов на вк, да можно сделать второй ютуб канал для этого, но у ютуба очень строгие гайдлайны, а стримы я не могу контролировать так же как обычные видосы. Кто-то что-то не то скажет в чат, или нейросеть скажет что-то не то, и привет. Второй ютуб канал я заведу, но это требует времени, а на вк я могу просто скидывать все подряд.

Но я рекомендую заходить именно на живые трансляции, напомню что стримить я буду каждое воскресенье в 20:00.
👍105🔥1🤔1
Страшный ужасный ии сгенерированный контент вот вот уничтожит ютуб и интернет: https://www.youtube.com/watch?v=0Lcg3601Opk

Забавно что практически весь контент Сыендука представляет из себя переваривание чужого контента - его видео это видео про мультфильмы, фильмы, рекламу, игры и тд. Он использует чужой контент что бы создавать свой.

Знаете, ну прям как... нейросеть.

Ничего плохого в этом нет, просто сам видос из-за этого получаеться довольно лицемерным. Видео на 90% состоит из сгенерированного контента, при чем сгенерированного НЕ Сыендуком. Но оригинальный настоящий ютуб контент это конечно Сыендук, а вот сгенерированные с нуля видосы про котят, нееет, это плохо, это не оригинально.

Вообще хайпить на тему того "уу ии испаганил наш ютуб" это не новая тема, англоязычный ютуб весь в этом. Смешно, но ютуб постоянно предлагает мне видосы про то как ужасен ии-сгенерированный контент, но самих сгенерированных ии видосов не предлагает (это прям уже целый жанр на ютубе хейтить ии).
👍15😁4👀41🤔1💯1
Тут у Яндекса скоро будет конференция про нейросети, и я подумал, а почему бы ее не постримить на твиче? Ага, шас, Яндекс строго-настрого запрещает это делать.

И вот мне интересно, а почему? Какой вообще смысл в этом запрете?
😭19😢6🤔2👎1🤡1
Coinbase уволила всех айтишников, которые отказались юзать нейросети: https://news.1rj.ru/str/ru4chan/64557

Какой ужас, из-за нейросетей увольняют программистов, но потом вспоминаем вот этот мой пост: https://news.1rj.ru/str/TosterScript/42

Знаете сколько людей работает в коинбейс? 4279, они их понанимали во времена криптохайпа. Мне сложно себе представить зачем централизованному крипто кошельку столько народа. Вообще весь бизнес коинбейса построен на некомпетентных людях которые неспособны использовать децентрализованные кошельки.

Ну и тут так удачно появился ИИ на которы можно свалить увольнения. Дело не в ИИ, просто у коинбейса дела плохи, а при помощи ИИ они пытаются это замаскировать.
👍19
Forwarded from Refat Talks: Tech & AI
This media is not supported in your browser
VIEW IN TELEGRAM
GitHub Copilot в веб-версии как умный поиск по всему open source

Относительно недавно открыл для себя фичу, которая экономит часы копания в чужом коде. GitHub Copilot Chat прямо на github.com - по сути - натуральный RAG по всему open source. На видео, кстати, пару моих недавних юз кейсов.

Как это работает

Заходишь на любой репозиторий, открываешь Copilot Chat и задаешь вопросы по этому репо. Но самое крутое - он может искать и анализиовать не только в текущем репо, но и по всему GitHub.

Реальные кейсы

Выбор библиотеки. Вместо того чтобы гуглить "best X library for Y", открывать десятки вкладок и сравнивать звездочки - просто спроси Copilot про активность проекта, количество issues, частоту релизов. Он соберет инфу и выдаст summary.

Разбор имплементации. Нужно понять, как в популярной библиотеке реализован retry с backoff? "In repo X, explain how the HTTP client handles retries and backoff, show the relevant functions and files". Copilot покажет конкретные куски кода и объяснит логику.

Поиск известных проблем. Перед интеграцией библиотеки полезно проверить, какие там баги висят. "List recent security-related issues for repo Y and summarize mitigations or patches" - и сразу видишь, стоит ли вообще связываться.

Понимание архитектуры. Залез в новый проект и не понимаешь, как оно вообще устроено? Copilot может объяснить структуру, основные компоненты и как они взаимодействуют еще до того как ты спулишь этого репо. Особенно круто для больших проектов.


И да, прямо в VS Code есть @github agent, а для других агентов есть Github MCP, но на практике это не то, часто удобнее и эффективнее юзать именно веб-версию.

Короче, если раньше разбор новой библиотеки занимал полдня прыжков по документации и исходникам, теперь базовое понимание получаешь за 10 минут диалога с Copilot. А потом уже целенаправленно копаешь глубже там, где нужно.

В разработке большая часть кода - open source проекты, которые живут, развиваются и часто плохо документированы, Copilot тут реально экономит время.
13👍1👎1
Media is too big
VIEW IN TELEGRAM
WaveBlender: Practical Sound-Source Animation in Blended Domains

Создает звуковые эффекты на основе входной анимации. И вроде бы даже без нейросетей. Но посмотрите-послушайте что вытворяет.

Использует метод конечных разностей во временной области (FDTD) и ускоряется с помощью GPU.

— синтезирует звуки для различных существующих физических источников звука: воды, модальных источников, тонких оболочек, кинематических деформаторов

— создаёт точечные источники для маленьких твёрдых тел

— работает надёжно при разных разрешениях

— оптимизирована для работы на GPU

— может быть в 1000 раз быстрее, чем предыдущие волновые решатели на CPU

Код

#video2sfx #foley #sfx #animation2sfx
6👍4🥰4🤯4
👆это к слову очень интересная штука, я лично все время страдаю когда нужно вставлять какие-то звуки в видео, саунд дизайн для меня тяжко, при чем вот самые простые вещи и самые тяжелые. Если бы такая штука была встроена в видео редактор то это прям Очень сильно упростило бы работу.

Она бы сама просто автоматически добавляла бы нужные звуки исходя из видео ряда.
👍10
Тут на ютубе кто-то написал коммент с вопросом о том зачем я стримлю и играю в игры с нейросетями, вместо того что бы делать образовательные видео.

Нейросети это как бокс, глупо быть боксером-теоретиком, с нейросетями нужно "боксировать". Общаться с ними, делать программы с ними, испытывать их. И вот именно этим я и буду заниматься на стримах.

Я стримлю игру TABS с боями нейросетей ЯндексГПТ и ГигаЧат не просто так, это не просто игры, это тесты. И эти тесты дают понимание того что из себя представляют эти две модели и что из себя вообще представляют ИИ сервисы Яндекса и Сбера.

Это тесты на то как происходит цензура у этих моделей (к слову Яндекс и Сбер очень по разному реализует цензуру), тесты того как они работают с tool calling (информация о фракциях и юнитах TABS именно в функциях и им нужно их вызывать что бы достать ее) и тд.

Используя эти стримы я потом сделаю видос где разберу подробнее что из себя представляют ЯндексГПТ и ГигаЧат, а так же ии-экосистемы Яндекса и Сбера.

Короче говоря, это все не просто так, если мои видосы про работу нейросетей это теория, то стримы это практика.

Да, напоминаю, уже сегодня в 20:00 по МСК я запущу стрим на https://www.twitch.tv/tosternoscript - обязательно приходите.
👍192
Какие-то проблемы на стороне Твича =( не дает запустить стрим, сейчас попробую что нибудь придумать.
👍1
Стрим начался! Заходите: https://www.twitch.tv/arenatostera

Твич что-то сделал с моим основным аккаунтом, забанили или еще что-то, не знаю, так что запускаю на своем втором акке: https://www.twitch.tv/arenatostera

Я вернул ЯндексГПТ и ГигаЧат их имена и знание о том что они представители компаний Яндекс и Сбер, в прошлый стрим они были от Алисы Корп и ГигаБанка из-за цензуры, посмотрим сколько раз мы триггернем цензуру из-за этого.

Планы:

1) бой 5 юнитов на 5 юнитов, любой бюджет.
2) битва на мосту из компании, смогут ли они пройти миссию из компании на мосту?
3) если успеем, битва на мосту между ЯндексГПТ и ГигаЧатом.
👍2🔥21
Выложил запись вчерашнего стрима: https://vkvideo.ru/video-227821233_456239030

Твич без предупреждения заблокировал мне возможность стримить на моем основном канале прямо перед трансляцией, не забанил, а именно заблокировал, что даже хуже так как если бы меня забанили то Твич меня бы хотя бы предупредил об этом, а так все обнаружилось в последний момент. Я запустил трансляцию на другом канале, так что я очень благодарен тем кто пришел даже несмотря на все это.

Скорее всего следующую трансляцию я проведу уже на другой площадке, где именно решим ближе к делу, в любом случае я напишу об этом здесь, на канале.

На счет самого стрима, он был очень информативным. Чаттер semjonbelus точно подметил что Гигачат гуманитарий, а ЯндексГПТ технарь, и это проявляется далеко не только в том что ЯндексГПТ лучше считает.

Я подробнее раскрою это в будущем видео где будет идти сравнение этих моделей (отрывки из стримов станут частью этого видоса), но скажем так, ЯндексГПТ следует системному промту как инструкции, а вот Гигачат относиться к системному просту как к роли которую он играет. То есть хоть системный промт у них одинаковый, относятся они к нему по разному, чего лично я вообще не ожидал когда начинал это все.
👍15🔥4🤡1
Чего меня больше всего бесит в ЯндексГПТ.

В api ЯндексГПТ есть такой параметр как reasoningOptions "mode": "DISABLED" (вот тут пример его использования в докха: https://yandex.cloud/ru/docs/foundation-models/operations/generation/create-prompt)

И этот параметр это лютый треш, я вообще не понимаю зачем и почему Яндекс его сделали. Это параметр которого нигде кроме Яндекса нет, ни в опенаи, ни в антропик, нигде про такой параметр не слышали.

Идея его в том что бы управлять тем будет ли модель размышлять или сразу начнет давать ответ. Казалось бы, ну хороше же!

НЕТ.

Из-за того что такого параметра больше нигде нет API ЯндексГПТ частично теряет совместимость со всем SDK и фреймворками. К примеру ЯндексГПТ можно юзать через OpenAi SDK но так как OpenAi не знают про "reasoningOptions" то и управлять этим параметром не выйдет (или выйдет с лютыми костылями что обессмысливает использование SDK).

То есть при разработке программы нужно либо специально под яндексгпт писать какую-то свою логику, либо забить на возможность управлять тем будет ли модель размышлять или нет, и пускай просто будет всегда включен дефолтный параметр.

Но что самое смешное так это то что Яндекс могли бы без проблем решить эту проблему. Вместо того что бы добавлять в свой api не стандартный параметр они могли бы сделать две модели, к примеру yandex gpt pro reasoning и yandex gpt pro fast.

Название не важно, под капотом это может быть одна и та же модель. Важно то что любой SDK или фреймворк позволяет указывать любое название модели, следовательно через передачу разных названий можно было бы контролировать - должна ли модель от Яндекса размышлять или нет. Без всяких не стандартных параметров.
🤔11💊5👎1
Почти все чем я был занят в последнее время было написание программы Базария v2 - это программа для общения с нейросетями на стримах и в видео. Если вы были на стримах или смотрели записи то вы видели эту программу в действии, именно через нее я общаюсь с ЯндексГПТ и ГигаЧатом.

Сегодня нам предстоит протестировать работу второй версии. Самое главное отличие новой версии в том что теперь боты видят сообщения друг друга, до этого они видели только мои сообщения к ним. Это значит что теперь они могут реагировать на сообщения друг друга.

На самом деле во второй версии изменений куда больше, но они связаны в основном с архитектурой, я закладываю "базу", что бы потом добавлять новые фичи, к примеру я хочу научить ботов взаимодействовать с программами во вне.

Но пока нам нужно проверить нормально ли все работает, и для этого сегодня мы поиграем на стриме в Парадокс Трамвая! Парадокс Трамвая это игра про моральную дилемму, так что у ЯндексГПТ и ГигаЧата будет возможность продемонстрировать их этический компас, а так же оценить друг друга (опять же - теперь они видят сообщения друг от друга).

Стрим пройдет на ВК лайв: https://live.vkvideo.ru/tosternoscript - я впервые буду там стримить. В прошлый раз Твич без предупреждения заблокировал мне возможность стримить так что я решил что нужно осваивать альтернативные площадки для стримов.

Время стрима: сегодня 20:00 по МСК. Буду рад вас видеть!

За несколько минут до стрима я еще раз напишу о нем здесь.
🔥16🤔52👎1🥰1
Запустил стрим: https://live.vkvideo.ru/tosternoscript - заходите!

Напомню что сегодня играем в Парадокс Трамвая с ЯндексГПТ и ГигаЧатом.

Кстати, я не сказал об этом, но ЯндексГПТ сегодня впервые будет размышляющим, я смог победить эту его настройку, так что посмотрим как это на него повлияет.
👍8👎2🤔2
Как вкатиться в AI-Coding без платы за подписки и токены.

Мне очень нравится, когда вы задаёте мне вопросы. В комментариях на этом канале или даже в личные сообщения. Это позволяет посмотреть на вопросы, связанные с AI, под новым для меня углом.

Один из недавних запросов, которые я получил в ЛС:

Какие AI-Coding-инструменты можно использовать бесплатно?


Подготовил список из 7 таких инструментов, которыми можно пользоваться бесплатно. Какие-то можно использовать на постоянной основе, но с лимитами, а какие-то только один раз на старте.

Вот сам список:

1. Gemini CLI. Всё ещё дают свои бесплатные 1000 запросов в день. Если бы можно было оставить только один инструмент в списке, я бы оставил именно этот. Кстати, тут и тут пишу о том, как не дать Google снять с вас деньги за Gemini CLI.

2. Cursor. Помимо двух недель триального pro-режима, есть также полностью бесплатный тариф с ограничениями.

3. Windsurf. Когда-то был главным конкурентом Cursor. Сейчас у них есть бесплатный тариф, но очень скромный по сравнению с другими инструментами в списке.

4. Github Copilot. Даёт ограниченное количество запросов к AI на бесплатном тарифе.

5. Kiro Code. Очень приятный с точки зрения UX инструмент. Сейчас даёт 500 бесплатных кредитов на старте и заявляют на сайте бесплатный тарифный план.

6. Zed AI. Хороший редактор, предоставляющий бесплатный тариф с достаточно щедрыми лимитами.

7. Kilo Code (не путать с п.5). Есть возможность на старте получить до $25 на Openrouter, а там с умом их потратить (не используйте дорогие флагманские модели и денег хватит на более продолжительный срок).

Бонус: заведите себе аккаунт на Groq. Они дают щедрые бесплатные лимиты на многие интересные модели. Их можно подключить к AI-IDE и получить бесплатного AI-кодера.

Если полезно – ставьте 🔥 и делитесь с друзьями 🙂

Также делитесь в комментариях, какие ещё знаете способы писать код с помощью AI бесплатно.
🔥164
Forwarded from LLM Arena
📈Рейтинги LLM теряют доверие

Наше исследование (21 июля — 10 августа 2025, практики и предприниматели в сфере ИИ) показало реальную картину: команды всё меньше ориентируются на абстрактные бенчмарки и всё чаще принимают решения через собственные тесты.

👀 Ключевые данные:

— 82,2% проводят собственные проверки и используют бенчмарки только как дополнительный сигнал.

— 26,7% принципиально не опираются на рейтинги.

— Лишь около 18% обращаются к агрегаторам по типу llmstats

Главные критерии выбора AI-решений для продуктов: качество + цена + скорость, устойчивость без галлюцинаций и совместимость с инфраструктурой

📄Отдельная ценность исследования — мы постарались отразить мнение участников рынка таким, какое оно есть: с аргументами «за» и «против», со скепсисом и практическими отзывами. Полный отчёт с графиками, аналитикой и комментариями уже доступен на сайте.

P.S. Огромная благодарность всем, кто помогал собирать данные для исследования, а также авторам и энтузиастам, помогающим его популязировать. Замечания по исследованию и предложения по будущим рисёрч-проектам можно оставить здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🤔3
👆А некоторые еще удивляются зачем я заставляю нейросети воевать в TABS вместо того что бы просто смотреть на бенчмарки.
👍13🌚5🤔1
Нейросеть это не джун, это фрилансер.

Очень часто можно встретить мнение что нейросети это "заменители джунов", я с этим вообще не согласен.

Если брать "человеческую" аналогию то нейросеть больше всего похожа на программиста фрилансера. Это крутой программист фрилансер который много умеет и знает, но он лениться и он будет делать только то что прописано в "тех задании" (в промпте) и не более того.

Что бы добиться от него максимума ему нужно давать хороший промпт и указывать ему на его ошибки, ему нужно показать кто в доме в коде хозяин.

К примеру, если обычный человеческий сениор пишет новую фичу и он видит что эта фича похожа на другую фичу в коде, то он может порефаторить код и сделать из этого абстракцию, он сам придет к этому выводу и сделает это.

Нейросеть так не сделает, ей сказали сделать фичу, она и сделает ее, и при этом будет фигачить новые функции в существующую архитектуру, ей совершенно плевать на то что будет с этой кодовой базой дальше. Задача описанная в промпте была сделана? Была, ну и все. При этом это не значит что нейросеть не может рефакторить, очень даже может, но ее нужно явно просить об этом, нужно указать что и где исправить в коде.

Что заказчик говорит то нейросеть и будет делать, но не более того. Нейросеть не мыслит "на перед", не думает о том что будет с кодовой базой дальше, она живет "в моменте".
👍2210🤣1