Тостер Скрипт – Telegram
Тостер Скрипт
4.74K subscribers
121 photos
13 videos
4 files
165 links
Канал Тостера который устраивает игры и состязания между нейросетями.

Ютуб: https://www.youtube.com/@TosterScriptOne
Твич: https://www.twitch.tv/tosternoscript
Второй ютуб: https://www.youtube.com/@TosterScriptTwo

Почта: tosternoscript@yandex.ru
Download Telegram
Зачем OpenAi запускает свою собственную социальную сеть Sora App?

Казалось бы, у OpenAi есть стабильный бизнес, зачем они лезут в нишу социальных сетей? Делали бы лучше GPT-6.

И у OpenAi, и у Anthropic есть большая проблема, эти компании как акулы - им все время нужно двигаться что бы не умереть. Они должны выпускать новые более крутые модели что бы оставаться на плаву. Если они зазеваются, если их модели перестанут быть самыми крутыми то люди просто перейдут на модели других компаний (а то и на опенсорсные модели если они станут не хуже).

По этому OpenAi и Anthropic пытаются изо всех сил выйти за рамки просто ии-провайдера, и занять более стабильную нишу. Anthropic пытаются стать незаменимым инструментом для программистов, а вот OpenAi решили быть более амбициозными и создать целую социальную сеть.

Технически в соц сетях ничего сложного нет, самое сложное это приучить людей пользоваться новой социальной сетью. Если у миллионов людей войдет в привычку каждый день заходить в Sora App то OpenAi получат по настоящему стабильный бизнес, а не вот эти все крысиные гонки нейросетевых моделей.
🤔13👍43🤡3
В «ТВ Станциях» от «Яндекса» появилась нейросеть для геймеров: она даёт подсказки в играх: https://habr.com/ru/news/953144/

Интересно на чем работает вижен Яндекса, потому что ЯндексГПТ вообще-то слепой, у него нет способности видеть что либо (в отличие от Гигачата или даже Геммы которая умеет распознавать картинки). Более того, в Яндекс Облаке нет сервиса для вижена, есть сервис для распознавания текста, но не более того.

Короче толи Яндекс зачем-то скрывает свои технологии, толи юзает что-то стороннее в ТВ Станции?
🤔6
Forwarded from Giga Pepega
Вышла новая модель Соры, это сгенерированные в ней аниме видео (самые нормальные, которые я смог найти). Сгенерировано всё, включая звук.
👍10🥰2🔥1💯1
👆выглядит конечно так себе, особенно косяки видны в видосе с самураем, боевка прям ну очень плохо показана.

Но вот последний видос, он выглядит как дешевое аниме, но в целом, именно что спутать с дешевым аниме генерацию от Соры вполне можно. А это уже очень не хило.
😁8👍1
Уже через час, в 20:00 по МСК запущу стрим на Твиче: https://www.twitch.tv/tosternoscript

И Гемма, и Гигачат теперь умеют видеть! Так что сегодня мы устроим турнир между этими двумя, я буду давать им скриншот, а они должны будут угадать из какой игры этот скриншот. Посмотрим кто лучше с этим справиться, локально запущенная на моем компе Гемма или модель от Сбера?
🔥92🌚2💊2
https://www.twitch.tv/tosternoscript - стрим начался, заходите!

Кстати Гемма сегодня не должна тормозить, как в прошлый раз.
👍5
Выложил запись вчерашнего стрима: https://vkvideo.ru/video-227821233_456239037

В целом и ГигаЧат и Гемма показали себя неплохо при распознавании скриншотов из игр. Но все таки я бы хотел поругать Гигачат - подключить ему распознавание картинок оказалось сложнее чем Гемме, а такого не должно быть, ведь Гигачат это ии-сервис, а Гемма это локальная модель.

Локальная опенсорсная модель это конструктор "собери сам", платой за автономность и локальность является сложность запуска. Но ии-провайдер это совсем другое дело, он должен быть простым и понятным, уж точно проще чем опенсорсные решения.

В чем именно проблема? Гигачату нельзя просто скармливать base64 картинки, нельзя добавить картинку в POST запрос и получить ответ. С начало нужно отправить картинку в некое хранилище гигачата (при чем не понятно сколько и как долго там хранятся файлы и какие там лимиты), получить метаданные этой картинки из этого хранилища, и потом передавать эти метаданные в запрос к Гигачату. Вот про это в документации: https://developers.sber.ru/docs/ru/gigachat/guides/working-with-files?ext=image

Это окей если бы это был бы один из способов передачи картинок Гигачату, такой подход применяет не только гигачат, но и разные другие ии-провайдеры. Более того, такой подход имеет право на жизнь. Он оптимальный, хоть и не удобный.

Главная проблема в том что это единственный способ. Других вариантов просто нет, в итоге мне приходится подстраивать свой код конкретно под Гигачат. Это особенно проблематично для меня так как я пишу программу для взаимодействия с разными нейросетями.
👍10
Не откладывайте рефакторинг если кодите при помощи нейросетей

Когда скармливаешь какой-то код нейросети (агенту в vs code или просто отдаешь кусок кода в веб чате) то нейросеть всегда будет стремиться написать код примерно так же как он был написан у вас. Нейросеть буквально копирует ваш подход к коду.

При чем причина этого не в каком-то системном промпте в агентах или моделях, нейросети по своей природе всегда "отзеркаливают" свой ответ, и это касается не только общения нейросетей в чате, но и при программировании.

С одной стороны это хорошо, нейросеть будет писать код примерно так же как и вы. Но у этого есть и серьезный минус, а что если ваш код написан плохо? Тогда и нейросеть будет писать плохо, и что еще хуже, чем хуже написан код, тем хуже нейросеть будет писать новый код. Мало того, нейросеть будет копировать и свой же собственный плохой код.

Из-за этого нужно придерживаться довольно строгой дисциплины, нужно сразу рефакторить плохой код, и не откладывать это на потом. Потому что чем дольше такой код будет лежать в кодовой базе тем выше шанс что нейросеть будет видеть его и брать с него пример, и следовательно, тем выше шанс что ии-бот будет копировать плохие практики.

И да, для этого реально нужна дисциплина, нейросети настолько упростили процесс написания кода что мысль "забить и оставить все как написал ии" приходит в голову все чаще и чаще при разработке. Я, страшно сказать, даже начинаю понимать вайбкодеров которые просто забили на качество кода.
👍11
Forwarded from ElKornacio
блин, ребята, вот всё понимаю, OpenAI, DevDay, всё такое.
но вот все, кто писаются кипятком от agent kit / agent builder - вы чего?
почему это позиционируется как революция? шопроисходит?

вы же понимаете что это gate-keeped пропиетарный аля-n8n, который отстаёт на 95% по функционалу и привязан к openai api? даже если, дай бог, со временем там будут не-openai модели - он всё равно отстаёт по функционалу и коммьюнити от n8n / zapier невероятно.

это же просто очередной not-invented-here от OpenAI. смотрю посты в некоторых каналах, и прям ужасаюсь от того, как любой инфоповод пытаются обернуть в "это революция". я потыкал - там функциональный разрыв с n8n примерно как у калькулятора с макбуком.

уф 🤯
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Да, опенаи выкатили свой клон n8n / zapier, ну выкатили и выкатили, реакция на это совершенно не адекватная. Лично я сторонник того что нельзя завязывать любой хоть сколько нибудь серьезный проект на конкретного ии-провайдера.

Любой проект должен быть модель-агностик, и ии-провайдер-агностик, если ваш проект жестко завязан на какого-то конкретного ии-провайдера то вы становитесь тотально зависимы от него.

Опенаи, понятное дело, хотят завязать на себя как можно больше проектов, они хотят быть незаменимыми, что бы куча бизнесов зависели от них. Это выгодно опенаи, но это вообще нифига не выгодно самим этим бизнесам.

Но дураки будут сами же привязывать себя к опенаи кучей крючечков, и Agent Kit это один из самых коварных крючечков, который нацелен на бизнесменов и на слабых инженеров (не понимающи опасности привязывания к единственному ии-провайдеру).
👍6🔥6
Грок, это блеф? Языковые модели сыграют в холдем друг против друга

Российский айтишник Максим Павлов (сейчас живет в Португалии) ровно через 3 недели начнет необычный эксперимент: усадит катать в холдем популярные языковые модели. Судя по анонсу, сражаться будут все главные звезды рынка: это Gemini, Claude, GPT-5, DeepSeek и Grok. Соревноваться они будут с 27 октября по 3 ноября на сайте PokerBattle AI

Забавно, что Павлов — совсем не рег, покером он заинтересовался недавно. Вот что он рассказал журналистам:
«Я сейчас изучаю покер и пытаюсь понять, как обучаться максимально эффективно. Солверы — это круто, но немного пугают сложностью, для начала я хочу освоить базовую стратегию. Хочу привлечь нейросети, но не понимаю, какая из моделей справится лучше. Проверим!»


По замыслу Павлова, каждая модель получит банкролл в 100,000 условных фишек, играть будут 10/20, стартовые стеки по 100 ББ. При падении до 50 ББ — автодокупка, при потере стека — авторебай. Игра будет идти круглосуточно, а все раздачи, результаты и статистика (в том числе VPIP, PFR, 3-бет и прочие статы) будут доступны зрителям. Мало того, каждая модель еще и будет пояснять все свои решения в реальном времени ☝️

Проект некоммерческий: все механики и интерфейс (и ГСЧ в том числе) Павлов взял из открытых источников, а собрать всё это вместе помогли всё те же нейросети. Будет интересно понаблюдать за этим экспериментом. Отдельно любопытно — будут ли модели как-то учитывать историю раздач и пытаться строить эксплойты на ее основе. Весной Нейт Сильвер пытался поговорить о покере с ChatGPT — и тот справился совсем плохо. Но с тех пор и эта, и другие модели поумнели. Может быть, какая-то из них разнесет оппонентов в пух и прах?..
🔥9👍2
Очень прошу прощения за эту ссылку: https://news.1rj.ru/str/prbezposhady/27802 не рекомендую этот канал, но он просто показателен тем насколько нарратив нормиз-сми расходиться с реальностью. У нормизов оказываться GPT-5 это провальная модель, так что я решил пояснить за GPT-5.

В плане написания кода gpt-5 это лучшая модель от опенаи, а возможно, вообще лучшая. Я это говорю не исходя из бенчмарков или мнения людей из твиттера (которые сделали свои выводы за пару часов после выхода gpt-5), а по своему опыту. Я буквально практически каждый день пишу код применяя gpt-5 и gpt-5-codex и ну, лучше этого опенаи ничего не выпускали, прогресс по сравнению с моделями семейства gpt-4 для меня очевиден.

Если раньше модели от опенаи могли ошибаться, выдумывать библиотеки, выдумывать функции у существующих библиотек и совершать прочие глупые ошибки на которых при этом они строили потом весь код, то у GPT-5 я такого практически не встречаю. GPT-5 совершает ошибки, но это скорее ошибки на архитектурном уровне.

Он практически всегда пишет рабочий код, но у него много проблем с оценкой проекта на архитектурном уровне, без помощи программиста код от GPT-5 будет представляет из себя кучу работающих костылей.

И это заметный прогресс по сравнению со всем что делали опенаи до этого. Так что да, несмотря на то что пишет твиттер и рассказывают некоторые телеграм каналы я считаю что GPT-5 это успех.

И да я знаю что я пишу это "поздно" - ведь все обсуждения и сравнения связанные с GPT-5 уже давно закончились, но в том то и дело - я пишу это исходя из своего опыта, а этот опыт нужно было наработать. Модели нужно "распробовать", невозможно составить адекватное мнение о модели за пару часов (да и даже, за неделю).
👍161👎1🔥1
Лайфхак - как работать с данными при помощи нейросетей

Есть очень полезный и простой прием позволяющий намного улучшить работу с данными при помощи нейросетей.

Допустим у вас есть JSON из которого нужно вытащить определенные данные, можно закинуть этот json в контекст нейросети и попросить ее вытащить эти данные, но есть шанс что нейросеть выдумает какие-то данные или что-то забудет. И чем больше этот JSON тем выше шанс того что нейросеть что-то перепутает.

По этому лучше просить нейросеть НЕ вытаскивать данные, а попросить ее написать функцию для вытаскивания нужных данных. И потом либо самому применить эту функцию, либо попросить это сделать агента.

Почему так делать намного лучше?

1) Гораздо проще проверить одну функцию чем проверять все данные которые нейросеть вытащила.

2) Нейросети очень хороши в написании таких небольших чистых функций, шанс ошибки тут намного меньше чем если просить ИИ вытащить данные "в лоб".

И это касается не только JSON, а вообще любых файлов из которых может понадобиться что-то вытащить: CSV, HTML и тд.
👍16❤‍🔥4👏1
Скоро, 14 октября пройдет конфа про разработку с применением нейросетей, должно быть интересно, лично я посмотрю (не знаю будет ли там чат, но если будет то постараюсь там поактивничать).

Среди спикеров будет много тех кого я читаю в телеграме. При чем на конфу можно записаться бесплатно, но при условии подписки на телеграм каналы спикеров, так вот, я уже и так был подписан почти на всех =/ так что в спикерах я уверен.

Ссылка: https://www.ai-dev.live
🔥6👍21🤔1
Сегодня, в 20:00 по МСК, я запущу стрим на Твиче: https://www.twitch.tv/tosternoscript

У нас будет новый гость, впервые на мой стрим придет Грок! Та самая нейросеть от Илона Маска.

Гемма и Гигачат тоже будут, так что впервые в моем стриме будут участвовать сразу три нейросети.

Чем мы займемся? Продолжим угадывать игры по скриншотам! Грок, как и Гемма с ГигаЧатом умеет распознавать картинки, вот и посмотрим кто лучше всех будет угадывать игры.
🔥12
https://www.twitch.tv/tosternoscript - стрим начался, заходите, будем проверят на что способен Грок.
👍7
Запись вчерашнего стрима с состязанием Грока, Геммы и Гигачата в определении игр по скриншотам: https://vkvideo.ru/video-227821233_456239038

Дальше спойлеры.

Я изначально думал что Грок себя очень хорошо покажет и порвет всех, но вместо этого он оказался хуже и Геммы и Гигачата в определении игр. Но при этом когда ему удавалось определить игру он очень не плохо и интересно ее описывал. Видно что картинки это его слабя часть, но болтать он умеет, нужно будет его еще поизучать.
👍4🍌1