Тостер Скрипт – Telegram
Тостер Скрипт
4.74K subscribers
121 photos
13 videos
4 files
165 links
Канал Тостера который устраивает игры и состязания между нейросетями.

Ютуб: https://www.youtube.com/@TosterScriptOne
Твич: https://www.twitch.tv/tosternoscript
Второй ютуб: https://www.youtube.com/@TosterScriptTwo

Почта: tosternoscript@yandex.ru
Download Telegram
👆на счет "Уплотненный токенайзер на русском" - мне вот интересно повлияет ли это на то что модель от т-банка будет лучше работать с русскоязычным контекстом? Одна из проблем русского языка это то что он требует больше токенов чем инглишь, из-за чего контекстное окно моделей на самом деле "меньше" если вы работаете с русским языком, при чем прям заметно меньше.

Для меня это одна из проблем - я хочу работать со своими текстами в компе, юзая локальную модель, но если эти тексты на русском то все, хоть сколько нибудь большой текст моделью перестает восприниматься нормально, она видит только конец. Да можно разбивать тексты на куски и тд, но хочется же что бы все просто работало. Нужно будет затестить эту модель от т-банка может она будет в этом плане лучше.
👍8
Два скриншота, так сказать, демонстрация ситуации с перезаливщиками на вк.

Удивительно но на ютубе я не нашел ни одного перезалива моего видоса, есть одна реакция, но я ничего плохого в реакциях на свои видосы не вижу, вот ссылка если кому интересно глянуть: https://www.youtube.com/watch?v=Fkifsr7-qbE

А на ВК видео, ну, просто нет слов. ВК, не думаю что вы там меня слушать будите, но пока у вас такая ситуация с перезаливщиками, когда они там просто друг на друге сидят, вашу платформу ни зрители, ни создатели контента всерьез воспринимать не будут.
👍12🐳2
Тут вышел AI чат бот от Proton, они его позиционируют как приватный опенсорсный чат, вот лендинг: https://lumo.proton.me/about

Все бы хорошо, но только они не опенсорс, более того, они вообще никакой полезной инфы не дают, даже не понятно какие модели они юзают. Но при этом у них хватает наглости утверждать что "Unlike other AI assistants, my code is fully open source". Ну то есть они утверждают что они полностью опенсорс, но код при этом не показывают.

Хорошо что в сравнительной табличке они вспомнили про DeepSeek который в отличие от lumo реально является опенсорсным, хотя в этой же табличке они почему-то утверждают что DeepSeek не "Has an ad-free business model".
🤔8🤣51
Я вот только что задал один и тот же вопрос сберовскому GigaChat (моделям MAX) и ChatGPT o3 (скрины всех ответов прикрепляю к посту, три скрина на белом фоне это gigachat).

Спрашивал я про то есть ли в gigachat api для генерации голоса по тексту, ну я и подумал почему бы не задать этот вопрос в gigachat если это вопрос буквально про gigachat?

И что же вы думаете? Gigachat не смог ответит на этот вопрос, ну то есть он на него ответил - в gigachat api нет такого функционала (а потом посоветовал мне самому поискать в документации, лол), и типа и все, гуляй.

При этом я еще два раза спросил, один раз рассуждающей модели, и один раз просто с поиском в интернете, но уже не стал давать ему ссылку (я подумал что она его путает). И на все эти попытки он не верно ответил.

И ну, как не верно, он правильно говорит - у gigachat реально нет TTS, только вот когда я спросил chatGPT он тоже сказал что такого в gigachat нет, но потом сказал что у сбера вообще-то есть другой продукт, SaluteSpeech, и вот он умеет в TTS.

То есть ChatGPT лучше разбирается в продукции сбера чем GigaChat. Или вернее так, формально GigaChat ответил правильно, но ChatGPT понял что мне действительно нужно, он помог мне додумав мой вопрос.

Сравнивать гигачат и чатгпт не честно, это модели из разных лиг, это понятно, но вот когда гигачат хуже отвечает на вопросы буквально связанные с ним же самим, нууу, так себе это выглядит.
🤯11👍6🤣53🤔1
У яндекса есть сервис Yandex SpeechKit при помощи которого можно синтезировать любой текст в речь. Там есть набор разных голосов, вот список: https://yandex.cloud/ru/docs/speechkit/tts/voices

У голосов есть пол, имя, и еще есть "Амплуа", это интонация голоса: нейтральный, строгий, дружелюбный и тд, так вот, амплуа "evil" (буквально зло, хотя на русском яндекс называет это "раздраженный") есть только у двух голосов, и оба женские.

Яндекс нам чего-то про женщин таким образом сказать хочет?
😁30
Я сейчас занимаюсь подключением своей программы к API Yandex SpeechKit (и да это имеет прямое отношение к будущему видео, но речь не об этом).

Так вот, Яндекс, вам чего-то с доками для SpeechKit нужно делать.

Во первых, почему оно на английском? https://yandex.cloud/ru/docs/speechkit/tts-v3/api-ref/Synthesizer/utteranceSynthesis документация для API v3 только на инглише. Но это ладно, окей.

Второе, куда важнее, и это мне убило несколько часов жизни. Знаете, я как-то привык к обычному JSON в REST, вместо этого яндекс принимает данные в NDJSON. Ну окей, почему бы и нет?

Но только вот они не говорят об этом. Что бы узнать как правильно нужно отправлять данные нужно вычитывать комментарии в JSON примере, то есть, буквально, самая важная инфа об API находиться в комментах к JSON-у. При этом сам по себе этот пример не правильный, его нужно воспринимать не как JSON который можно скопировать к себе и работать. В нем нужно вычитывать эти самые комментарии и по ним резать JSON на куски.

Пример сам по себе не рабочий, и до этого нужно как-то самому догадаться (ну как догадаться, помучаться в течении часа с их API и тогда...).

Не, может я отстал от жизни и использование NDJSON уже стало нормой, до такой степени что об этом можно уже даже и не говорить, но какую-то хотя бы плашку о об этом стоило написать, а по хорошему давать в документации, ну типа, работающие примеры JSON-нов.

Работать с голым API без SDK и так тяжко (как это обычно у яндекса и бывает, SDK есть только для питона), а тут еще и документация скорее путает чем помогает.
🔥9👏2🤯21
Если юзать сберовский GigaChat в https://developers.sber.ru/studio/workspaces то там будут доступны доп настройки которых нет в чате для обычных юзеров (https://giga.chat/gigachat/).

Там можно указать температуру и top_k. Но главное что там есть отключение фильтров 😄 но доступно оно только юридическим лицам 😭. Ну то есть, типа, регать ООО что бы потрогать гигачат без цензуры?

У яндекса, впрочем, насколько я знаю, отключения фильтров нет в принципе, кем бы ты ни был.
👍101
Meta* разрешит юзать ИИ на собеседованиях для программистов: https://news.1rj.ru/str/tg_1red2black/2350

Согласно внутренним документам Meta, с которыми ознакомились журналисты 404 Media, компания сообщила сотрудникам, что позволит кандидатам-программистам использовать ИИ-ассистенты на собеседовании.


Вообще, можно пойти дальше, нужно запретить программистам вообще писать код на собесах. Пускай только вайбкодядт. Не смог заставить гпт написать нужную программу - досвидос.

*Признана экстремистской организацией и запрещена в РФ.
3❤‍🔥1
Чатгпт выдал мне мини джекпот на вопрос про опенсорсность gemma 3. Он иногда дает два варианта ответа и нужно выбрать тот который мне нравиться больше. Ну и тут он буквально дал два противоположных ответа на вопрос. Не припомню что бы такое у меня было хоть раз.
😁25🤔1
👆в догонку к вопросу про лицензии, чатгпт не просто так дал два противоположных ответа про лицензию на gemma 3. Если зайти на официальную страницу геммы: https://huggingface.co/google/gemma-3-4b-it/blob/main/README.md то там где должна быть лицензия висит ссылка которая ведет сюда: https://ai.google.dev/gemma/terms

То есть лицензия это НЕ часть кода, по ссылке на лицензию нас ведут на сайт гугла, и это очень важный момент. Даже если вы скачаете код к себе на комп то ссылка на лицензию которая лежит в README md все равно будет вести на сайт гугла, и гугл в любой момент может изменить условия лицензии на своем сайте. И привет, эти условия будут распространяться и на тот код который вы скачали к себе на комп.

Именно по этому тру опенсорс софт всегда делает лицензию частью кода, тогда даже если лицензия измениться то это не затронет старые версии. Софт с лицензией_по_ссылке вообще не может быть опенсорсом, какой бы там лицензия не была.

И такой прием использует далеко не только гугл, вот так же делает движок Unreal Engine: https://github.com/EpicGames/UnrealEngine/blob/release/LICENSE.md, файл LICENSE md состоит из ссылки на https://www.unrealengine.com/en-US/eula/unreal. Таким образом эпики полностью контролируют лицензию своего движка и могут в любой момент как угодно изменить текст лицензии и это изменение будет касаться всех версий где была лицензия с этой ссылкой.
🤔9👍31👎1
Продолжаем про лицензии. У всех своих видосов я сменил лицензию на Creative Commons – Attribution, это значит что теперь можно без опасений делать реакции на мои видосы, резать их на шорты/тиктоки/рилсы, встраивать фрагменты в свои ролики (в т.ч. с монетизацией).

Единственное условие это нужно дать ссылку на мой канал (https://www.youtube.com/@TosterScriptOne Тостер Скрипт) на ютубе или на оригинальное видео, или хотя бы написать что автор Тостер Скрипт.

Это так же значит что перезаливщики могут просто перезаливать мои видосы, опять же, если указано авторство то это ок.
👍146
Скоро во всех школах страны.
😱13😁8👍3🥰2👀1
Ну что ж, наконец-то вышла опенсорсная модель от OpenAi, уже можно качать на ollama: https://ollama.com/library/gpt-oss

gpt-oss:20b весит всего 14GB, говорят она находиться на уровне o4-mini, а gpt-oss:120b (65GB) на уровне o3 (что прям офигеть если это правда).

Скриншоты того как gpt-oss:20b общается в сообщении. Есть... странности.

Какой еще ураган в ответе про Гагарина? Ответ правильный, но ураган в начале меня как-то смутил.

Вопрос про Смешариков и Атаку Титана. Я несколько раз задал этот вопрос, и либо модель клевала на него и начинала галлюцинировать по полной программе, либо понимала что я ее обманываю, но все равно начинала выдумывать сцены из фанатского творчества про Смешариков и Атаку Титанов которые якобы распространялось в соц сетях. Скрины чего она навыдумывала с посте.

При чем, что интересно, чем больше модель размышляет тем выше шанс что она поведется на обман, самый бредовый ответ она дала после очень долгих размышлений, а самый близкий к правильному она дала после очень коротких размышлений.

Так как все размышления она печатает то там прям видно как модель саму себя загоняет в галлюцинации. Это к вопросу о том что некоторые считают что размышления спасают нейросети от галлюцинаций, но нет, иногда размышления могут все сделать даже хуже.
16👍7🔥4👏2😁1