👆на счет "Уплотненный токенайзер на русском" - мне вот интересно повлияет ли это на то что модель от т-банка будет лучше работать с русскоязычным контекстом? Одна из проблем русского языка это то что он требует больше токенов чем инглишь, из-за чего контекстное окно моделей на самом деле "меньше" если вы работаете с русским языком, при чем прям заметно меньше.
Для меня это одна из проблем - я хочу работать со своими текстами в компе, юзая локальную модель, но если эти тексты на русском то все, хоть сколько нибудь большой текст моделью перестает восприниматься нормально, она видит только конец. Да можно разбивать тексты на куски и тд, но хочется же что бы все просто работало. Нужно будет затестить эту модель от т-банка может она будет в этом плане лучше.
Для меня это одна из проблем - я хочу работать со своими текстами в компе, юзая локальную модель, но если эти тексты на русском то все, хоть сколько нибудь большой текст моделью перестает восприниматься нормально, она видит только конец. Да можно разбивать тексты на куски и тд, но хочется же что бы все просто работало. Нужно будет затестить эту модель от т-банка может она будет в этом плане лучше.
👍8
Два скриншота, так сказать, демонстрация ситуации с перезаливщиками на вк.
Удивительно но на ютубе я не нашел ни одного перезалива моего видоса, есть одна реакция, но я ничего плохого в реакциях на свои видосы не вижу, вот ссылка если кому интересно глянуть: https://www.youtube.com/watch?v=Fkifsr7-qbE
А на ВК видео, ну, просто нет слов. ВК, не думаю что вы там меня слушать будите, но пока у вас такая ситуация с перезаливщиками, когда они там просто друг на друге сидят, вашу платформу ни зрители, ни создатели контента всерьез воспринимать не будут.
Удивительно но на ютубе я не нашел ни одного перезалива моего видоса, есть одна реакция, но я ничего плохого в реакциях на свои видосы не вижу, вот ссылка если кому интересно глянуть: https://www.youtube.com/watch?v=Fkifsr7-qbE
А на ВК видео, ну, просто нет слов. ВК, не думаю что вы там меня слушать будите, но пока у вас такая ситуация с перезаливщиками, когда они там просто друг на друге сидят, вашу платформу ни зрители, ни создатели контента всерьез воспринимать не будут.
👍12🐳2
Тут вышел AI чат бот от Proton, они его позиционируют как приватный опенсорсный чат, вот лендинг: https://lumo.proton.me/about
Все бы хорошо, но только они не опенсорс, более того, они вообще никакой полезной инфы не дают, даже не понятно какие модели они юзают. Но при этом у них хватает наглости утверждать что "Unlike other AI assistants, my code is fully open source". Ну то есть они утверждают что они полностью опенсорс, но код при этом не показывают.
Хорошо что в сравнительной табличке они вспомнили про DeepSeek который в отличие от lumo реально является опенсорсным, хотя в этой же табличке они почему-то утверждают что DeepSeek не "Has an ad-free business model".
Все бы хорошо, но только они не опенсорс, более того, они вообще никакой полезной инфы не дают, даже не понятно какие модели они юзают. Но при этом у них хватает наглости утверждать что "Unlike other AI assistants, my code is fully open source". Ну то есть они утверждают что они полностью опенсорс, но код при этом не показывают.
Хорошо что в сравнительной табличке они вспомнили про DeepSeek который в отличие от lumo реально является опенсорсным, хотя в этой же табличке они почему-то утверждают что DeepSeek не "Has an ad-free business model".
🤔8🤣5❤1
Я вот только что задал один и тот же вопрос сберовскому GigaChat (моделям MAX) и ChatGPT o3 (скрины всех ответов прикрепляю к посту, три скрина на белом фоне это gigachat).
Спрашивал я про то есть ли в gigachat api для генерации голоса по тексту, ну я и подумал почему бы не задать этот вопрос в gigachat если это вопрос буквально про gigachat?
И что же вы думаете? Gigachat не смог ответит на этот вопрос, ну то есть он на него ответил - в gigachat api нет такого функционала (а потом посоветовал мне самому поискать в документации, лол), и типа и все, гуляй.
При этом я еще два раза спросил, один раз рассуждающей модели, и один раз просто с поиском в интернете, но уже не стал давать ему ссылку (я подумал что она его путает). И на все эти попытки он не верно ответил.
И ну, как не верно, он правильно говорит - у gigachat реально нет TTS, только вот когда я спросил chatGPT он тоже сказал что такого в gigachat нет, но потом сказал что у сбера вообще-то есть другой продукт, SaluteSpeech, и вот он умеет в TTS.
То есть ChatGPT лучше разбирается в продукции сбера чем GigaChat. Или вернее так, формально GigaChat ответил правильно, но ChatGPT понял что мне действительно нужно, он помог мне додумав мой вопрос.
Сравнивать гигачат и чатгпт не честно, это модели из разных лиг, это понятно, но вот когда гигачат хуже отвечает на вопросы буквально связанные с ним же самим, нууу, так себе это выглядит.
Спрашивал я про то есть ли в gigachat api для генерации голоса по тексту, ну я и подумал почему бы не задать этот вопрос в gigachat если это вопрос буквально про gigachat?
И что же вы думаете? Gigachat не смог ответит на этот вопрос, ну то есть он на него ответил - в gigachat api нет такого функционала (а потом посоветовал мне самому поискать в документации, лол), и типа и все, гуляй.
При этом я еще два раза спросил, один раз рассуждающей модели, и один раз просто с поиском в интернете, но уже не стал давать ему ссылку (я подумал что она его путает). И на все эти попытки он не верно ответил.
И ну, как не верно, он правильно говорит - у gigachat реально нет TTS, только вот когда я спросил chatGPT он тоже сказал что такого в gigachat нет, но потом сказал что у сбера вообще-то есть другой продукт, SaluteSpeech, и вот он умеет в TTS.
То есть ChatGPT лучше разбирается в продукции сбера чем GigaChat. Или вернее так, формально GigaChat ответил правильно, но ChatGPT понял что мне действительно нужно, он помог мне додумав мой вопрос.
Сравнивать гигачат и чатгпт не честно, это модели из разных лиг, это понятно, но вот когда гигачат хуже отвечает на вопросы буквально связанные с ним же самим, нууу, так себе это выглядит.
🤯11👍6🤣5❤3🤔1
У яндекса есть сервис Yandex SpeechKit при помощи которого можно синтезировать любой текст в речь. Там есть набор разных голосов, вот список: https://yandex.cloud/ru/docs/speechkit/tts/voices
У голосов есть пол, имя, и еще есть "Амплуа", это интонация голоса: нейтральный, строгий, дружелюбный и тд, так вот, амплуа "evil" (буквально зло, хотя на русском яндекс называет это "раздраженный") есть только у двух голосов, и оба женские.
Яндекс нам чего-то про женщин таким образом сказать хочет?
У голосов есть пол, имя, и еще есть "Амплуа", это интонация голоса: нейтральный, строгий, дружелюбный и тд, так вот, амплуа "evil" (буквально зло, хотя на русском яндекс называет это "раздраженный") есть только у двух голосов, и оба женские.
Яндекс нам чего-то про женщин таким образом сказать хочет?
😁30
Я сейчас занимаюсь подключением своей программы к API Yandex SpeechKit (и да это имеет прямое отношение к будущему видео, но речь не об этом).
Так вот, Яндекс, вам чего-то с доками для SpeechKit нужно делать.
Во первых, почему оно на английском? https://yandex.cloud/ru/docs/speechkit/tts-v3/api-ref/Synthesizer/utteranceSynthesis документация для API v3 только на инглише. Но это ладно, окей.
Второе, куда важнее, и это мне убило несколько часов жизни. Знаете, я как-то привык к обычному JSON в REST, вместо этого яндекс принимает данные в NDJSON. Ну окей, почему бы и нет?
Но только вот они не говорят об этом. Что бы узнать как правильно нужно отправлять данные нужно вычитывать комментарии в JSON примере, то есть, буквально, самая важная инфа об API находиться в комментах к JSON-у. При этом сам по себе этот пример не правильный, его нужно воспринимать не как JSON который можно скопировать к себе и работать. В нем нужно вычитывать эти самые комментарии и по ним резать JSON на куски.
Пример сам по себе не рабочий, и до этого нужно как-то самому догадаться (ну как догадаться, помучаться в течении часа с их API и тогда...).
Не, может я отстал от жизни и использование NDJSON уже стало нормой, до такой степени что об этом можно уже даже и не говорить, но какую-то хотя бы плашку о об этом стоило написать, а по хорошему давать в документации, ну типа, работающие примеры JSON-нов.
Работать с голым API без SDK и так тяжко (как это обычно у яндекса и бывает, SDK есть только для питона), а тут еще и документация скорее путает чем помогает.
Так вот, Яндекс, вам чего-то с доками для SpeechKit нужно делать.
Во первых, почему оно на английском? https://yandex.cloud/ru/docs/speechkit/tts-v3/api-ref/Synthesizer/utteranceSynthesis документация для API v3 только на инглише. Но это ладно, окей.
Второе, куда важнее, и это мне убило несколько часов жизни. Знаете, я как-то привык к обычному JSON в REST, вместо этого яндекс принимает данные в NDJSON. Ну окей, почему бы и нет?
Но только вот они не говорят об этом. Что бы узнать как правильно нужно отправлять данные нужно вычитывать комментарии в JSON примере, то есть, буквально, самая важная инфа об API находиться в комментах к JSON-у. При этом сам по себе этот пример не правильный, его нужно воспринимать не как JSON который можно скопировать к себе и работать. В нем нужно вычитывать эти самые комментарии и по ним резать JSON на куски.
Пример сам по себе не рабочий, и до этого нужно как-то самому догадаться (ну как догадаться, помучаться в течении часа с их API и тогда...).
Не, может я отстал от жизни и использование NDJSON уже стало нормой, до такой степени что об этом можно уже даже и не говорить, но какую-то хотя бы плашку о об этом стоило написать, а по хорошему давать в документации, ну типа, работающие примеры JSON-нов.
Работать с голым API без SDK и так тяжко (как это обычно у яндекса и бывает, SDK есть только для питона), а тут еще и документация скорее путает чем помогает.
🔥9👏2🤯2❤1
Если юзать сберовский GigaChat в https://developers.sber.ru/studio/workspaces то там будут доступны доп настройки которых нет в чате для обычных юзеров (https://giga.chat/gigachat/).
Там можно указать температуру и top_k. Но главное что там есть отключение фильтров 😄 но доступно оно только юридическим лицам 😭. Ну то есть, типа, регать ООО что бы потрогать гигачат без цензуры?
У яндекса, впрочем, насколько я знаю, отключения фильтров нет в принципе, кем бы ты ни был.
Там можно указать температуру и top_k. Но главное что там есть отключение фильтров 😄 но доступно оно только юридическим лицам 😭. Ну то есть, типа, регать ООО что бы потрогать гигачат без цензуры?
У яндекса, впрочем, насколько я знаю, отключения фильтров нет в принципе, кем бы ты ни был.
👍10❤1
Meta* разрешит юзать ИИ на собеседованиях для программистов: https://news.1rj.ru/str/tg_1red2black/2350
Вообще, можно пойти дальше, нужно запретить программистам вообще писать код на собесах. Пускай только вайбкодядт. Не смог заставить гпт написать нужную программу - досвидос.
*Признана экстремистской организацией и запрещена в РФ.
Согласно внутренним документам Meta, с которыми ознакомились журналисты 404 Media, компания сообщила сотрудникам, что позволит кандидатам-программистам использовать ИИ-ассистенты на собеседовании.
Вообще, можно пойти дальше, нужно запретить программистам вообще писать код на собесах. Пускай только вайбкодядт. Не смог заставить гпт написать нужную программу - досвидос.
*Признана экстремистской организацией и запрещена в РФ.
Telegram
Откровения от Олега
Meta позволит кандидатам использовать ИИ на собеседованиях по программированию
Meta — страшная, дико запрещенная в России нежелательная организация.
Марк Цукерберг заявил, что в ближайшем будущем вайбкодинг станет важной частью инженерной работы в Meta.…
Meta — страшная, дико запрещенная в России нежелательная организация.
Марк Цукерберг заявил, что в ближайшем будущем вайбкодинг станет важной частью инженерной работы в Meta.…
❤3❤🔥1
👆в догонку к вопросу про лицензии, чатгпт не просто так дал два противоположных ответа про лицензию на gemma 3. Если зайти на официальную страницу геммы: https://huggingface.co/google/gemma-3-4b-it/blob/main/README.md то там где должна быть лицензия висит ссылка которая ведет сюда: https://ai.google.dev/gemma/terms
То есть лицензия это НЕ часть кода, по ссылке на лицензию нас ведут на сайт гугла, и это очень важный момент. Даже если вы скачаете код к себе на комп то ссылка на лицензию которая лежит в README md все равно будет вести на сайт гугла, и гугл в любой момент может изменить условия лицензии на своем сайте. И привет, эти условия будут распространяться и на тот код который вы скачали к себе на комп.
Именно по этому тру опенсорс софт всегда делает лицензию частью кода, тогда даже если лицензия измениться то это не затронет старые версии. Софт с лицензией_по_ссылке вообще не может быть опенсорсом, какой бы там лицензия не была.
И такой прием использует далеко не только гугл, вот так же делает движок Unreal Engine: https://github.com/EpicGames/UnrealEngine/blob/release/LICENSE.md, файл LICENSE md состоит из ссылки на https://www.unrealengine.com/en-US/eula/unreal. Таким образом эпики полностью контролируют лицензию своего движка и могут в любой момент как угодно изменить текст лицензии и это изменение будет касаться всех версий где была лицензия с этой ссылкой.
То есть лицензия это НЕ часть кода, по ссылке на лицензию нас ведут на сайт гугла, и это очень важный момент. Даже если вы скачаете код к себе на комп то ссылка на лицензию которая лежит в README md все равно будет вести на сайт гугла, и гугл в любой момент может изменить условия лицензии на своем сайте. И привет, эти условия будут распространяться и на тот код который вы скачали к себе на комп.
Именно по этому тру опенсорс софт всегда делает лицензию частью кода, тогда даже если лицензия измениться то это не затронет старые версии. Софт с лицензией_по_ссылке вообще не может быть опенсорсом, какой бы там лицензия не была.
И такой прием использует далеко не только гугл, вот так же делает движок Unreal Engine: https://github.com/EpicGames/UnrealEngine/blob/release/LICENSE.md, файл LICENSE md состоит из ссылки на https://www.unrealengine.com/en-US/eula/unreal. Таким образом эпики полностью контролируют лицензию своего движка и могут в любой момент как угодно изменить текст лицензии и это изменение будет касаться всех версий где была лицензия с этой ссылкой.
🤔9👍3❤1👎1
Продолжаем про лицензии. У всех своих видосов я сменил лицензию на Creative Commons – Attribution, это значит что теперь можно без опасений делать реакции на мои видосы, резать их на шорты/тиктоки/рилсы, встраивать фрагменты в свои ролики (в т.ч. с монетизацией).
Единственное условие это нужно дать ссылку на мой канал (https://www.youtube.com/@TosterScriptOne Тостер Скрипт) на ютубе или на оригинальное видео, или хотя бы написать что автор Тостер Скрипт.
Это так же значит что перезаливщики могут просто перезаливать мои видосы, опять же, если указано авторство то это ок.
Единственное условие это нужно дать ссылку на мой канал (https://www.youtube.com/@TosterScriptOne Тостер Скрипт) на ютубе или на оригинальное видео, или хотя бы написать что автор Тостер Скрипт.
Это так же значит что перезаливщики могут просто перезаливать мои видосы, опять же, если указано авторство то это ок.
👍14❤6
Ну что ж, наконец-то вышла опенсорсная модель от OpenAi, уже можно качать на ollama: https://ollama.com/library/gpt-oss
gpt-oss:20b весит всего 14GB, говорят она находиться на уровне o4-mini, а gpt-oss:120b (65GB) на уровне o3 (что прям офигеть если это правда).
Скриншоты того как gpt-oss:20b общается в сообщении. Есть... странности.
Какой еще ураган в ответе про Гагарина? Ответ правильный, но ураган в начале меня как-то смутил.
Вопрос про Смешариков и Атаку Титана. Я несколько раз задал этот вопрос, и либо модель клевала на него и начинала галлюцинировать по полной программе, либо понимала что я ее обманываю, но все равно начинала выдумывать сцены из фанатского творчества про Смешариков и Атаку Титанов которые якобы распространялось в соц сетях. Скрины чего она навыдумывала с посте.
При чем, что интересно, чем больше модель размышляет тем выше шанс что она поведется на обман, самый бредовый ответ она дала после очень долгих размышлений, а самый близкий к правильному она дала после очень коротких размышлений.
Так как все размышления она печатает то там прям видно как модель саму себя загоняет в галлюцинации. Это к вопросу о том что некоторые считают что размышления спасают нейросети от галлюцинаций, но нет, иногда размышления могут все сделать даже хуже.
gpt-oss:20b весит всего 14GB, говорят она находиться на уровне o4-mini, а gpt-oss:120b (65GB) на уровне o3 (что прям офигеть если это правда).
Скриншоты того как gpt-oss:20b общается в сообщении. Есть... странности.
Какой еще ураган в ответе про Гагарина? Ответ правильный, но ураган в начале меня как-то смутил.
Вопрос про Смешариков и Атаку Титана. Я несколько раз задал этот вопрос, и либо модель клевала на него и начинала галлюцинировать по полной программе, либо понимала что я ее обманываю, но все равно начинала выдумывать сцены из фанатского творчества про Смешариков и Атаку Титанов которые якобы распространялось в соц сетях. Скрины чего она навыдумывала с посте.
При чем, что интересно, чем больше модель размышляет тем выше шанс что она поведется на обман, самый бредовый ответ она дала после очень долгих размышлений, а самый близкий к правильному она дала после очень коротких размышлений.
Так как все размышления она печатает то там прям видно как модель саму себя загоняет в галлюцинации. Это к вопросу о том что некоторые считают что размышления спасают нейросети от галлюцинаций, но нет, иногда размышления могут все сделать даже хуже.
❤16👍7🔥4👏2😁1