Я стараюсь читать все комментарии к видео "Почему нейросети постоянно врут?" (это не так просто, у него уже почти четыре тысячи комментов).
Так вот, там есть комментарии в духе "но люди ведь тоже врут" или "человеческий мозг работает так же".
Хочу написать ответ на эти комментарии.
Это вопрос того чего мы вообще хотим от ИИ, ну то есть опенаи провозгласили своей целью создание AGI, но AGI у нас пока еще нет, а вот нейросети есть. И мы ими пользуемся, я вот каждый день юзаю нейросети. Это мой инструмент.
А раз это инструмент то, во первых, важно хотя бы на поверхностном уровне понимать как он работает, а во вторых, знать про его недостатки.
Ну то есть, если я спрашиваю у нейрости про какое-то лекарство, а она мне что-то отвечает, то мне очень важно знать что ее ответ может быть враньем. Какая мне при этом разница что человек то же может наврать? Ну да, может, но если от людей мы ожидаем вранья, то вот к нейросетям многие люди относятся как какому-то техно богу, но в реальности они ошибаются и галлюцинируют, они это делают по другим причинам, не по таким же как и люди, но они это делают.
Так что аргумент про то что "люди тоже врут" он вообще не работает, если нейросеть это инструмент то мы должны стремиться к тому что бы это был рабочий, полезный инструмент, а так же должны понимать его проблемы и недостатки.
Так вот, там есть комментарии в духе "но люди ведь тоже врут" или "человеческий мозг работает так же".
Хочу написать ответ на эти комментарии.
Это вопрос того чего мы вообще хотим от ИИ, ну то есть опенаи провозгласили своей целью создание AGI, но AGI у нас пока еще нет, а вот нейросети есть. И мы ими пользуемся, я вот каждый день юзаю нейросети. Это мой инструмент.
А раз это инструмент то, во первых, важно хотя бы на поверхностном уровне понимать как он работает, а во вторых, знать про его недостатки.
Ну то есть, если я спрашиваю у нейрости про какое-то лекарство, а она мне что-то отвечает, то мне очень важно знать что ее ответ может быть враньем. Какая мне при этом разница что человек то же может наврать? Ну да, может, но если от людей мы ожидаем вранья, то вот к нейросетям многие люди относятся как какому-то техно богу, но в реальности они ошибаются и галлюцинируют, они это делают по другим причинам, не по таким же как и люди, но они это делают.
Так что аргумент про то что "люди тоже врут" он вообще не работает, если нейросеть это инструмент то мы должны стремиться к тому что бы это был рабочий, полезный инструмент, а так же должны понимать его проблемы и недостатки.
🔥22❤8👍6😁1💋1
Часто поступают вопросы про то какая модель лучше, для каких целей и тд. Сейчас есть много разных сайтов где сравнивают модели по разным параметрам. Один из самых авторитетных сайтов для этого это https://artificialanalysis.ai, к тому же он еще и довольно удобный.
Вот к примеру сравнение разных чат ботов (именно чат ботов, не моделей): https://artificialanalysis.ai/insights/chatbots-comparison, сверху там сразу есть список того для каких целей какой чат бот лучше (скрин прикрепил к посту, будет потом интересно глянуть изменилось ли что-то скажем через пол года). Там в сравнениях даже есть Character AI, у него по показателям все плохо, даже разлогиненный (!) чатгпт лучше.
(дата обновления инфы про чат боты там 15 Sep 2024, так что в целом инфа там старая).
Или, часто спрашивают про генерацию картинок, вот тут есть text-to-image: https://artificialanalysis.ai/text-to-image - я если честно ничего не слышал ни про Seedream 3.0, ни про Recraft V3 - а у них прям не плохие показатели.
Вот еще таблица лидеров на арене для моделей для генерации картинок: https://artificialanalysis.ai/text-to-image/arena?tab=leaderboard - там в том числе есть выбор по стилям картинок (аниме есть).
Или вот сравнение текстовых моделей по языка: https://artificialanalysis.ai/models/multilingual - и тут виден главный минус artificial analysis, полный игнор русского языка (как и российских моделей и ИИ сервисов). Это нужно учитывать.
В целом это очень полезный сайт, как минимум позволяет увидеть какие вообще сейчас есть актуальные модели.
Вот к примеру сравнение разных чат ботов (именно чат ботов, не моделей): https://artificialanalysis.ai/insights/chatbots-comparison, сверху там сразу есть список того для каких целей какой чат бот лучше (скрин прикрепил к посту, будет потом интересно глянуть изменилось ли что-то скажем через пол года). Там в сравнениях даже есть Character AI, у него по показателям все плохо, даже разлогиненный (!) чатгпт лучше.
(дата обновления инфы про чат боты там 15 Sep 2024, так что в целом инфа там старая).
Или, часто спрашивают про генерацию картинок, вот тут есть text-to-image: https://artificialanalysis.ai/text-to-image - я если честно ничего не слышал ни про Seedream 3.0, ни про Recraft V3 - а у них прям не плохие показатели.
Вот еще таблица лидеров на арене для моделей для генерации картинок: https://artificialanalysis.ai/text-to-image/arena?tab=leaderboard - там в том числе есть выбор по стилям картинок (аниме есть).
Или вот сравнение текстовых моделей по языка: https://artificialanalysis.ai/models/multilingual - и тут виден главный минус artificial analysis, полный игнор русского языка (как и российских моделей и ИИ сервисов). Это нужно учитывать.
В целом это очень полезный сайт, как минимум позволяет увидеть какие вообще сейчас есть актуальные модели.
❤13🫡2👍1
В догонку к предыдущему посту 👆, в табличке на странице со сравнением чат ботов https://artificialanalysis.ai/insights/chatbots-comparison есть сравнение по Privacy, но какая-то там не полная информация.
OpenAi обязаны по решению суда хранить все логи всех чатов chatGPT, даже те которые были удалены юзером. И мало того что они обязаны это хранить, они обязаны передавать эту информацию газете нью йорк таймс (да, звучит это как выдумка сгаллюцинировавшей нейросети, но к сожалению это правда). Никаким образом отписаться от этого юзер не может. Это явно влияет на Privacy, но ничего про это решение суда в строке Privacy не написано.
OpenAi обязаны по решению суда хранить все логи всех чатов chatGPT, даже те которые были удалены юзером. И мало того что они обязаны это хранить, они обязаны передавать эту информацию газете нью йорк таймс (да, звучит это как выдумка сгаллюцинировавшей нейросети, но к сожалению это правда). Никаким образом отписаться от этого юзер не может. Это явно влияет на Privacy, но ничего про это решение суда в строке Privacy не написано.
😨11
Выходит у нас сейчас есть такие вот российские опенсорсные модели, они все разных размеров (я не знаю, они типа сговорились чтобы заполнить разные ниши или что?), так что можно подобрать что-то под свое устройство:
https://huggingface.co/t-tech/T-pro-it-2.0-GGUF (32B) - т-банк, прям только что вышла, я ее немного потрогал, вроде работает хорошо, но даже в русскоязычном контексте пытается переходить на инглишь.
https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-v1.5-GGUF - как по мне одна из лучших опенсорсных моделей на русском языке.
https://huggingface.co/yandex/YandexGPT-5-Lite-8B-instruct-GGUF - у яндекса странная лицензия, и еще эта модель любит переходить на инглишь, у меня она постоянно это делает.
https://huggingface.co/MTSAIR/Cotype-Nano-GGUF - маленькая модель от МТС (всего 1.54B), не могу ничего про нее сказать. Среди маленьких моделей определенно одна из лучших это Gemma3, было бы интересно сравнить модель от МТС с ней, именно в русском языке в который Gemma 3 в целом умеет.
Все ссылки даю на GGUF, небольшой лайфхак, что бы установить GGUF модель с huggingface при помощи Ollama нужно вводить такую команду:
Это пример для модели от т-банка, но у других такой же принцип.
https://huggingface.co/t-tech/T-pro-it-2.0-GGUF (32B) - т-банк, прям только что вышла, я ее немного потрогал, вроде работает хорошо, но даже в русскоязычном контексте пытается переходить на инглишь.
https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-v1.5-GGUF - как по мне одна из лучших опенсорсных моделей на русском языке.
https://huggingface.co/yandex/YandexGPT-5-Lite-8B-instruct-GGUF - у яндекса странная лицензия, и еще эта модель любит переходить на инглишь, у меня она постоянно это делает.
https://huggingface.co/MTSAIR/Cotype-Nano-GGUF - маленькая модель от МТС (всего 1.54B), не могу ничего про нее сказать. Среди маленьких моделей определенно одна из лучших это Gemma3, было бы интересно сравнить модель от МТС с ней, именно в русском языке в который Gemma 3 в целом умеет.
Все ссылки даю на GGUF, небольшой лайфхак, что бы установить GGUF модель с huggingface при помощи Ollama нужно вводить такую команду:
ollama run hf.co/t-tech/T-pro-it-2.0-GGUF:Q4_K_M
Это пример для модели от т-банка, но у других такой же принцип.
huggingface.co
ai-sage/GigaChat-20B-A3B-instruct-v1.5-GGUF · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤8🌚1
Forwarded from [31/100] Витя Тарнавский
T-pro 2.0 – с гибридным ризонингом 🥳
Лучшая модель в своём весе среди всех открытых моделей по широкому ряду русскоязычных бенчмарков. В два раза более быстрая и дешевая чем аналоги по качеству.
Модель с рассуждениями, создана для построения сложных систем и решения сложных задач. Модель в открытом доступе, качай да используй.
– Qwen3 32B based
– Гибридный ризонинг
– Уплотненный токенайзер на русском
– Спекулятивный декодер в комплекте
– Apache 2.0 – используй как хочешь
Больше подробностей выложим в тех репорте – с бенчмарками и накопленными знаниями.
Сама модель и основные бенчмарки
Спекулятивный декодер
Новость
Лучшая модель в своём весе среди всех открытых моделей по широкому ряду русскоязычных бенчмарков. В два раза более быстрая и дешевая чем аналоги по качеству.
Модель с рассуждениями, создана для построения сложных систем и решения сложных задач. Модель в открытом доступе, качай да используй.
– Qwen3 32B based
– Гибридный ризонинг
– Уплотненный токенайзер на русском
– Спекулятивный декодер в комплекте
– Apache 2.0 – используй как хочешь
Больше подробностей выложим в тех репорте – с бенчмарками и накопленными знаниями.
Сама модель и основные бенчмарки
Спекулятивный декодер
Новость
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍3
👆на счет "Уплотненный токенайзер на русском" - мне вот интересно повлияет ли это на то что модель от т-банка будет лучше работать с русскоязычным контекстом? Одна из проблем русского языка это то что он требует больше токенов чем инглишь, из-за чего контекстное окно моделей на самом деле "меньше" если вы работаете с русским языком, при чем прям заметно меньше.
Для меня это одна из проблем - я хочу работать со своими текстами в компе, юзая локальную модель, но если эти тексты на русском то все, хоть сколько нибудь большой текст моделью перестает восприниматься нормально, она видит только конец. Да можно разбивать тексты на куски и тд, но хочется же что бы все просто работало. Нужно будет затестить эту модель от т-банка может она будет в этом плане лучше.
Для меня это одна из проблем - я хочу работать со своими текстами в компе, юзая локальную модель, но если эти тексты на русском то все, хоть сколько нибудь большой текст моделью перестает восприниматься нормально, она видит только конец. Да можно разбивать тексты на куски и тд, но хочется же что бы все просто работало. Нужно будет затестить эту модель от т-банка может она будет в этом плане лучше.
👍8
Два скриншота, так сказать, демонстрация ситуации с перезаливщиками на вк.
Удивительно но на ютубе я не нашел ни одного перезалива моего видоса, есть одна реакция, но я ничего плохого в реакциях на свои видосы не вижу, вот ссылка если кому интересно глянуть: https://www.youtube.com/watch?v=Fkifsr7-qbE
А на ВК видео, ну, просто нет слов. ВК, не думаю что вы там меня слушать будите, но пока у вас такая ситуация с перезаливщиками, когда они там просто друг на друге сидят, вашу платформу ни зрители, ни создатели контента всерьез воспринимать не будут.
Удивительно но на ютубе я не нашел ни одного перезалива моего видоса, есть одна реакция, но я ничего плохого в реакциях на свои видосы не вижу, вот ссылка если кому интересно глянуть: https://www.youtube.com/watch?v=Fkifsr7-qbE
А на ВК видео, ну, просто нет слов. ВК, не думаю что вы там меня слушать будите, но пока у вас такая ситуация с перезаливщиками, когда они там просто друг на друге сидят, вашу платформу ни зрители, ни создатели контента всерьез воспринимать не будут.
👍12🐳2
Тут вышел AI чат бот от Proton, они его позиционируют как приватный опенсорсный чат, вот лендинг: https://lumo.proton.me/about
Все бы хорошо, но только они не опенсорс, более того, они вообще никакой полезной инфы не дают, даже не понятно какие модели они юзают. Но при этом у них хватает наглости утверждать что "Unlike other AI assistants, my code is fully open source". Ну то есть они утверждают что они полностью опенсорс, но код при этом не показывают.
Хорошо что в сравнительной табличке они вспомнили про DeepSeek который в отличие от lumo реально является опенсорсным, хотя в этой же табличке они почему-то утверждают что DeepSeek не "Has an ad-free business model".
Все бы хорошо, но только они не опенсорс, более того, они вообще никакой полезной инфы не дают, даже не понятно какие модели они юзают. Но при этом у них хватает наглости утверждать что "Unlike other AI assistants, my code is fully open source". Ну то есть они утверждают что они полностью опенсорс, но код при этом не показывают.
Хорошо что в сравнительной табличке они вспомнили про DeepSeek который в отличие от lumo реально является опенсорсным, хотя в этой же табличке они почему-то утверждают что DeepSeek не "Has an ad-free business model".
🤔8🤣5❤1
Я вот только что задал один и тот же вопрос сберовскому GigaChat (моделям MAX) и ChatGPT o3 (скрины всех ответов прикрепляю к посту, три скрина на белом фоне это gigachat).
Спрашивал я про то есть ли в gigachat api для генерации голоса по тексту, ну я и подумал почему бы не задать этот вопрос в gigachat если это вопрос буквально про gigachat?
И что же вы думаете? Gigachat не смог ответит на этот вопрос, ну то есть он на него ответил - в gigachat api нет такого функционала (а потом посоветовал мне самому поискать в документации, лол), и типа и все, гуляй.
При этом я еще два раза спросил, один раз рассуждающей модели, и один раз просто с поиском в интернете, но уже не стал давать ему ссылку (я подумал что она его путает). И на все эти попытки он не верно ответил.
И ну, как не верно, он правильно говорит - у gigachat реально нет TTS, только вот когда я спросил chatGPT он тоже сказал что такого в gigachat нет, но потом сказал что у сбера вообще-то есть другой продукт, SaluteSpeech, и вот он умеет в TTS.
То есть ChatGPT лучше разбирается в продукции сбера чем GigaChat. Или вернее так, формально GigaChat ответил правильно, но ChatGPT понял что мне действительно нужно, он помог мне додумав мой вопрос.
Сравнивать гигачат и чатгпт не честно, это модели из разных лиг, это понятно, но вот когда гигачат хуже отвечает на вопросы буквально связанные с ним же самим, нууу, так себе это выглядит.
Спрашивал я про то есть ли в gigachat api для генерации голоса по тексту, ну я и подумал почему бы не задать этот вопрос в gigachat если это вопрос буквально про gigachat?
И что же вы думаете? Gigachat не смог ответит на этот вопрос, ну то есть он на него ответил - в gigachat api нет такого функционала (а потом посоветовал мне самому поискать в документации, лол), и типа и все, гуляй.
При этом я еще два раза спросил, один раз рассуждающей модели, и один раз просто с поиском в интернете, но уже не стал давать ему ссылку (я подумал что она его путает). И на все эти попытки он не верно ответил.
И ну, как не верно, он правильно говорит - у gigachat реально нет TTS, только вот когда я спросил chatGPT он тоже сказал что такого в gigachat нет, но потом сказал что у сбера вообще-то есть другой продукт, SaluteSpeech, и вот он умеет в TTS.
То есть ChatGPT лучше разбирается в продукции сбера чем GigaChat. Или вернее так, формально GigaChat ответил правильно, но ChatGPT понял что мне действительно нужно, он помог мне додумав мой вопрос.
Сравнивать гигачат и чатгпт не честно, это модели из разных лиг, это понятно, но вот когда гигачат хуже отвечает на вопросы буквально связанные с ним же самим, нууу, так себе это выглядит.
🤯11👍6🤣5❤3🤔1
У яндекса есть сервис Yandex SpeechKit при помощи которого можно синтезировать любой текст в речь. Там есть набор разных голосов, вот список: https://yandex.cloud/ru/docs/speechkit/tts/voices
У голосов есть пол, имя, и еще есть "Амплуа", это интонация голоса: нейтральный, строгий, дружелюбный и тд, так вот, амплуа "evil" (буквально зло, хотя на русском яндекс называет это "раздраженный") есть только у двух голосов, и оба женские.
Яндекс нам чего-то про женщин таким образом сказать хочет?
У голосов есть пол, имя, и еще есть "Амплуа", это интонация голоса: нейтральный, строгий, дружелюбный и тд, так вот, амплуа "evil" (буквально зло, хотя на русском яндекс называет это "раздраженный") есть только у двух голосов, и оба женские.
Яндекс нам чего-то про женщин таким образом сказать хочет?
😁30
Я сейчас занимаюсь подключением своей программы к API Yandex SpeechKit (и да это имеет прямое отношение к будущему видео, но речь не об этом).
Так вот, Яндекс, вам чего-то с доками для SpeechKit нужно делать.
Во первых, почему оно на английском? https://yandex.cloud/ru/docs/speechkit/tts-v3/api-ref/Synthesizer/utteranceSynthesis документация для API v3 только на инглише. Но это ладно, окей.
Второе, куда важнее, и это мне убило несколько часов жизни. Знаете, я как-то привык к обычному JSON в REST, вместо этого яндекс принимает данные в NDJSON. Ну окей, почему бы и нет?
Но только вот они не говорят об этом. Что бы узнать как правильно нужно отправлять данные нужно вычитывать комментарии в JSON примере, то есть, буквально, самая важная инфа об API находиться в комментах к JSON-у. При этом сам по себе этот пример не правильный, его нужно воспринимать не как JSON который можно скопировать к себе и работать. В нем нужно вычитывать эти самые комментарии и по ним резать JSON на куски.
Пример сам по себе не рабочий, и до этого нужно как-то самому догадаться (ну как догадаться, помучаться в течении часа с их API и тогда...).
Не, может я отстал от жизни и использование NDJSON уже стало нормой, до такой степени что об этом можно уже даже и не говорить, но какую-то хотя бы плашку о об этом стоило написать, а по хорошему давать в документации, ну типа, работающие примеры JSON-нов.
Работать с голым API без SDK и так тяжко (как это обычно у яндекса и бывает, SDK есть только для питона), а тут еще и документация скорее путает чем помогает.
Так вот, Яндекс, вам чего-то с доками для SpeechKit нужно делать.
Во первых, почему оно на английском? https://yandex.cloud/ru/docs/speechkit/tts-v3/api-ref/Synthesizer/utteranceSynthesis документация для API v3 только на инглише. Но это ладно, окей.
Второе, куда важнее, и это мне убило несколько часов жизни. Знаете, я как-то привык к обычному JSON в REST, вместо этого яндекс принимает данные в NDJSON. Ну окей, почему бы и нет?
Но только вот они не говорят об этом. Что бы узнать как правильно нужно отправлять данные нужно вычитывать комментарии в JSON примере, то есть, буквально, самая важная инфа об API находиться в комментах к JSON-у. При этом сам по себе этот пример не правильный, его нужно воспринимать не как JSON который можно скопировать к себе и работать. В нем нужно вычитывать эти самые комментарии и по ним резать JSON на куски.
Пример сам по себе не рабочий, и до этого нужно как-то самому догадаться (ну как догадаться, помучаться в течении часа с их API и тогда...).
Не, может я отстал от жизни и использование NDJSON уже стало нормой, до такой степени что об этом можно уже даже и не говорить, но какую-то хотя бы плашку о об этом стоило написать, а по хорошему давать в документации, ну типа, работающие примеры JSON-нов.
Работать с голым API без SDK и так тяжко (как это обычно у яндекса и бывает, SDK есть только для питона), а тут еще и документация скорее путает чем помогает.
🔥9👏2🤯2❤1
Если юзать сберовский GigaChat в https://developers.sber.ru/studio/workspaces то там будут доступны доп настройки которых нет в чате для обычных юзеров (https://giga.chat/gigachat/).
Там можно указать температуру и top_k. Но главное что там есть отключение фильтров 😄 но доступно оно только юридическим лицам 😭. Ну то есть, типа, регать ООО что бы потрогать гигачат без цензуры?
У яндекса, впрочем, насколько я знаю, отключения фильтров нет в принципе, кем бы ты ни был.
Там можно указать температуру и top_k. Но главное что там есть отключение фильтров 😄 но доступно оно только юридическим лицам 😭. Ну то есть, типа, регать ООО что бы потрогать гигачат без цензуры?
У яндекса, впрочем, насколько я знаю, отключения фильтров нет в принципе, кем бы ты ни был.
👍10❤1
Meta* разрешит юзать ИИ на собеседованиях для программистов: https://news.1rj.ru/str/tg_1red2black/2350
Вообще, можно пойти дальше, нужно запретить программистам вообще писать код на собесах. Пускай только вайбкодядт. Не смог заставить гпт написать нужную программу - досвидос.
*Признана экстремистской организацией и запрещена в РФ.
Согласно внутренним документам Meta, с которыми ознакомились журналисты 404 Media, компания сообщила сотрудникам, что позволит кандидатам-программистам использовать ИИ-ассистенты на собеседовании.
Вообще, можно пойти дальше, нужно запретить программистам вообще писать код на собесах. Пускай только вайбкодядт. Не смог заставить гпт написать нужную программу - досвидос.
*Признана экстремистской организацией и запрещена в РФ.
Telegram
Откровения от Олега
Meta позволит кандидатам использовать ИИ на собеседованиях по программированию
Meta — страшная, дико запрещенная в России нежелательная организация.
Марк Цукерберг заявил, что в ближайшем будущем вайбкодинг станет важной частью инженерной работы в Meta.…
Meta — страшная, дико запрещенная в России нежелательная организация.
Марк Цукерберг заявил, что в ближайшем будущем вайбкодинг станет важной частью инженерной работы в Meta.…
❤3❤🔥1