Шахматы с ИИ
Искусственный интеллект давно победил человека в шахматы, и эту ситуацию часто используют для анализа того, что нас ждет. Самое интересное следствие, которое обнаружилось, что гроссмейстеры стали учиться у ИИ и, есть мнение, что они играют лучше великих мастеров XX века.
Давно напрашивался сервис, который бы на основе ИИ учил шахматистов массового розлива. На днях я встретил такой сервис — Noctie.
Мы использовали подобную логику в заданиях на креативность, которые прорабатывали на AI-хакатоне. Я убежден, что сейчас тот технологический момент, когда в любое игровое / интерактивное пространство можно привнести щепотку искусственного интеллекта и тем его преобразить в лучшую сторону.
#review #games
Искусственный интеллект давно победил человека в шахматы, и эту ситуацию часто используют для анализа того, что нас ждет. Самое интересное следствие, которое обнаружилось, что гроссмейстеры стали учиться у ИИ и, есть мнение, что они играют лучше великих мастеров XX века.
Давно напрашивался сервис, который бы на основе ИИ учил шахматистов массового розлива. На днях я встретил такой сервис — Noctie.
На входе ты играешь одну партию с компьютером и определяешь свой уровень игры. Далее ИИ-тренер настраивается на твой уровень игры и во время партии оценивает каждый твой ход по цветовой шкале (8-9 градаций). После окончания партии происходит разбор ошибок, ИИ подбирает 2-3 положения на доске, где я сходил плохо, и предлагает мне найти лучший ход. Возможно есть еще функционал, но уже этого достаточно, чтобы расти над собой.
Мы использовали подобную логику в заданиях на креативность, которые прорабатывали на AI-хакатоне. Я убежден, что сейчас тот технологический момент, когда в любое игровое / интерактивное пространство можно привнести щепотку искусственного интеллекта и тем его преобразить в лучшую сторону.
#review #games
app.noctie.ai
Practice chess against a humanlike chess AI & coach
🔥1
#ОбзорГены №3
{ Пульс }
⚡️ GPT-4 вернул лидерство среди LLM и стал заметно лучше в математике / рассуждениях.
⚡️ ChatGPT-момент в генерации песен. Кроме того, новичок Udio обошел Suno.
⚡️ Общение с цифровым аватаром — создали первую open-source сборку, где можно пообщаться с ИИ, как по зуму.
⚡️ ИИ видит сквозь стены благодаря Wi-Fi — анализ Wi-Fi волн позволяет ИИ фиксировать присутствие людей.
{ Свежак }
🔠 Adobe добавит AI в видеоредактор Premiere — причем как свои нейросети, так и сторонние (Sora).
🔠 YandexGPT 3 Pro появилась в голосовом помощнике «Алиса».
🔠 Amazon включил в состав совета директоров Эндрю Ына (Andrew Ng) — одного из наиболее уважаемых экспертов в AI-индустрии.
{ Текстуры }
✅ AI Index Report 2024 — ежегодный отчет от Стенфорда про тренды в AI.
✅ Системный промпт Claude — пример лаконичного промптинга.
✅ Карта ИИ-стартапов 2024 года — самая полная ИИ-карта.
✅ 43% студентов используют в учебе ИИ — исследование от НИУ-ВШЭ с подтверждением мысли о повальном использовании ChatGPT среди студентов.
✅ VoiceCraft: Zero-Shot редактор речи — прототип аудиоредактора, где речь можно изменять правкой текста.
{ Находки }
😯 Noctie — Шахматный ИИ-тренер.
😯 Real-time 3D generation — связка Dreams, Krea and 3daistudio для создания трехмерного персонажа.
😯 gpt-llm-trainer — упрощает процесс до-обучения ИИ-моделей под конкретную задачу.
{ Перекресток мнений }
❓ AI-FOMO. Никто не успевает за событиями в AI-мире. Это нормально. Успевать — кажется, вообще неважно, потому что отношения с ИИ надолго сохранятся, хотя будут и трансформироваться. Сейчас мы используем самые сильные нейросети как исполнителя, а позже (когда они станут умнее нас) будем учиться у самых сильных нейросетей как студент / подмастерье. Опоздать здесь нельзя.
#llm #text #music #speech #video #research #games #fomo #edu #map #promptgramming
{ Пульс }
{ Свежак }
{ Текстуры }
✅ AI Index Report 2024 — ежегодный отчет от Стенфорда про тренды в AI.
✅ Системный промпт Claude — пример лаконичного промптинга.
✅ Карта ИИ-стартапов 2024 года — самая полная ИИ-карта.
✅ 43% студентов используют в учебе ИИ — исследование от НИУ-ВШЭ с подтверждением мысли о повальном использовании ChatGPT среди студентов.
✅ VoiceCraft: Zero-Shot редактор речи — прототип аудиоредактора, где речь можно изменять правкой текста.
{ Находки }
😯 Noctie — Шахматный ИИ-тренер.
😯 Real-time 3D generation — связка Dreams, Krea and 3daistudio для создания трехмерного персонажа.
😯 gpt-llm-trainer — упрощает процесс до-обучения ИИ-моделей под конкретную задачу.
{ Перекресток мнений }
#llm #text #music #speech #video #research #games #fomo #edu #map #promptgramming
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DL Paper Reviews
Новая версия GPT-4 умеет решать олимпиадные задачки по математике на порядок круче, чем это делала предыдущая версия.
На соревновании, которое кстати еще идет, до апдейта GPT-4 решал только одну задачу и то с длинным промтом (по факту это подсказка).
…
На соревновании, которое кстати еще идет, до апдейта GPT-4 решал только одну задачу и то с длинным промтом (по факту это подсказка).
…
👍2🔥2❤1
Сопоставление нейросетей как спортсменов
На прошлой неделе новая (апрельская) версия GPT-4 вернула лидерство среди LLM, Claude Opus продержался на вершине всего две недели. Всё это максимально напоминает какой-нибудь рейтинг ATP, который тоже обновляется раз в неделю, и в Википедии вы найдете всех, кто хоть неделю занимал первую строчку, в том числе Кафельникова, Сафина и Медведева. Это вершина теннисной карьеры.
Второй тип стал доминировать, все следят за обновлением рейтинга. Недавно возник такой рейтинг среди LVM (Large Vision Models), которые умеют отвечать на вопросы по изображению. Неожиданно для себя на первом месте обнаружил неизвестную модель Reka-Flash (выше GPT-Vision и Claude Opus). Если это не сбой рейтинга, то скоро мы услышим про Reka отовсюду. К слову неделю назад вышла первая российская мультимодальная модель OmniFusion от института AIRI, близкого к Сколтеху.
Продолжая играться с Suno и Udio, мне очевидно, что в визуальных и музыкальных нейросетях должно появиться то же самое, если еще нет. Пользовательские предпочтения оказываются наиболее валидными на этом этапе. Пример топ-10 в text-to-image моделях (Midjourney — Stable Diffusion — DALL-E — Imagen — Kandinsky).
#lvm #llm #rating #image
На прошлой неделе новая (апрельская) версия GPT-4 вернула лидерство среди LLM, Claude Opus продержался на вершине всего две недели. Всё это максимально напоминает какой-нибудь рейтинг ATP, который тоже обновляется раз в неделю, и в Википедии вы найдете всех, кто хоть неделю занимал первую строчку, в том числе Кафельникова, Сафина и Медведева. Это вершина теннисной карьеры.
В мире нейросетей есть два типа соревнований:
1. Нейросеть решает заранее подготовленный бенчмарк (набор вопросов с правильным ответом). ГТО в мире ИИ.
2. Две нейросети анонимно выдают ответ на один и тот же запрос пользователя, а пользователь выбирает лучший ответ.
Второй тип стал доминировать, все следят за обновлением рейтинга. Недавно возник такой рейтинг среди LVM (Large Vision Models), которые умеют отвечать на вопросы по изображению. Неожиданно для себя на первом месте обнаружил неизвестную модель Reka-Flash (выше GPT-Vision и Claude Opus). Если это не сбой рейтинга, то скоро мы услышим про Reka отовсюду. К слову неделю назад вышла первая российская мультимодальная модель OmniFusion от института AIRI, близкого к Сколтеху.
Продолжая играться с Suno и Udio, мне очевидно, что в визуальных и музыкальных нейросетях должно появиться то же самое, если еще нет. Пользовательские предпочтения оказываются наиболее валидными на этом этапе. Пример топ-10 в text-to-image моделях (Midjourney — Stable Diffusion — DALL-E — Imagen — Kandinsky).
#lvm #llm #rating #image
huggingface.co
Vision Arena (Testing VLMs side-by-side) - a Hugging Face Space by WildVision
This application shows image analysis results by embedding a Gradio interface. Users can upload images, and the app will display the analysis directly in the browser.
Forwarded from Machinelearning
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👆 та самая модель, которую мне удалось обнаружить раньше, чем она расползлась по телеграму. Выглядит реально внушительно, и правда показывает лидерство в Vision-задачах.
👍2
В пятницу выступал в бизнес-клубе перед предпринимателями и менеджерами на тему "Prompt-gramming, или Программирование на естественном языке" (презентация). Основной посыл был в том, что программирование как действие выходит за пределы узко-профессионального сообщества и становится доступно любым профессионалам, которые мыслят алгоритмически.
Свежее следствие расцвета "программирования на естественном языке" — бум программируемой электроники. Logitech на днях презентовал компьютерную мышь с AI-кнопкой, но в реальности у них давно были программируемые кнопки, которые можно было запрограммировать через их софт. Уйдя на шаг вперед, легко представить, как кнопки программируются не через софт, а с голоса или умно подстраиваются под среду использования (браузер / видеоигра / музыкальный редактор). То же самое должно произойти с Arduino — возникнут простейшие роботы с голосовым управлением.
#promptgramming #event #code #electronics #robotics
Мысль не новая, она гуляет по Youtube уже изрядное время. Успехи GPT-технологии в генерации кода феноменальны: происходит х50-100 удешевление написания / ревью / тестирования кода. Грубые подсчеты (не учитывающие многое) дают 0,5$ за строчку человеческого кода (150 строчек в день при месячной зарплате в 2000$). Я не эксперт в этом, за точные цифры не ручаюсь, главное, что происходит многократный демпинг, который невозможно игнорировать (даже при снижении качества кода).
Свежее следствие расцвета "программирования на естественном языке" — бум программируемой электроники. Logitech на днях презентовал компьютерную мышь с AI-кнопкой, но в реальности у них давно были программируемые кнопки, которые можно было запрограммировать через их софт. Уйдя на шаг вперед, легко представить, как кнопки программируются не через софт, а с голоса или умно подстраиваются под среду использования (браузер / видеоигра / музыкальный редактор). То же самое должно произойти с Arduino — возникнут простейшие роботы с голосовым управлением.
#promptgramming #event #code #electronics #robotics
Google Docs
Prompt-gramming, или программирование на естественном языке
{ Prompt-gramming } Программирование на естественном языке
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Автономные автомобили Waymo можно тормозить, встав около дороги в футболке с принтом "STOP" 😆
#hack #meme
#hack #meme
😁1
Великий ограничитель
GenAI-сфера развивается с невероятной энергетикой, инвестициями и вниманием к себе. Секрет кроется в том, что ученые и инженеры нашли простой рецепт, грубо говоря: х3 количество данных в обучающей выборке + х3 вычислительных мощностей в датацентре = GenAI-модель нового поколения. Долгое время было не видно конца и края, как будто можно добраться до сверх-интеллекта через пару тактов (условно GPT-6). Сейчас не всё предопределено, но появились три ограничителя, один из которых великий.
1. Слабая архитектура LLM: авторегрессивный трансформер (GPT), где следующее слово предсказывается на основе предыдущего, не способен совладать с "Системой 2" (планирование, рефлексия, поиск оптимального решения), а также стать полноценно мультимодальным.
2. Нехватка качественных данных для обучения моделей: весь прошлый год активно используют синтетические данные (например, сгенерированные через GPT-4) для тренировки моделей, у этого подхода есть ограничения.
3. Нехватка энергии для датацентров (суперкомпьютеров) нового поколения: об этом на днях говорил Цукерберг, чья компания в топ-3 по уже выкупленным графическим процессорам.
Это означает примерно три вещи: а) GenAI-революция в какой-то момент затормозится, обретет совсем иную скорость развития; б) Самые прорывные идеи находятся в сфере энергоэффективности моделей, например, мощную и маленькую новинку LLaMA 3 8B Instruct (сравнимую с GPT-3.5) можно запускать с локального компьютера (от 6ГБ VRAM); в) Prompting / fine-tuning и прочие методы улучшения ответов никуда не денутся, потому что по сути являются энергоэффективными практиками (получаешь лучший ответ за тот же расход энергии).
#llm #energy #llama #open_source #promptgramming
GenAI-сфера развивается с невероятной энергетикой, инвестициями и вниманием к себе. Секрет кроется в том, что ученые и инженеры нашли простой рецепт, грубо говоря: х3 количество данных в обучающей выборке + х3 вычислительных мощностей в датацентре = GenAI-модель нового поколения. Долгое время было не видно конца и края, как будто можно добраться до сверх-интеллекта через пару тактов (условно GPT-6). Сейчас не всё предопределено, но появились три ограничителя, один из которых великий.
1. Слабая архитектура LLM: авторегрессивный трансформер (GPT), где следующее слово предсказывается на основе предыдущего, не способен совладать с "Системой 2" (планирование, рефлексия, поиск оптимального решения), а также стать полноценно мультимодальным.
2. Нехватка качественных данных для обучения моделей: весь прошлый год активно используют синтетические данные (например, сгенерированные через GPT-4) для тренировки моделей, у этого подхода есть ограничения.
3. Нехватка энергии для датацентров (суперкомпьютеров) нового поколения: об этом на днях говорил Цукерберг, чья компания в топ-3 по уже выкупленным графическим процессорам.
Нехватка энергии — тот самый великий ограничитель, который встает на пути у всех человеческих сверх-идей.
Это означает примерно три вещи: а) GenAI-революция в какой-то момент затормозится, обретет совсем иную скорость развития; б) Самые прорывные идеи находятся в сфере энергоэффективности моделей, например, мощную и маленькую новинку LLaMA 3 8B Instruct (сравнимую с GPT-3.5) можно запускать с локального компьютера (от 6ГБ VRAM); в) Prompting / fine-tuning и прочие методы улучшения ответов никуда не денутся, потому что по сути являются энергоэффективными практиками (получаешь лучший ответ за тот же расход энергии).
#llm #energy #llama #open_source #promptgramming
YouTube
Energy, not compute, will be the #1 bottleneck to AI progress – Mark Zuckerberg
Full Episode: https://youtu.be/bc6uFV9CJGg
Apple Podcasts: https://podcasts.apple.com/us/podcast/mark-zuckerberg-llama-3-open-sourcing-%2410b-models-caeser/id1516093381?i=1000652877239
Spotify: https://open.spotify.com/episode/6Lbsk4HtQZfkJ4dZjh7E7k?si=…
Apple Podcasts: https://podcasts.apple.com/us/podcast/mark-zuckerberg-llama-3-open-sourcing-%2410b-models-caeser/id1516093381?i=1000652877239
Spotify: https://open.spotify.com/episode/6Lbsk4HtQZfkJ4dZjh7E7k?si=…
👍2❤1
#ОбзорГены №4
Минувшая неделя отметилась очередью релизов, а также интересно наблюдать за применением AI в отраслях от маркетинга до спорта.
{ Свежак }
🔠 LLaMa-3 — новый лидер среди open source LLM. Результаты ChatBot Arena. На Hugging Face опубликовали обучающий датасет LLaMA-3.
🔠 Adobe выпустил Acrobat AI Assistant — чат-бот для поиска по PDF, также компания представила VideoGigaGAN — 8х апскейлер для видео.
🔠 Boston Dynamics представила Atlas, нового гуманоида на электродвигателях вместо поршней.
🔠 Вышла Reka Core — мультимодальная языковая модель, которая по Vision не хуже лидеров.
🔠 Яндекс релизнул сервис Нейро (аналог Perplexity).
{ Пульс }
⚡️ Легковесные LLM (LLaMA-3 8B / CodeQwen1.5-7B), размещаемые локально, обошли ChatGPT-3.5.
⚡️ Грядет новое поколение анимированных аватаров — VASA от Microsoft.
⚡️ Исследование: LLM лучше людей в фактчекинге.
{ Текстуры }
✅ Мысли про prompt-gramming (программирование на естественном языке) — ожидаем бум программируемой электроники.
✅ Каким станет веб-сайт в эпоху AI-чатботов / агентов — маркетологи не готовы полностью от него отказаться, но веб-сайт будет совершенно иным.
✅ Как запустить LLaMA-3 8В на локальном компьютере — используйте LM Studio.
✅ Как AI научился рекомендовать тактические приемы при угловых в футболе — разбор проекта DeepMind.
✅ Примеры применения Knowledge Maps в LLM-чатботах — подборка от тг-канала "LLM под капотом".
✅ Подборка ИИ-сервисов для ученых — от исследовательницы.
✅ Учёные, исследовавшие ДНК кишечной микрофлоры, встроили в Borderlands мини-игру, в которой игроки чинили реальные последовательности ДНК. В игру поиграло более 4 млн человек.
{ Находки }
😯 Lightning AI — альтернатива Google Colab для запуска нейросетей и GenAI-приложений.
😯 Vision Arena — таблица лидеров среди Vision-моделей.
😯 Waicas — всемирный конкурс среди создателей AI-инфлюенсеров.
{ Перекресток мнений }
❓ Великий ограничитель. В добавление к предыдущему посту интересный момент, что речь не о тотальной нехватки энергии, а о сконцентрированной в одном месте. Грубо говоря, датацентры (сверхкомпьютеры) начнут строить сразу вместе с электростанциями. Многие в индустрии ждут и надеются на прорыв в термоядерном синтезе, что символично для моего родного Троицка. Вряд ли советские ученые 1970-х думали, что создают технологию для искусственного интеллекта 😃
#llm #text #rag #robotics #research #promptgramming #industry #energy
Минувшая неделя отметилась очередью релизов, а также интересно наблюдать за применением AI в отраслях от маркетинга до спорта.
{ Свежак }
{ Пульс }
{ Текстуры }
✅ Мысли про prompt-gramming (программирование на естественном языке) — ожидаем бум программируемой электроники.
✅ Каким станет веб-сайт в эпоху AI-чатботов / агентов — маркетологи не готовы полностью от него отказаться, но веб-сайт будет совершенно иным.
✅ Как запустить LLaMA-3 8В на локальном компьютере — используйте LM Studio.
✅ Как AI научился рекомендовать тактические приемы при угловых в футболе — разбор проекта DeepMind.
✅ Примеры применения Knowledge Maps в LLM-чатботах — подборка от тг-канала "LLM под капотом".
✅ Подборка ИИ-сервисов для ученых — от исследовательницы.
✅ Учёные, исследовавшие ДНК кишечной микрофлоры, встроили в Borderlands мини-игру, в которой игроки чинили реальные последовательности ДНК. В игру поиграло более 4 млн человек.
{ Находки }
😯 Lightning AI — альтернатива Google Colab для запуска нейросетей и GenAI-приложений.
😯 Vision Arena — таблица лидеров среди Vision-моделей.
😯 Waicas — всемирный конкурс среди создателей AI-инфлюенсеров.
{ Перекресток мнений }
#llm #text #rag #robotics #research #promptgramming #industry #energy
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
эйай ньюз
🔥LLaMa 3 - дождались: Новая SOTA в open-source!
Сегодня день больших релизов от Meta, в которых и я и моя команда принимала прямое участие.
Зарелизили в опенсорс LLaMa-3 8B и 70B:
🔳LLaMa-3 8B – лучшая в своем классе модель, и сопоставима с LLaMa-2 70B…
Сегодня день больших релизов от Meta, в которых и я и моя команда принимала прямое участие.
Зарелизили в опенсорс LLaMa-3 8B и 70B:
🔳LLaMa-3 8B – лучшая в своем классе модель, и сопоставима с LLaMa-2 70B…
🔥4
Нужен ли вам веб-сайт в эпоху AI?
С таким заголовком вышли к публике Youtube-подкаст "Marketing against the Grain" (авторы CMO Hubspot и CMO Zapier), который попал во вчерашний обзор, и сегодня хочу подбить тезисы оттуда.
Сама постановка вопроса стала возможна, потому что генеративные нейросети подрывают классический поиск, который служит хабом распределения трафика между веб-сайтами (как SEO, так и PPL), но также GenAI подрывает веб-страницы со статичной информацией, потому что AI-чатбот лучше справляется с задачей информирования пользователя. Чатбот на сайте уже сейчас заменяет секцию Q&A и Support. Наконец, третий аспект, что грядет новый вид гаджетов (типа Humane и Rabbit R1) с голосовым управлением, и непонятно, как веб-сайты адаптируются к новым устройствам.
Останется ли веб-сайт после тройного удара? Да.
Сохранит ли веб-сайт прежний вид? Нет.
Веб-сайт как витрина будет дрейфовать в сторону шоурума / стенда на выставке, то есть аудио-визуальный аттракцион с AI-ассистентами. Деконструирую этот образ:
Этот образ является идеальным, понятно, что далее будет действовать баланс издержек и пользы. Далеко не все из своего магазина делают шоурум, веб-сайты-дискаунтеры не исчезнут. Где-то сохранится функция про-активного взаимодействия с сайтом, когда пользователь ресерчит или творит.
Любопытный штрих напоследок:
#multimodal #marketing #website #aiagent
С таким заголовком вышли к публике Youtube-подкаст "Marketing against the Grain" (авторы CMO Hubspot и CMO Zapier), который попал во вчерашний обзор, и сегодня хочу подбить тезисы оттуда.
Сама постановка вопроса стала возможна, потому что генеративные нейросети подрывают классический поиск, который служит хабом распределения трафика между веб-сайтами (как SEO, так и PPL), но также GenAI подрывает веб-страницы со статичной информацией, потому что AI-чатбот лучше справляется с задачей информирования пользователя. Чатбот на сайте уже сейчас заменяет секцию Q&A и Support. Наконец, третий аспект, что грядет новый вид гаджетов (типа Humane и Rabbit R1) с голосовым управлением, и непонятно, как веб-сайты адаптируются к новым устройствам.
Останется ли веб-сайт после тройного удара? Да.
Сохранит ли веб-сайт прежний вид? Нет.
Веб-сайт как витрина будет дрейфовать в сторону шоурума / стенда на выставке, то есть аудио-визуальный аттракцион с AI-ассистентами. Деконструирую этот образ:
1. AI-чатботы как продавцы-консультанты должны будут пройти с пользователем весь путь от входа до решения пользовательского запроса.
2. Совместный путь пользователя и AI будет проходить по персонализированному аудио-визуальному пространству, которое может быть сгенерировано в моменте, а может быть умно подобрано из готовых шаблонов.
3. Как в шоуруме, вы найдете мало текста, так и тут его будет немного (возможно как в TikTok).
4. Язык пользователя не будет иметь значения — веб-сайт будет по умолчанию мультиязычным.
Этот образ является идеальным, понятно, что далее будет действовать баланс издержек и пользы. Далеко не все из своего магазина делают шоурум, веб-сайты-дискаунтеры не исчезнут. Где-то сохранится функция про-активного взаимодействия с сайтом, когда пользователь ресерчит или творит.
Любопытный штрих напоследок:
AI-ассистентов для веб-сайта можно обучать на фаундерах, которые всегда лучше всех разбираются в собственной компании.
#multimodal #marketing #website #aiagent
YouTube
Do You Even NEED A Website?
Stay ahead of the competition by downloading our FREE State of Marketing Report 💥 https://clickhubspot.com/d80
Ep 218
Is your website an outdated relic or your best salesperson?
Kipp and Kieran dive into the future role of websites in an AI-driven marketing…
Ep 218
Is your website an outdated relic or your best salesperson?
Kipp and Kieran dive into the future role of websites in an AI-driven marketing…
👍3🔥1
Claude — самый растущий LLM-чатбот в моменте 🔥
Данные подтверждают интуицию, что Claude заметно прибавил после релиза третьей версии модели. Согласно SimilarWeb, веб-трафик в марте вырос более чем в два раза. Несмотря на относительно низкую базу, это внушительный результат. Отметил бы еще, что в эти месяцы они успели выпустить туториал по промптингу в Google Sheets (!) и отличную библиотеку промптов. А в перформансе Claude превосходит ChatGPT по некоторым типам задачам, один из неожиданных юзкейсов опишу на следующей неделе.
Источник графика
#llm #text #promptgramming #stats
Данные подтверждают интуицию, что Claude заметно прибавил после релиза третьей версии модели. Согласно SimilarWeb, веб-трафик в марте вырос более чем в два раза. Несмотря на относительно низкую базу, это внушительный результат. Отметил бы еще, что в эти месяцы они успели выпустить туториал по промптингу в Google Sheets (!) и отличную библиотеку промптов. А в перформансе Claude превосходит ChatGPT по некоторым типам задачам, один из неожиданных юзкейсов опишу на следующей неделе.
Источник графика
#llm #text #promptgramming #stats
Пора перестать пользоваться бесплатным ChatGPT 3.5 ✖️
Не кликбейт, а назревший момент. Январское обновление gpt-3.5 находится на 33 месте в LLM лидерборде. Это неплохо для модели, обучавшейся в 2021-м. OpenAI постоянно подтягивают ее за счет файнтюна и системного промпта (если пользоваться ChatGPT). Модель выполнила историческую миссию популяризации LLM вообще, для большинства первый контакт с LLM случился именно с ChatGPT 3.5. Но сейчас это уже неактуально.
7 (ограниченно) бесплатных LLM-чатботов на замену ChatGPT-3.5:
1. Claude 3 (бесплатная модель Sonnet)
2. Gemini
3. Google AI Studio (та самая модель с мега-контекстом в 1М токенов)
4. Mistral
5. Reka Core
6. Meta AI*
7. LMSYS (та самая Chatbot Arena, где можно бесплатно воспользоваться любой моделью)
Все — эквивалентные замены или даже лучше. До сих пор не могу включить в этот список российские YandexGPT и GigaChat, хотя они еще в декабре хвалились, что бьют ChatGPT 3.5 в side-by-side на русском языке. Мой опыт раз за разом разочаровывающий.
Я бы не стал писать пост только ради перечисления доступных LLM-чатботов. Мне кажется, пора приобрести новую привычку: запускать языковые модели уровня ChatGPT 3.5 с локального компьютера без доступа к интернету. В преддверие летних походов 😃
По сути среди LLM есть три сегмента: а) для локального применения; б) для бесплатного онлайн-использования; в) платные cutting-edge модели. ChatGPT 3.5 выпал из лидеров второй категории, но спасибо за всё 🧡
P.s. на скриншотах ответ на хитрый вопрос от локальной Starling, YaGPT в Алисе, ChatGPT 3.5 и Mistral.
*признана экстремистской и запрещена в РФ
#llm #open_source #local
Не кликбейт, а назревший момент. Январское обновление gpt-3.5 находится на 33 месте в LLM лидерборде. Это неплохо для модели, обучавшейся в 2021-м. OpenAI постоянно подтягивают ее за счет файнтюна и системного промпта (если пользоваться ChatGPT). Модель выполнила историческую миссию популяризации LLM вообще, для большинства первый контакт с LLM случился именно с ChatGPT 3.5. Но сейчас это уже неактуально.
7 (ограниченно) бесплатных LLM-чатботов на замену ChatGPT-3.5:
1. Claude 3 (бесплатная модель Sonnet)
2. Gemini
3. Google AI Studio (та самая модель с мега-контекстом в 1М токенов)
4. Mistral
5. Reka Core
6. Meta AI*
7. LMSYS (та самая Chatbot Arena, где можно бесплатно воспользоваться любой моделью)
Все — эквивалентные замены или даже лучше. До сих пор не могу включить в этот список российские YandexGPT и GigaChat, хотя они еще в декабре хвалились, что бьют ChatGPT 3.5 в side-by-side на русском языке. Мой опыт раз за разом разочаровывающий.
Я бы не стал писать пост только ради перечисления доступных LLM-чатботов. Мне кажется, пора приобрести новую привычку: запускать языковые модели уровня ChatGPT 3.5 с локального компьютера без доступа к интернету. В преддверие летних походов 😃
У меня в руках слабый ноутбук (4 ГБ VRAM). Есть две модели уровня gpt-3.5, с которыми он справляется: Llama-3-8b-Instruct и Starling-LM-7B-beta. Скачивайте LM Studio (программа займет около 1 ГБ жесткого диска), по поиску найдите модели выше, софт подскажет какая версия модели влезет в ваш компьютер, скачивайте файл модели (2,5-4 ГБ памяти) и начинайте диалог из любой точки Земли.
По сути среди LLM есть три сегмента: а) для локального применения; б) для бесплатного онлайн-использования; в) платные cutting-edge модели. ChatGPT 3.5 выпал из лидеров второй категории, но спасибо за всё 🧡
P.s. на скриншотах ответ на хитрый вопрос от локальной Starling, YaGPT в Алисе, ChatGPT 3.5 и Mistral.
*признана экстремистской и запрещена в РФ
#llm #open_source #local
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
👆 Яркая визуализация падения ChatGPT-3.5 (началось в декабре и закончилось к марту).
Telegram-источник
#llm #leaderboard
Telegram-источник
#llm #leaderboard
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
HeyGen переоценен 😉
Грядет ChatGPT-момент в AI-аватарах (AI Talking Heads), и хотя HeyGen уже на слуху около года, он переоценен по нескольким причинам:
HeyGen занял свою нишу для бизнеса, для которого видео-контент — способ отстроиться от конкурентов, без особых претензий на качество. Мультиязычность, демпинг классического видео-продакшена, доступность для непрофессионалов — очень понятная ценность. Но это всё далеко от ChatGPT-Midjourney-Suno, подарившие по-настоящему массовый продукт. У Suno в 4 раза больше интернет-трафика, чем у HeyGen, хотя Suno еще "не существовало", когда все тащились от HeyGen-переозвучки мемов.
На этой неделе вышел релиз от Synthesia, показавшей новое поколение (не только lipsync) ИИ-аватаров вслед за Микрософт и Алибаба. ChatGPT-момент в этой сфере мы определим по YouTube: когда faceless-каналы обретут AI-face.
#ai_avatars #lipsync #heygen #video
Грядет ChatGPT-момент в AI-аватарах (AI Talking Heads), и хотя HeyGen уже на слуху около года, он переоценен по нескольким причинам:
Во-первых, реально он лидер в lipsync (перерисовки движения губ под заданный текст) — области, которая не звучит так горячо, как AI-аватары или Talking Heads.
Во-вторых, AI-аватаров слабо используют на публике (хотя порой громко), зато они распространены в B2B- и внутрикорпоративной сфере для клиентов / сотрудников.
В-третьих, после Sora вся прочая видеогенерация (в том числе lipsync) померкла.
В-четвертых, как любая видеогенерация, AI-аватары никогда не стоили дешево (от 1$ за минуту).
HeyGen занял свою нишу для бизнеса, для которого видео-контент — способ отстроиться от конкурентов, без особых претензий на качество. Мультиязычность, демпинг классического видео-продакшена, доступность для непрофессионалов — очень понятная ценность. Но это всё далеко от ChatGPT-Midjourney-Suno, подарившие по-настоящему массовый продукт. У Suno в 4 раза больше интернет-трафика, чем у HeyGen, хотя Suno еще "не существовало", когда все тащились от HeyGen-переозвучки мемов.
На этой неделе вышел релиз от Synthesia, показавшей новое поколение (не только lipsync) ИИ-аватаров вслед за Микрософт и Алибаба. ChatGPT-момент в этой сфере мы определим по YouTube: когда faceless-каналы обретут AI-face.
#ai_avatars #lipsync #heygen #video
#ОбзорГены №5
Относительно скромный период в плане релизов, хотя не без громких утечек. И все равно масса интересного.
{ Свежак }
🔠 GPT-5 (или около того) появилась на чатбот арене под загадочным названием gpt2.
🔠 Релиз нового поколения ИИ-аватаров от Synthesia (конкурента HeyGen).
🔠 Вышла версия LLaMA-3-8B (легковесная) с контекстным окном в 1 миллион токенов (!), как у Gemini 1.5.
🔠 Китайский генератор видео Vidu первым приблизился к качеству, заданному Sora от OpenAI.
{ Пульс }
⚡️ Медицинская модель OpenBioLLM 70B вышла на первое место по тестам на медицинских задачах (даже выше GPT-4).
⚡️ LMSYS разработали новый бенчмарк Arena Hard v0.1 на основе анализа пользовательских запросов на Chatbot Arena.
⚡️ Складывается новый тип устойчивых моделей — генерация изображения человека по одному (!) обучающему фото. Новая модель из этого класса — Consistent ID.
⚡️ Аналогичная ситуация в виртуальных примерочных (одеть человека в заданную одежду), качество моделей растет. Две новые — IDM-VTON и Magic Clothing.
⚡️ По-настоящему важно: прорыв в редактировании человеческого ДНК с помощью ИИ.
{ Текстуры }
✅ ChatGPT-3.5 всё — пора пользоваться другими LLM.
✅ Разбор продакшена нашумевшего ИИ-видео Air Head (при участии Sora). Спойлер:остается много человеческого труда .
✅ Тренды в GenAI от Степана Гершуни.
✅ Marques Brownlee разносит второе AI-based носимое устройство, на этот раз Rabbit R1.
✅ Исследование «Яков и Партнёры» о влиянии GenAI в горно-металлургической отрасли.
{ Находки }
😯 ImgSys — арена для сравнения разных файнтюнов Stable Diffusion моделей.
😯 Speechmatics — лучшая speech-to-text модель, судя по бенчмаркам.
😯 Shadow — сервис по аренде облачного ПК с мощным GPU (до 16 ГБ VRAM).
{ Перекресток мнений }
❓ Цикл обновления GenAI. Несмотря на постоянное FoMO в GenAI, на мой взгляд, сложились четкие циклы. За один год базовая модель устаревает (сменяется поколение моделей), каждые три месяца — происходит значимый шаг вперед. Это всё применимо только для тех классов моделей, которые прошли свой "ChatGPT-момент" (X), то есть массовая аудитория почувствовала и научилась извлекать ценность технологии. По ту сторону X сейчас: LLM, RAG-чатботы, Code Interpretator, VLM (Vision-модели), генерация / restyle / inpainting / upscale изображения, depth-анимация, расшифровка речи, TTS (синтез речи), генерация музыки и их композ. Всё.
#llm #text #ai_avatar #video #med #benchmark #consistent #clothes #video #trend #device #image #speech #gpu
Относительно скромный период в плане релизов, хотя не без громких утечек. И все равно масса интересного.
{ Свежак }
{ Пульс }
{ Текстуры }
✅ ChatGPT-3.5 всё — пора пользоваться другими LLM.
✅ Разбор продакшена нашумевшего ИИ-видео Air Head (при участии Sora). Спойлер:
✅ Тренды в GenAI от Степана Гершуни.
✅ Marques Brownlee разносит второе AI-based носимое устройство, на этот раз Rabbit R1.
✅ Исследование «Яков и Партнёры» о влиянии GenAI в горно-металлургической отрасли.
{ Находки }
😯 ImgSys — арена для сравнения разных файнтюнов Stable Diffusion моделей.
😯 Speechmatics — лучшая speech-to-text модель, судя по бенчмаркам.
😯 Shadow — сервис по аренде облачного ПК с мощным GPU (до 16 ГБ VRAM).
{ Перекресток мнений }
#llm #text #ai_avatar #video #med #benchmark #consistent #clothes #video #trend #device #image #speech #gpu
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
OpenAIs New SECRET "GPT2" Model SHOCKS Everyone" (OpenAI New gpt2 chatbot)
OpenAIs New SECRET "GPT2" Model SHOCKS Everyone" (OpenAI New gpt2 chatbot)
How To Not Be Replaced By AGI https://youtu.be/AiDR2aMye5M
Stay Up To Date With AI Job Market - https://www.youtube.com/@UCSPkiRjFYpz-8DY-aF_1wRg
AI Tutorials - https://www.you…
How To Not Be Replaced By AGI https://youtu.be/AiDR2aMye5M
Stay Up To Date With AI Job Market - https://www.youtube.com/@UCSPkiRjFYpz-8DY-aF_1wRg
AI Tutorials - https://www.you…
❤1
Маркетинговые LLM-опросы
Банальная идея — использовать LLM как респондентов на всевозможных опросах — почему-то незаслуженно игнорируется. Возможно за банальностью, возможно из-за "отсутствия субъектности" у чатботов их мнение само по себе неинтересно. За этим всем упускают тот факт, что LLM — интересный респондент со своим искаженно объективным мнением после прочтения всего интернета и обучения с учителем 😃
Слегка зашел на территорию ютуберов: сделал яркую обложку и придумал подводку к видеоразбору этого кейса. Сам разбор записан в рамках вебинара из курса "ChatGPT в работе", где мы разбираем такие и многие другие полезные юзкейсы языковых нейросеток. Накопилось много отснятого материала, который хочется вынести наружу. Темп повествования на вебинаре не такой бойкий, как в видеоуроках, зато есть спонтанные моменты, в которые проникают интересные мысли. Напишите в комментах здесь или на ютубе, как вам? выпускать такие ролики дальше? если да, накидайте свои кейсы.
Возвращаясь к теме, на мой взгляд, в 2024-м должно появиться research-агентство, которое станет специализироваться на LLM-опросах, необязательно только маркетинговых, но и социологических в целом тоже.
#llm #usecase #research #marketing #youtube
Банальная идея — использовать LLM как респондентов на всевозможных опросах — почему-то незаслуженно игнорируется. Возможно за банальностью, возможно из-за "отсутствия субъектности" у чатботов их мнение само по себе неинтересно. За этим всем упускают тот факт, что LLM — интересный респондент со своим искаженно объективным мнением после прочтения всего интернета и обучения с учителем 😃
Слегка зашел на территорию ютуберов: сделал яркую обложку и придумал подводку к видеоразбору этого кейса. Сам разбор записан в рамках вебинара из курса "ChatGPT в работе", где мы разбираем такие и многие другие полезные юзкейсы языковых нейросеток. Накопилось много отснятого материала, который хочется вынести наружу. Темп повествования на вебинаре не такой бойкий, как в видеоуроках, зато есть спонтанные моменты, в которые проникают интересные мысли. Напишите в комментах здесь или на ютубе, как вам? выпускать такие ролики дальше? если да, накидайте свои кейсы.
Возвращаясь к теме, на мой взгляд, в 2024-м должно появиться research-агентство, которое станет специализироваться на LLM-опросах, необязательно только маркетинговых, но и социологических в целом тоже.
#llm #usecase #research #marketing #youtube
YouTube
LLM в маркетинговых опросах: как это работает?
В видеоразборе посмотрим на необычный поворот, что если LLM использовать как обычных респондентов. Узнайте, как AI может заменить традиционные маркетинговые опросы, предоставляя более глубокие и обширные данные о восприятии брендов.
Некоторые темы:
— Как…
Некоторые темы:
— Как…