Языковая модель 60-х прошла тест Тьюринга лучше GPT-3.5
Помните, мы рассказывали про ELIZA? Это самая первая языковая модель, которая была запрограмированна по простому шаблону без какого-либо машинного обучения.
Так вот, в недавней статье "Does GPT-4 Pass the Turing Test?" ученые выяснили, что 27% людей идентифицируют ELIZA как человека. Для GPT-3.5 эта величина не превышает 14%. Пространство для шуток огромное, конечно, но если серьезно, то произойти такое могло по двум причинам:
❓ ChatGPT настроен разговаривать формально, не выражать мнения и т. д., что делает его менее похожим на человека
❓ Тест Тьюринга устарел и уже не подходит для скоринга современных моделей
Ваши мысли?
😻 #news
Помните, мы рассказывали про ELIZA? Это самая первая языковая модель, которая была запрограмированна по простому шаблону без какого-либо машинного обучения.
Так вот, в недавней статье "Does GPT-4 Pass the Turing Test?" ученые выяснили, что 27% людей идентифицируют ELIZA как человека. Для GPT-3.5 эта величина не превышает 14%. Пространство для шуток огромное, конечно, но если серьезно, то произойти такое могло по двум причинам:
Ваши мысли?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40👍8🤔8
Анатомия и тренды NLP
Как развивается наука NLP? Какие области исследований в ней существуют? Что нас ждет дальше? Мы вдохновились этой статьей и раскидываем ответы по полочкам.
😻 #NN
Как развивается наука NLP? Какие области исследований в ней существуют? Что нас ждет дальше? Мы вдохновились этой статьей и раскидываем ответы по полочкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30🔥5❤3
Отличные новости для маководов
Apple Research выпустили собственную библиотеку MLX а-ля PyTorch. Она оптимизирована для Apple Silicon, то есть ноутбуков с чипами M-серии. В комплекте модели Llama, LoRA, Stable Diffusion и Whisper, а также хорошая документация и примеры.
😻 #news
Apple Research выпустили собственную библиотеку MLX а-ля PyTorch. Она оптимизирована для Apple Silicon, то есть ноутбуков с чипами M-серии. В комплекте модели Llama, LoRA, Stable Diffusion и Whisper, а также хорошая документация и примеры.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯56👍26👨💻7👏2🤩2❤1
Ой кто это
Сэм Альтман стал CEO года. Ну а как иначе? Кто еще может похвастаться таким скандальным увольнением и таким легендарным возвращением? Кто еще смог бы поднять OpenAI на такие высоты?
😻 #news
Сэм Альтман стал CEO года. Ну а как иначе? Кто еще может похвастаться таким скандальным увольнением и таким легендарным возвращением? Кто еще смог бы поднять OpenAI на такие высоты?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤57😐10👍9😎3🥰2
Google анонсировала конкурента GPT-4 – Gemini
Модель представлена в трех версиях: Gemini Nano, Gemini Pro и Gemini Ultra. Последняя, говорят, на тестах превосходит GPT-4. Все модели мультимодальные, и Gemini Pro уже доступна в чат-боте Bard.
Для доступа нужно подключиться к VPN с локацией в США, сменить в настройках Google аккаунта язык на английский и перейти по ссылке.
И это не все. На базе Gemini вышел AlphaCode2. При оценке на платформе Codeforces AlphaCode2 решает 43% задач за 10 попыток.
Планы компании впечатляют: они планируют внедрять модели в поиск, запустить Bard Advance и уже сейчас интегрируют версию Nano в смартфоны.
Новая эра?
😻 #news
Модель представлена в трех версиях: Gemini Nano, Gemini Pro и Gemini Ultra. Последняя, говорят, на тестах превосходит GPT-4. Все модели мультимодальные, и Gemini Pro уже доступна в чат-боте Bard.
Для доступа нужно подключиться к VPN с локацией в США, сменить в настройках Google аккаунта язык на английский и перейти по ссылке.
И это не все. На базе Gemini вышел AlphaCode2. При оценке на платформе Codeforces AlphaCode2 решает 43% задач за 10 попыток.
Планы компании впечатляют: они планируют внедрять модели в поиск, запустить Bard Advance и уже сейчас интегрируют версию Nano в смартфоны.
Новая эра?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩35🤔10❤9👍6🔥3🎉3🙈1
Знали ли вы, что случайные деревья можно тестить на трейне?
Такой метод называется out-of-bag validation (в комментах даем приз за самый смешной перевод названия на русский). Давайте разбираться, почему это работает.
😻 #train
Такой метод называется out-of-bag validation (в комментах даем приз за самый смешной перевод названия на русский). Давайте разбираться, почему это работает.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45❤6👍4⚡3😁3🕊2
Увеличение производительности чат-бота с 27% до 98% с помощью одной фразы
Таких результатов добились Anthropic со своим Claude 2.1. Они заметили, что в условиях, когда пользователь подает на вход большой контекст (~200К токенов) чат-бот начинает отвечать неохотно, хотя способен на качественный выхлоп.
Решилась проблема добавлением всего одного предложения в начало ответа бота: "Here is the most relevant sentence in the context:". Так модель сначала фокусируется на поиске релевантных предложений в контексте, что затем помогает ей ответить точнее.
Ох уж этот промпт-инжинеринг
😻 #news
Таких результатов добились Anthropic со своим Claude 2.1. Они заметили, что в условиях, когда пользователь подает на вход большой контекст (~200К токенов) чат-бот начинает отвечать неохотно, хотя способен на качественный выхлоп.
Решилась проблема добавлением всего одного предложения в начало ответа бота: "Here is the most relevant sentence in the context:". Так модель сначала фокусируется на поиске релевантных предложений в контексте, что затем помогает ей ответить точнее.
Ох уж этот промпт-инжинеринг
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🔥11🤓7❤5✍2