NEW BOT Телеграм, страница - 106468933

Sber AI

38.1K subscribers

2.44K photos

620 videos

1 file

2.05K links

AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!

Download Telegram

About

Blog

Apps

Platform

38.1K subscribers

Как научить нейросеть не ошибаться в математике

👨‍💻

Действительно, почему у современных моделей типа ChatGPT есть проблемы с задачами выше школьного уровня?

Учёные подготовили качественный обзор успехов AI в подобных вычислениях:
😲 трудности у LLM возникают из-за того, что они не опираются на строгие доказательства
⚡️ важно переходить к формальному символьному мышлению
👍 системы надо обучать на опыте существующих proof assistants (Lean, Coq, Isabelle)
⛔️ это поможет не только в математике, но и снизит вероятность того, что модель будет выдавать галлюцинации вместо точных ответов

Да, есть прогресс — взять хотя бы AlphaProof и AlphaGeometry, но всё равно остаются вопросы ❓

Например, пока мало хороших датасетов и бенчей, чтобы точно оценить, насколько эффективно эти методы работают.

Изображение Meta*, Stanford University, UC Berkeley, University of Edinburgh, UT Austin
* экстремистская организация, деятельность которой запрещена на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

815 views11:51

This media is not supported in your browser

VIEW IN TELEGRAM

iPhone в Китае: что на борту?

Когда мы говорили “китайский айфон”, мы не это имели в виду 😁 Но теперь всё именно так! В Apple действительно подумывают внедрить модель Qwen от Alibaba в свой легендарный смартфон. Вместо GPT, между прочим 🙃

Это поможет компании лучше вписаться в специфику рынка Поднебесной и прокачать продажи 💰

Переговоры уже идут вовсю:
😮 Qwen круто себя показала на Hugging Face, так что выбор понятен. Модели на её основе занимают топовые места среди аналогичных инструментов
😙 партнёрство с Alibaba встраивает Apple в строгие китайские стандарты, касающиеся иностранных технологий
😵‍💫 для местных разрабов iOS это отличная новость: можно создавать приложения с продвинутыми функциями обработки текста и плотно интегрировать их в родные сервисы
📈 акции обеих компаний взлетели после новостей

Анонс будет на конференции Apple в Шанхае 25 марта 🗓

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1

❤5👏2🔥1

869 views16:04

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Тестила в PixVerse прикольную функцию LipSync, которая пытается подстроить движение губ под аудиоозвучку 💋

Предупреждаю: на 60 бесплатных кредитов в день особо не разбежишься, при условии, что один ролик забирает 30 😕

1️⃣ первый ~~блин комом~~ не получился, так как, по моим догадкам, нейронка озвучивает только людей (но вы пробуйте ❗️). У меня кот петь не захотел 🐱
2️⃣ со второй попытки всё сложилось 🐰
3️⃣ видео сгенерил MiniMax — исходник прилагаю, чтобы была заметна разница ➡️

Песню написала Suno. А так процесс элементарный: грузим видео и аудио. Но помните, что чем длиннее трек, тем больше кредитов на него уйдёт 🎵

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🔥4

810 views04:42

LearnLM отвечает на вопросы по всем канонам педагогики! 🤓

Нейросетка Google для образования работает на основе Gemini. Для этого её тренировали следовать педагогическим гайдлайнам и дополнительно файнтюнили на учебных данных, включая разговоры экспертов с AI.

Как готовили:
💬 через supervised fine-tuning (SFT) LearnLM осваивала учительские инструкции. Диалог начинался с детального описания, чтобы она подстраивалась под промпты и варьировала стили преподавания
✍️ RLHF подключали для донастройки. Тут уже настоящие педагоги размечали ответы в многоэтапных диалогах
➕ наконец, её совместно обучили с Gemini, чтобы добавить к преподавательским скиллам LearnLM её базовые AI-умения

Получилась крутая штука, которую эксперты признали лучше GPT-4o, Claude 3.5 и Gemini 1.5 Pro. Для использования AI в образовании это большой шаг вперёд 🙂

Изображение Google

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👍2🤔1🏆1

838 views10:59

This media is not supported in your browser

VIEW IN TELEGRAM

Deep Research от Perplexity: когда нужно быстро стать экспертом 🤓

В системе запустили фичу, которая берёт на себя работу по исследованиям и продвинутому анализу данных.

Вот как всё происходит:
🥸 Deep Research ищет документы, читает их и решает, что дальше, разбираясь и умнея по ходу процесса
🎉 когда всё собрано, формируется понятный и полный отчёт
🏌️ сохраняем в PDF или доком, а дальше делимся с кем надо

Что может? Да многое: от планирования путешествия до финансового анализа 🤑 А ещё проходит тесты уровня Humanity's Last Exam.

Бесплатная версия у всех, у Pro-подписчиков безлимит по запросам. Доступно на вебе, скоро будет на iOS, Android и macOS ⛔️

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🤔2

948 views14:53

This media is not supported in your browser

VIEW IN TELEGRAM

AugmentOS: AI как ваше продолжение

🔠

🔠

Речь про операционку для умных очков, выпущенную Vuzix и Mentra 😎

Где работает и что умеет:
🤝 совместима с моделями Even Realities G1, Vuzix Z100 и Mentra Mach1
📞 функционирует через смартфон
⛔️ пока что поддерживается только на устройствах с Android, на iOS дадут в феврале
🧑‍💻 скиллы на основе нейросетей
🆘 поддержка разработки приложений с субтитрами, переводом, проактивной помощью и другими фичами

* в видео упоминается продукт экстремистской организации, деятельность которой запрещена на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

872 views04:27

🔝

Grok-3 знает ответы на все вопросы

Даже на те, что вы не задавали. Маск не обманул и выкатил чат-бота xAI на новом уровне.

Фишки:
🚩 DeepSearch: шарит весь интернет, чтобы найти точный ответ (до 20 источников и посты в X 😍)
🚩 рассуждения включаются кнопкой Think
🚩 Big Brain под математику и кодинг
🚩 генерация игр: может замутить игру на ходу, как на стриме, где он смешал "Тетрис" и "Три в ряд"
🚩 обучение: модель прокачали на мощном компе с 200 000 чипов Nvidia H100

Показывает крутые результаты в математике, физике, биологии и химии.

Сейчас Grok-3 в стадии бета-тестирования. Голосовой режим пока отложили из-за багов, но обещают запустить через неделю 😉

Изображения Х

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥4❤3

981 views11:55

Проверь себя: как чаще всего модель выбирает правильный ответ из нескольких вариантов?

Anonymous Poll

оценивает, какой ответ точно отражает контекст вопроса

сравнивает ответы между собой

случайным образом

79 voters890 views13:08

Бенчмарки: не всё так сложно, как кажется (но иногда сложнее!)

Отвечаю на вопрос о способе выбора моделью верного ответа (опрос см. выше 🤘). Обычно в тестах на понимание языка модели сталкиваются с множественным выбором в вопросах. Алгоритмы скорят каждый ответ, опираясь только на контекст вопроса ⁉️

Но это противоречит элементарной логике ☹️ Модель не учитывает другие доступные опции, в то время как люди всегда сравнивают варианты ответов между собой, чтобы найти подходящий 🧑‍💻

Snowflake AI решили проверить, насколько реально сложны популярные бенчмарки. Так и выяснилось, что сложность тестов не в самих заданиях, а в подходах к скорингу.

Исследование показало: если дать модели все варианты ответов сразу, перформанс заметно улучшается. Например, LLaMA 3.1 70B* повышает показатели с 64% до 93% 💪

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение Snowflake AI Research

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🤔3

894 views15:08

Тайная печать Google: когда AI становится видимым

👻

Компания внедряет водяные знаки SynthID для фоток, отредактированных Magic Editor.

Опция нужна, чтобы пользователи могли знать о манипуляциях reimagine с картинкой. Про SynthID я рассказывала, она работает с генерациями Google Imagen ✨

Но есть нюансы:
🙅‍♂️ SynthID может не распознать небольшие правки
🥢 для обнаружения вотермарки нужен AI-детектор из About this image

Так что пока это полумера, а разоблачение цифрового следа может и не состояться ⌛

Изображение DeepMind

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🤔2

858 views04:51

🆕 Majorana 1: Microsoft на пути к миллиону кубитов!

Разработчики компании презентовали (https://news.microsoft.com/source/features/ai/microsofts-majorana-1-chip-carves-new-path-for-quantum-computing/) чип нового поколения для квантовых вычислений.

Всё дело в уникальном материале — топопроводнике, помогающем управлять частицами и создающем супернадёжные кубиты. Это буквально как изобретение полупроводников, только теперь для квантовой эры ☄️

Главные детали:
#️⃣ топологический материал: ребята из Microsoft сотворили новое состояние вещества, где частицы ведут себя совсем иначе. Оно позволяет создать более стабильный кубит
😓 уникальные способности: материал одновременно надёжный и легко управляемый, что сильно упрощает работу с квантовыми системами
💻 невероятный масштаб: с помощью архитектуры Majorana 1 можно будет реализовать квантовый компьютер с миллионом кубитов
🥳 практические кейсы: 1 000 000 — та самая нужная цифра, чтобы решать реально важные задачи вроде расщепления микропластика или разработки умных материалов

Короче говоря, масштабируемые и мощные квантовые компьютеры — это уже не фантастика, а вполне реальная перспектив

🔥6🤔3😁2❤1

872 views10:46

Вклады в AI, рост и провалы

Кто на волне, а кому надо подумать, как развиваться дальше 😕

1️⃣ $10 млрд долларов, 10 тысяч новых рабочих мест и 3 ГВт. Южная Корея собирается строить самый мощный в мире ЦОД для AI. Крутой проект должен быть готов к 2028 году.

2️⃣ Резонное решение, если посмотреть на успех индустрии полупроводников благодаря вложениям в ЦОД. Тут спрос растёт из-за популярности AI 🤑 Продажи микросхем подскочили на 29%, а траты на разработку памяти взлетели аж на 53%!

3️⃣ AI Pin ~~приказал долго жить~~ перестанет выпускаться ☠️ Высокие ожидания наложились на критику продукта. Humane приняла решение свернуть проект AI Pin и продать свои активы HP. Таков уж AI-рынок: нужно быть гибким и адаптироваться к изменениям в условиях развивающихся инноваций.

4️⃣ Тем временем российский чат-бот Neuromed AI стал ординатором по кардиологии и онкологии 🧐 Нейронка Сеченовского университета прошла госаттестацию и справилась со всем, кроме проверки практики (по понятным причинам 😀).

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🤩2

833 views14:58

Французский шарм и американские технологии

Кажется, AI Action Summit в Париже не прошёл даром. AMD и Комиссариат по атомной энергии Франции (CEA) взялись за масштабный проект — создание нового поколения AI-систем. Теперь они партнёры🤝

Что будут делать:
💼 совместно разрабатывать энергоэффективные технологии и архитектуры для самых ресурсоёмких AI-задач
🤓 в 2025 году проведут симпозиум, где соберутся лучшие умы мира для обсуждения будущего вычислений
👋 представят стартапы, суперкомпьютеры и стратегии, чтобы ускорить развитие технологий

Идея неплохая, так как AI нужны альтернативные источники энергии, а это требует и новой вычислительной архитектуры 🫡

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

👍4🤔2

820 views07:17

Чёрный ящик: если модель не открывает секреты, поможет QueRE

Алгоритм разработан учёными из Университета Карнеги-Меллона. QueRE помогает предсказывать перформанс в black-box сеттинге, когда нет полного доступа к внутренним репрезентациям (например, если используешь модель через API)

🔒

Как это работает?
🧐 по промптам модель проверяет, насколько правильно отвечала раньше
🆗 полученный вектор с вероятностями корректности ответов дают на инпут линейной модели. Так тестируют, верны ли оценки
🤩 оказалось, что даже простые модели, обученные на “самооценках”, точнее, чем алгоритмы с опорой на внутренние состояния

На SQuAD и BoolQ, например, в прогнозах перформанса QueRE эффективнее других методов.

Сейчас многие делают модели проприетарными. Пользователи не могут видеть, как они работают 🙈 Поэтому такие непрямые способы оценки становятся всё нужнее 🫴

Изображение Carnegie Mellon University

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1

820 views10:55

This media is not supported in your browser

VIEW IN TELEGRAM

EnigmaEval: тест на смекалку для AI

🎓

Новый бенчмарк для LLM проверяет их умение решать головоломки. Он основан на заданиях, где нужно использовать разные типы знаний и уметь думать нестандартно 🤪

В отличие от обычных тестов типа MATH, MMLU и GPQA, тут всё сложнее:
🤔 есть тексты, картинки, схемы и другие штуки, которые надо собрать вместе, чтобы найти правильный ответ
🔝 всего в наборе больше тысячи загадок из восьми источников различного уровня
😛 запредельно трудные требуют пяти и более шагов решения с минимальными подсказками и скрытыми промежуточными ответами

Даже самые современные модели пока не очень хорошо справляются с такими заданиями, особенно когда дело доходит до крайне запутанных.

Данные датасета закрыты, чтобы сохранить их ценность. Но ~~это не точно~~ можно подать заявку, чтобы получить доступ ✍️

Видео создано для канала Душа Питона с помощью Kandinsky Video 1.1

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔3

752 views14:48

OREO улучшает многошаговые рассуждения LLM

Главная беда RL-методов типа DPO — в использовании пар с человеческими предпочтениями. Затратно и неэффективно, когда надо научить модель думать на несколько ходов вперёд 🤪

Как OREO решает проблему:
💻 используется метод maximum entropy reinforcement learning
⛏ soft Bellman equation одновременно улучшает две вещи: policy model (какие действия выгоднее в конкретный момент 🎉) и value function (как оценить текущее положение и будущее развитие событий ❓).

Так снижается зависимость от парных наборов предпочтений 😘

На стандартных тестах типа GSM8K и MATH OREO круче традиционных методов offline learning. Например, на MATH выдаёт результат 52.5% 🛍

Изображение UC San Diego, Tsinghua University, Salesforce Research, Northwestern University

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

804 views05:09

Погнали в космос: учёные разглядели метеорит с помощью AR-технологий

💫

В Уральском геологическом музее разработали приложение для изучения челябинского метеорита.

Как работали:
⭐️ использовали сотни фоток обломков небесного тела с разных сторон
⭐️ сделали 3D-модель его кусочков
➡️ загнали модельку в приложение, созданное на платформе разработки компьютерных игр

Технология помогла увидеть мельчайшие детали поверхности. Теперь эти модели можно посмотреть в книге музея, и любой желающий может изучить их поближе 🔭

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👏3

758 views17:50

В лабиринте слов: 12 LLM против больших объёмов ✍️

Разрабы всё удлиняют и удлиняют контекст, а как в нём работается моделям?

LLM вроде GPT-4o и других топовых моделей, как выяснилось, нормально связывают информацию и делают выводы из длинных материалов только с подсказками в виде повторяющихся слов ✌️

Как это поняли исследователи Мюнхенского университета и компании Adobe:
🎓 разработали тест NOLIMA
✋ убрали одинаковые слова в тексте и запросах
😇 проверили 12 лидирующих LLM
💬 чем длиннее повествование, тем быстрее теряют нить даже продвинутые
💬 особенно проседают с длиной от 2 000 до 8 000 токенов

У GPT-4o был самый большой диапазон — около 8 тысяч 📱, ещё неплохо показала себя LLaMA-3.3-70B* при использовании CoT.

Что делать? Улучшать механизм внимания, разработать новые подходы к обучению, использовать специализированные модели, развивать Chain-of-Thought Prompting 🧑‍💻

* продукт экстремистской организации, деятельность которой запрещена на территории РФ

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

👍6🔥4🤔3

791 views04:52

Учёба с мемчиками: AI знает, как привлечь внимание детей

🕺

Российские разработчики придумали умную систему для школы. Этот AI думает, как ребёнок, поэтому успешно поможет ему учиться.

Что (или даже кого 🫡) включили в платформу “Препод”? 500 уникальных AI-ассистентов (психологи, методисты и прочие профильные спецы). Они умеют подбирать подходящий материал для каждого ученика с учётом возраста, интересов и уровня подготовки 🤓

Что ещё пригодится?
😶 огромный запас знаний: от книг и учебников до компьютерных игр. AI легко находит общий язык с детьми и объясняет сложные вещи простыми словами
👨‍💻 работает на Python и других продвинутых штуках, позволяющих обрабатывать большие объёмы данных
✉️ умеет фильтровать информацию

Учитывая, что в датасете были даже мемы, интересно, что скажут собственно дети — стрём или норм? 😄

Изображение создано для канала Душа Питона с помощью Kandinsky 3.1

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤1

849 views13:53