NEW BOT Телеграм, страница

28 ноября Андрей Яковлев разобрал статью от OpenAI «Why Language Models Hallucinate?»

🎬Выкладываем запись встречи и делимся выводами:
🛑галлюцинации возникают из-за статистического обучения (модель учится «угадывать» токены);
🛑post-training не избавляют модель от галлюцинаций;
🛑бинарные метрики бенчмарков поощряют угадывание, из-за чего модели оптимизированы быть "хорошо сдающими экзамены", а не честными;
🛑решение — использование "честных" методов оценки и вознаграждения моделей.

#reading_group #recording #llm

Please open Telegram to view this post

VIEW IN TELEGRAM

1.16K views19:24

Data Science by ODS.ai 🦜

Forwarded from Kirill Malev

AI platform for generating online courses just announced a 16M round by a16z

The product looks good but it wasn’t what clicked for me. I couldn’t help to notice the new trend of providing refined videos in the posts to share key updates. That’s something which just entered our life with the spread of AI.

Website: oboe.com
Source: https://x.com/nirzicherman/status/1998770866809712839

#AI #AI_adoption

❤1🔥1

1.13K views19:31

Data Science by ODS.ai 🦜

Forwarded from База знаний AI

«Норникель» выпустил открытую языковую модель MetalGPT-1 и бенчмарк Alloy-Bench для металлургии

MetalGPT-1 обучена на 10 Гб текстов по металлургии и горнодобывающей промышленности. Это больше чем 1 млн документов, недоступных в открытых источниках. Данные прошли очистку и анонимизацию, чтобы предотвратить раскрытие коммерческой тайны. При обучении также использовалось около 500 тыс. вопросно-ответных и инструктивных пар на основе производственных и научных задач.

Модель содержит 32 млрд параметров. Она спроектирована для работы с профессиональной терминологией, аббревиатурами и сложными технологическими цепочками. «Норникель» создает на базе MetalGPT-1 персональных ИИ-ассистентов и автономных агентов, которые внедряются в операционные процессы компании.

Промышленный бенчмарк Alloy-Bench состоит из набора вопросно-ответных пар, которые относятся к различным процессам горно-металлургической отрасли. Как утверждают разработчики, MetalGPT-1 в тестах превосходит открытые универсальные модели.

👉🏻MetalGPT-1 и Alloy-Bench на Hugging Face

🔗Источник: https://nornickel.ru/news-and-media/press-releases-and-news/metalgpt-1-nornikel-vypustil-bolshuyu-yazykovuyu-model-dlya-metallurgii/

👍7😢1

1.26K views19:50

Data Science by ODS.ai 🦜

Forwarded from Мой Компьютер

Nvidia будет отслеживать геолокацию своих ИИ-чипов

Ресурс Reuters сообщил, что Nvidia разработала технологию, которая позволит определить страну, где фактически находится каждый её ИИ-чип. Речь идет о простом пинге: ускоритель будет отправлять запросы на служебные серверы Nvidia, и по времени отклика до каждого можно определить примерное местоположение. Этот функционал будет встроен в систему отслеживания состояния GPU-фермы клиента.

Изначально такая технология появится в новейших ускорителях Blackwell, которые имеют расширенные средства аттестации и защиты. В будущем она может появиться на более старых решениях Hopper и Ampere. А значит в теории Nvidia может устроить такую же слежку за видеокартами обычных пользователей и запрещать их работу в санкционных странах.

Мой Компьютер

1.44K views19:53

Data Science by ODS.ai 🦜

Forwarded from Анализ данных (Data analysis)

⚡️ Новый пост Andrej Karpathy : автоматическая оценка десятилетних обсуждений Hacker News с позиции «задним числом»

Он взял все 930 материалов и обсуждений с главной страницы Hacker News за декабрь 2015 года и прогнал их через GPT 5.1 Thinking API, попросив модель определить самые дальновидные и самые ошибочные комментарии.

Примерно 3 часа ушло на написание кода и ещё час и ~$60 - на запуск.

Почему это важно:

1. Анализ «задним числом»- мощный инструмент для тренировки собственного навыка прогнозирования. Чтение таких выводов помогает лучше понимать, где именно люди предугадывали будущее, а где промахивались.
2. Стоит задуматься, как будет выглядеть мир, когда будущие LLM смогут делать такие исследования намного дешевле, быстрее и точнее. Любой ваш комментарий в интернете может стать объектом глубокого анализа - бесплатно и в огромном масштабе. Как автор писал ранее: «будьте хорошими, будущие LLM за вами наблюдают».

🎉 Топ-10 аккаунтов: pcwalton, tptacek, paulmd, cstross, greglindahl, moxie, hannob, 0xcde4c3db, Manishearth и johncolanduoni - GPT 5.1 Thinking признал их комментарии самыми точными и дальновидными в декабре 2015 года.

🔗 Полные материалы:
- Подробный разбор: karpathy.bearblog.dev/auto-grade-hn/
- Репозиторий проекта: github.com/karpathy/hn-time-capsule
- Готовые результаты: karpathy.ai/hncapsule/

@data_analysis_ml

❤4👍3🔥2😴1

1.25K views05:51

Data Science by ODS.ai 🦜

всем привет, напоминаем, что до 31 декабря открыт прием заявок на Премию в области обработки естественного языка имени Владимира Иосифовича Левенштейна (на фото), автора знаменитого расстояния редактирования

хочу поделиться новостью, что компания Selectel выделила 100 000 бонусов лауреату премии (этого хватит на два месяца аренды GPU Nvidia A100 в облаке)

выдвигаться можно самостоятельно или выдвинуть кого-то из коллег; заявки принимаются тут

🤡2🔥1

1.24K views11:05

Data Science by ODS.ai 🦜

Forwarded from Machinelearning

🌟 "ИИ-отцы" получили главную ежегодную награду журнала Time «Человек года».

Их объединённый портрет, вдохновлённый культовой фотографией «Обед на небоскрёбе», украсил обложку.

В числе тех, кого редакция назвала главными архитекторами новой технологической эры: Илон Маск, Марк Цукерберг, Лиза Су (AMD), Джeнсен Хуанг (Nvidia), Сэм Альтман (OpenAI), Демис Хассабис (DeepMind), Дарио Амодей (Anthropic) и Фэй-Фэй Ли (World Labs).

Как отмечает издание, в 2025 году потенциал ИИ был полностью реализован, а эта группа визионеров окончательно утвердила наступление эпохи мыслящих машин.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🤡6❤2👍1🔥1

722 views16:46

About

Blog

Apps

Platform