Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
CEO Hugging Face рассказал, что каждую неделю получает около 10 предложений от фаундеров, которые хотят продать свои стартапы

Он утверждает, что количество таких предложений резко увеличилось за год. Причин этому может быть две причины:

1) Возможно, дело в самом Hugging Face. За последний год компания сильно выросла, привлекла $235 млн инвестиций и добралась до оценки в $4.5 млрд. К тому же, у них куча ресурсов, поэтому HF теперь выглядит на рынке как очень перспективный потенциальный покупатель.

2) А возможно, рост HF не главная причина, и на ИИ-рынке просто началась консолидация. Cтартапам все труднее выжить в такой высоконкурентной среде. Даже у не слишком мелких игроков, таких так StabilityAI, и то проблемы. А большим компаниям действительно выгодно поглощать стартапы, при чем иногда даже просто ради кадров, а не ради технологии. Регуляризация тоже начинает делать свое дело.

Кстати, на какие-то покупки HF все-таки соглашается. На прошлой неделе они купили Argilla за $10 млн, но по словам оунеров, сделка готовилась уже давно, и HF сами вышли на стартап.
36👍16🔥6🤝1
⚡️ Anthropic опять завозят революцию: бесплатный Claude 3.5 Sonnet уровня GPT-4o

Вы только гляньте на бенчмарки: все, кроме 4o далеко позади, но и 4o отстает на большинстве тестов, в том числе в понимании изображений и графиков. По сравнению с прошлой моделью особенно скакнули способности в кодинге и продвинутом ризонинге. Контекст 200к токенов.

Еще появилась интересная функция Artifacts: по сути, это дополнительные всплывающие интерактивные окна, например для демо.

При всем при этом работает новая версия в 2 раза быстрее Claude 3, и дешевле предшественницы в 5 раз!

Моделька доступна абсолютно бесплатно. Радуемся и ждем обновление арены.
Please open Telegram to view this post
VIEW IN TELEGRAM
59🔥22👍121
Сегодня как-то так
😁13733🔥1131
Исследователи из Оксфорда придумали, как детектить галлюцинации в LM

Идея проста и изящна: давайте заставим LLM выплевывать не один, а несколько ответов, затем откластеризуем их по истинности (то есть если фраза A подразумевает, что верна фраза B, значит они в одном кластере), а потом посчитаем семантическую энтропию.

Дело в том, что правильные ответы будут похожи, а галлюцинации - нет. Получается, если энтропия высокая, значит моделька подвирает и придумывает, а если низкая, значит говорит уверенно и в ее словах нет противоречий. Самое интересное тут, что использовать метод можно не только на инференсе, но не непосредственно во время alignment'а.

Похожую идею, кстати, использовали в недалеком прошлом авторы статьи “More Agents Is All You Need”. Там окончательный ответ формировался с помощью мнения большинства по ответам нескольких агентов.

Возвращаясь к оксфорской статье, ее результаты очень многообещающие: в 79% случаев метод смог верно задетектить галлюцинации. Тем не менее, реальное его внедрение в LLM обойдется дорого, так что метод вряд ли подойдет для бизнеса.
👍71🔥16103🤔3
Жестоко, но факт 🤷‍♀️

Динозавры, не сумевшие адаптироваться, вымерли.

То же самое произойдет с дата сайентистами, которые считают, что обучения моделей внутри Jupyter блокнотов достаточно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95🗿34😁26🫡8👍54💯2
This media is not supported in your browser
VIEW IN TELEGRAM
Прочувствовали?
82🤯6214😐8🤪8😁64🗿4🐳3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Мира Мурати из OpenAI опять выдала базу

«Некоторые творческие профессии, возможно, исчезнут из-за ИИ, но, возможно, их вообще не должно было существовать»


Как вам такой safe AGI?
😁186🗿40👍2014🤨11🤯73💅2
Forwarded from XOR
⚡️ Инженеры из Стэнфордского университета разработали человекоподобного робота HumanPlus, а исходный код опубликовали на GitHub.

Робот может научиться музицировать, боксировать, играть в пинг-понг просто следя за человеческими действиями. Для обучения ему нужно около 40 часов.

За координацию движений отвечает нейросеть. Она же помогает роботу обучаться в реальном времени.

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👾46🔥16👍113😁1🤯1🗿1
Ведущие технологические компании считают одной из самых больших проблем ИИ — неумение шутить.

⚪️Исследователи из DeepMind попросили 20 комиков поделиться своим опытом использования ведущих чат-ботов для написания шуток. Опрошенные сказали, что считают ИИ безвкусным, неоригинальным и чрезмерно политкорректным.

⚪️DeepMind не единственные думают о чувстве юмора ИИ. xAI Илона Маска позиционирует Grok как более смешную альтернативу конкурирующим ИИ.

⚪️На неделе Anthropic выпустила новую модель Claude 3.5 Sonnet, которая, по их словам, значительно лучше понимает юмор.

Мы решили проверить и попросили ChatGPT и Claude написать шутку про Сэма Альтмана. Итог: стендаперы пока могут спать спокойно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3886👍3💘2
В Европе открылся новый университет, полностью посвященный ИИ-образованию

ELLIS Institute в Тюбингене (Германия) теперь планирует стать всемирным центром новаторских фундаментальных исследований в области ИИ.

На открытии вчера было много звездных гостей, в том числе Ян Лекун. Он выступил с небольшой вступительной речью, резюмируем:

«Если вы студент или академический исследователь и хотите добиться прогресса в области искусственного интеллекта человеческого уровня, НЕ РАБОТАЙТЕ НАД LLM.

LLM — это уход с траектории.
Тысячи инженеров работают над LLM, используя огромные вычислительные ресурсы. Единственный способ внести свой вклад в этой области — это проанализировать существующие LLM и показать их возможности и ограничения.

Но гораздо интереснее и эффективнее придумывать новые идеи и новые архитектуры и показывать, что они могут работать даже при решении небольших задач.»


Собираем вещи в Германию?
😁102🔥6238👍266🐳5
Не забываем классику
😁22317🔥9🎉53🌚1
Дата центры в совокупности потребляют больше энергии, чем Италия, Испания, и даже Австралия.

Это выяснили аналитики из Bloomberg в новой статье на тему потребление энергии системами ИИ.

Как всегда, Bloomberg отличается интересными сравнениями и яркими графиками. Отличное чтиво на воскресенье.
64🤯44😁8👍6
Просто стимул выпустить GPT-5
😁116🔥117👍4
Data Secrets
Сыр часто достается второй мышке или как Apple собирается стать монополистом ИИ Скотт Гэллоуэй, профессор маркетинга в NYU, на днях в своем блоге разобрал стратегию Apple, с которой они собираются захватить ИИ рынок. Да-да, вы не ослышались, Apple, у которых…
🚀 Apple уже не остановить. По данным источников, кроме заключения сделки с OpenAI, они также обсуждают партнерство с Google Gemini, Perplexity и Meta для внедрения ИИ-функций в свои устройства.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥57😁22🫡14👍32
Мира Мурати в интервью Dartmouth Engineering:

«GPT3 – это интеллект малыша. GPT-4 соответствует знаниям старшеклассника. А GPT-5 будет иметь уровень PhD»


Как думаете, значит ли это, что GPT-5 тоже потребуется 5 лет, чтобы написать документ, который никто никогда не будет читать?
😁274🔥17🌚13👍65👨‍💻3🐳1💋1
История про то, как два 18-летних школьника привлекли $500 000 на разработку своего AI-стартапа

Несколько недель назад Кристофер Фицджеральд и Николас Ван Лэндшут закончили среднюю школу. Но сейчас, вместо того, чтобы наслаждаться каникулами и собирать вещи в колледж, они сидят и работают над своим AI-стартапом APIGen.

Идея создать его пришла к школьникам всего пару месяцев назад, и за это время они успели изучить рынок, сделать питчдеку и почти закончить MVP. Продукт нацелен на авто-генерацию API для бизнес-процессов и IoT устройств.

Со слов инвесторов, которые дали подросткам $500 тысяч:

«Мы пошли на встречу к этим детям, думая, что просто собираемся дать какие-то отеческие советы и поделиться опытом. А после двух часов их презентации мы вышли, думая, что это была лучшая презентация, которую мы слышали за последние пять лет.»


И кстати, 500к – это только под пресид раунд. Бету обещают выкатить в этом месяце. Удачи пожелаем?
👍20624193😁3🤯3🐳1🙈1
⚡️ Тем временем Андрей Карпаты готовит новый курс по LLM

Он уже сделал его анонс и показал учебную программу. В репозитории, где появится курс, самих лекций пока нет, лежит только ридми с темами. Тем не менее, репа уже набрала 5.5к звезд.

Программа действительно выглядит огненно: вся база современных LLM от attention до мультимодальности. Оцените сами ⬆️

А вот, кстати, список других полезных лекций Карпаты, которые стоит посмотреть.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13032👍1851