[31/100] Витя Тарнавский – Telegram
[31/100] Витя Тарнавский
6.45K subscribers
155 photos
27 videos
2 files
193 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Нет, я не скажу, что значит счетчик в названии

Рекламу не даю

@the_real_jkee
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Очень прикольно следить за размышлениями o1 над сложной задачей.

Особенно на контрасте со мной, кожаным мешком. Мой chain of thoughts во-первых медленней в 100 раз, во-вторых на втором звене обычно заканчивается 😅
👍23😁114🥱2👾1
Изучаю платформы для построения LLM-приложений. Пока что с точки зрения продукта фаворит с отрывом это https://relevanceai.com/

У них есть:
- Очень понятная собиралка агентов и пайплайнов из агентов
- Великолепный конструктор тулов
- Возможность втыкаться кодом на питоне в тулы
- Классные интеграции и с каналами, и с внешними триггерами (а-ля запускать агента по тычку из zapier)

Ну и как все такие хорошие платформы они model agnostic
🔥197👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Здесь Альтман говорит про «one man unicorn» - компанию на 1B из одного человека. Классный тренд, я за ним слежу.

Образ будущего здесь такой: у руководителя бизнеса вместо работников шуруют цифровые агенты. Один разбирает заявки на почте, другой карточки товаров создает, третий бухгалтерию ведет, и так далее.

Те, кто пробовал такое делать, знают, что пока что сложновато получается: модели нестабильны, качество обеспечивать сложно, платформ удобных нет и так далее. Но все это улучшается.

А вот преимущества таких агентов неоспоримы:
- Работают стабильно и 24/7. Не болеют, не ходят в декрет
- Дешевле; и чем дальше тем более дешёвые
- Масштабируются по кнопке

Понятно что люди тоже останутся и это скорее комбинация. Тем более что физический мир роботам пока плохо удаётся.

Но уже понятно что новый навык управления и работы это создание, обучение и контроль таких агентов.
2712🔥4👍1
Потрясающий материал по ML для обычных людей.

Если вы хотите разобраться в ML в деталях но без цели быть инженером - золотой контент для вас!

https://vas3k.blog/blog/machine_learning/
44🔥21👍15😍2👏1
Часто хожу по улице и говорю с gpt-4o advanced voice mode в режиме звонка.

Можно обсудить сложные темы на высоком уровне - знаний в ней больше чем в среднем человеке. Можно обсудить личные дилеммы и попросить поработать коучем. Можно попросить быть преподавателем по языку и корректировать английский.

Как замена тренировки разговорного языка уж точно лучше кожаных партнеров - знаний больше, всегда доступен, в любой момент трубку положил.

Long memory тоже есть и со временем погружать в контекст нужно все меньше. Все как с людьми.

Пользуйтесь!
74👍14🔥8🤔2
OpenAI выпустили MLE-bench - новый сложный бенчмарк для LLM.

По сути это бенчмарк в котором одни модели должны учиться обучать другие модели. Ну то есть обучать себе подобные системы.

o1 выбивает уже неплохие 16.9% бронзовых мест в их наборе Kaggle соревнований.

Что там по сингулярности?
🔥5🤯54🤨1
Channel name was changed to «[21/100] Витя Тарнавский»
This media is not supported in your browser
VIEW IN TELEGRAM
На этой неделе в Китае, буду кидать интересные AI-решения и другие приколы из местных сервисов.

В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!
🔥376👍4🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
Baidu - 65% поискового рынка в Китае. Вот такую милую девушку ассистента имеют в приложении, с виду она довольно бесполезная.

Интересно другое.

Классический поиск в Китае не такой уж роскошный бизнес как в других странах. Очень закрытые экосистемы (WeChat, etc) не дают нормально искать по ним. Поиск как бизнес в Китае в 3-4 раза меньше чем в USA относительно остального технологического сектора в стране (o1 research)

В кулуарах рассказали что Baidu не очень на него ставят долгосрочно, хотя сейчас это основной источник дохода. Экосистемы будут закрываться все больше и трафик будет жить внутри этих экосистем. В Китае не строят perplexity, это не имеет смысла.

Компания перестраивается в технологического провайдера AI решений. Основные ставки: self-driving и ai b2b решения. Ресурсов вваливают много: 100к+ видеочипов имеются, например.

Интересно, насколько рынок РФ будет превращаться в рынок закрытых экосистем. Пока что это не очевидно.
🔥205👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Alipay - главная платежная система страны с дневной аудиторией около 500 миллионов человек. Это три с половиной России каждый день.

А на второй вкладке у них - дорамы. Дорамы! Видеосериалы 🥴

Они вставляют их чтобы растить время в приложении и бороться с тиктоком.

Кажется, в этом месте цивилизация свернула не туда 😅
😁37👍6
Дикий замес вокруг Китая, Тайваня и чипов для AI

На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела.

TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD. Крупные фабрики есть еще у Intel и Samsung. Фактически все кто хотят производить крутые чипы идут в TSMC.

У TSMC есть запрет на производство для Китая топовых чипов, так как они используют технологии США.

Все производители чипов живут на оборудовании одной компании - нидерландская компания ASML. Она делает топовые станки для литографии, позволяющие делать чипы на 7nm и 5nm. Больше никто в мире не умеет, совсем.

Компания ASML может продавать станки только с разрешения голландского правительства. Которое это разрешение Китаю не дает (как и России, кстати).

То есть, для Китая:
- станки для производства закупать не дают;
- заказать производство не дают;
- покупать Nvidia тоже толком не дают;
- все эти заводы и станки находятся в Тайване который прямо рядом с Китаем и который они считают своей территорией.

И примерно все топовые чипы Nvidia производятся на этом же клочке земли.

Такой вот замес!
😱31🔥143💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот это прикольная тема. Автопилот Baidu видит участников движения не только своими глазами, но и глазами дорожных камер.

В Китае есть государственная система обмена информацией в которую можно воткнуться если ты делаешь self-driving. И это позволяет видеть в том числе участников движения вне зоны видимости. На видео - желтым цветом.

Они вместе с правительством двигаются к роевому управлению флотом. Это когда автопилоты знают друг про друга и управляются совместно. Если при этом убрать живых водителей, можно разогнать машины по скорости и при этом сделать движение безопасней.
❤‍🔥51👍19🔥82
Не люди ищут товар, а товар ищет людей

Пропитываемся мудростью от ByteDance - создателей TikTok. Их ключевое стратегическое убеждение такое: раньше люди искали контент, а теперь контент ищет людей.

Раньше люди читали новости сами и искали информацию в интернете. А теперь всё наоборот: люди смотрят в тик-ток или другую трубу получения информации, а уже сервис сам подбирает информацию которая человеку нужна.

Они уже сделали это с контентом в TikTok и активно делают с товарами. Сегодня тик-ток это еще и крупная e-commerce площадка.

Кстати, tiktok в Китае это 700 млн dau 😅
🤔18👍8🔥65🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Каждая уважающая себя тех компания в Китае делает свой копайлот интерфейс похожий на UI ChatGPT. И непременно на своих моделях.

Причем не очень важно комплиментарно ли это их бизнесу ) Baidu, Alibaba, Tencent - все они.

Как я понял из разговоров, это такое доказательство что они действительно делают AI.
🤔17🔥6😁6❤‍🔥1
Skyscanner, TripAdvisor и другие компании с картинки это на самом деле китайский trip.com - один из самых крупных международных travel-игроков.

Они инвестируют $400 млн в год на искусственный интеллект. При этом ассистент у них в приложениях косячит на глазах и вклада в бизнес не делает.

На поддержке, правда, 70%+ запросов они оптимизируют. Это как будто стандарт индустрии - 70% оптимизация поддержки за счет AI.
❤‍🔥18
This media is not supported in your browser
VIEW IN TELEGRAM
Прямо в навигаторе подсвечено сколько секунд до зеленого на светофоре. Будущее!

Это все та же государственная система обмена дорожной информации, к которой подключены все навигаторы.
❤‍🔥70💅13
This media is not supported in your browser
VIEW IN TELEGRAM
Высокоскоростные поезда в Китае едут с сильным креном на поворотах чтобы держать скорость на повороте.

На видосе смотрите на горизонт, постарался его держать ровно. А поезд под углом.

Ощущения как на американских горках!
❤‍🔥40💅10
90% качество AI продуктов

ML основан на статистике и вероятностях - значит, в фундаменте заложена вероятность ошибки.

Ваш ассистент подумает что шенжень это женьшень и отправит человека на Алтай, ваша камера будет видеть в котенке qr-код, ваша Алиса будет реагировать на подлизу.

Вам нужна метрика качества. Хотя бы такая простая: какой процент реальных задач пользователей вы обрабатываете правильно. Без прибора качества развивать AI продукт не получится, можно только демку собрать.

В среднем люди считают что продукт работает «надежно» или «хорошо» если он имеет качество 90%+. Это может казаться как «много» но на самом деле это буквально «ошибся каждый десятый раз».

Обычно AI-метрик качества несколько и строить их довольно сложно.

Работа над AI продуктом это прежде всего правильное построение метрик качества и потом работа над получением заветных 90+. Вот здесь вам и нужны лучшие инженеры и лучшие умеющие работать с этим продакты.
❤‍🔥25💅9
Как использовать o1 от OpenAI

o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ информации.

Давайте сразу на примере.

Допустим, мне понадобилось посмотреть на рынок FMCG в USA - доля онлайна и динамика, основные игроки, как всё вообще устроено.

Я на лету из головы пишу такой запрос:
I need a research about online fmcg market in USA, actual for 2023.
- main online players and shares in GMV and orders if possible - in table format
- distinction of main players in terms of product prop, region and any other interesting details
- what ecosystem they are part of if any
- any other important details
- share of online market and dynamics in 10 yrs span

all data should be from reliable sources, check it plz. and make the report compact


И получаю вот такой потрясающий отчет - посмотрите!

Этот отчет отлично структурирован, данные как я просил в табличке, все ссылки на источники есть, всё отвалидировано. Я получил ответ за 32 секунды. Я бы ковырялся 3 часа чтобы собрать все эти выводы.

Модель пока не умеет работать с вашими файлами, но полноценная o1 уже анонсирована, ждем. Тогда это станет x100 инструмент для исследовательско-консалтерской работы.

Используйте!
❤‍🔥52💅7
[31/100] Витя Тарнавский
Как использовать o1 от OpenAI o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ…
В комментах очень верно напомнили что результат надо проверять.

Моя практика такая:
- если просить o1 проверять информацию и не выдумывать то по опыту ошибок почти нет
- помогает проверить пару чисел по источнику

В целом все как с живым консультантом, только быстро работает. Как по мне так получается предсказуемей и управляемый чем люди.

И напомню что все текущие решения это копилот а не замена человеку.
💅13❤‍🔥5
[31/100] Витя Тарнавский
Как использовать o1 от OpenAI o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ…
Мои любимцы Perplexity не отстают и недавно запустили advanced pro search в котором тоже есть multi-step reasoning как они его сами называют.

В духе Perplexity в ответе есть все источники (легко всё проверить). Правда, на этом запросе потеряли один важный источник.

Кто-нибудь знает бенч или арену где можно сравнивать результаты на подобных сложных кейсах?
❤‍🔥20💅7