NEW BOT Телеграм, страница - 238827225

[31/100] Витя Тарнавский

6.97K subscribers

163 photos

28 videos

2 files

212 links

Head of AI в T-Bank
Канал про будущее продуктов в AI

Нет, я не скажу, что значит счетчик в названии

Рекламу не даю

@the_real_jkee

Download Telegram

About

Blog

Apps

Platform

[31/100] Витя Тарнавский

6.97K subscribers

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Здесь Альтман говорит про «one man unicorn» - компанию на 1B из одного человека. Классный тренд, я за ним слежу.

Образ будущего здесь такой: у руководителя бизнеса вместо работников шуруют цифровые агенты. Один разбирает заявки на почте, другой карточки товаров создает, третий бухгалтерию ведет, и так далее.

Те, кто пробовал такое делать, знают, что пока что сложновато получается: модели нестабильны, качество обеспечивать сложно, платформ удобных нет и так далее. Но все это улучшается.

А вот преимущества таких агентов неоспоримы:
- Работают стабильно и 24/7. Не болеют, не ходят в декрет
- Дешевле; и чем дальше тем более дешёвые
- Масштабируются по кнопке

Понятно что люди тоже останутся и это скорее комбинация. Тем более что физический мир роботам пока плохо удаётся.

Но уже понятно что новый навык управления и работы это создание, обучение и контроль таких агентов.

❤27⚡12🔥4👍1

3.07K views07:13

[31/100] Витя Тарнавский

Потрясающий материал по ML для обычных людей.

Если вы хотите разобраться в ML в деталях но без цели быть инженером - золотой контент для вас!

https://vas3k.blog/blog/machine_learning/

Машинное обучение для людей

❤44🔥21👍15😍2👏1

14.1K views07:01

[31/100] Витя Тарнавский

Часто хожу по улице и говорю с gpt-4o advanced voice mode в режиме звонка.

Можно обсудить сложные темы на высоком уровне - знаний в ней больше чем в среднем человеке. Можно обсудить личные дилеммы и попросить поработать коучем. Можно попросить быть преподавателем по языку и корректировать английский.

Как замена тренировки разговорного языка уж точно лучше кожаных партнеров - знаний больше, всегда доступен, в любой момент трубку положил.

Long memory тоже есть и со временем погружать в контекст нужно все меньше. Все как с людьми.

Пользуйтесь!

❤74👍14🔥8🤔2

3.44K views07:30

[31/100] Витя Тарнавский

OpenAI выпустили MLE-bench - новый сложный бенчмарк для LLM.

По сути это бенчмарк в котором одни модели должны учиться обучать другие модели. Ну то есть обучать себе подобные системы.

o1 выбивает уже неплохие 16.9% бронзовых мест в их наборе Kaggle соревнований.

Что там по сингулярности?

🔥5🤯5❤4🤨1

2.5K views07:25

[31/100] Витя Тарнавский

Channel name was changed to «[21/100] Витя Тарнавский»

08:48

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

На этой неделе в Китае, буду кидать интересные AI-решения и другие приколы из местных сервисов.

В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!

🔥37❤6👍4🐳2

2.98K views07:40

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Baidu - 65% поискового рынка в Китае. Вот такую милую девушку ассистента имеют в приложении, с виду она довольно бесполезная.

Интересно другое.

Классический поиск в Китае не такой уж роскошный бизнес как в других странах. Очень закрытые экосистемы (WeChat, etc) не дают нормально искать по ним. Поиск как бизнес в Китае в 3-4 раза меньше чем в USA относительно остального технологического сектора в стране (o1 research)

В кулуарах рассказали что Baidu не очень на него ставят долгосрочно, хотя сейчас это основной источник дохода. Экосистемы будут закрываться все больше и трафик будет жить внутри этих экосистем. В Китае не строят perplexity, это не имеет смысла.

Компания перестраивается в технологического провайдера AI решений. Основные ставки: self-driving и ai b2b решения. Ресурсов вваливают много: 100к+ видеочипов имеются, например.

Интересно, насколько рынок РФ будет превращаться в рынок закрытых экосистем. Пока что это не очевидно.

🔥20❤5👍4

2.51K views14:50

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Alipay - главная платежная система страны с дневной аудиторией около 500 миллионов человек. Это три с половиной России каждый день.

А на второй вкладке у них - дорамы. Дорамы! Видеосериалы 🥴

Они вставляют их чтобы растить время в приложении и бороться с тиктоком.

Кажется, в этом месте цивилизация свернула не туда 😅

😁37👍6

2.76K views09:45

[31/100] Витя Тарнавский

Дикий замес вокруг Китая, Тайваня и чипов для AI

На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела.

TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD. Крупные фабрики есть еще у Intel и Samsung. Фактически все кто хотят производить крутые чипы идут в TSMC.

У TSMC есть запрет на производство для Китая топовых чипов, так как они используют технологии США.

Все производители чипов живут на оборудовании одной компании - нидерландская компания ASML. Она делает топовые станки для литографии, позволяющие делать чипы на 7nm и 5nm. Больше никто в мире не умеет, совсем.

Компания ASML может продавать станки только с разрешения голландского правительства. Которое это разрешение Китаю не дает (как и России, кстати).

То есть, для Китая:
- станки для производства закупать не дают;
- заказать производство не дают;
- покупать Nvidia тоже толком не дают;
- все эти заводы и станки находятся в Тайване который прямо рядом с Китаем и который они считают своей территорией.

И примерно все топовые чипы Nvidia производятся на этом же клочке земли.

Такой вот замес!

😱31🔥14❤3💅1

3.06K views07:21

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Вот это прикольная тема. Автопилот Baidu видит участников движения не только своими глазами, но и глазами дорожных камер.

В Китае есть государственная система обмена информацией в которую можно воткнуться если ты делаешь self-driving. И это позволяет видеть в том числе участников движения вне зоны видимости. На видео - желтым цветом.

Они вместе с правительством двигаются к роевому управлению флотом. Это когда автопилоты знают друг про друга и управляются совместно. Если при этом убрать живых водителей, можно разогнать машины по скорости и при этом сделать движение безопасней.

❤‍🔥51👍19🔥8❤2

2.82K views12:59

[31/100] Витя Тарнавский

Не люди ищут товар, а товар ищет людей

Пропитываемся мудростью от ByteDance - создателей TikTok. Их ключевое стратегическое убеждение такое: раньше люди искали контент, а теперь контент ищет людей.

Раньше люди читали новости сами и искали информацию в интернете. А теперь всё наоборот: люди смотрят в тик-ток или другую трубу получения информации, а уже сервис сам подбирает информацию которая человеку нужна.

Они уже сделали это с контентом в TikTok и активно делают с товарами. Сегодня тик-ток это еще и крупная e-commerce площадка.

Кстати, tiktok в Китае это 700 млн dau 😅

🤔18👍8🔥6❤5🤯1

2.29K views09:25

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Каждая уважающая себя тех компания в Китае делает свой копайлот интерфейс похожий на UI ChatGPT. И непременно на своих моделях.

Причем не очень важно комплиментарно ли это их бизнесу ) Baidu, Alibaba, Tencent - все они.

Как я понял из разговоров, это такое доказательство что они действительно делают AI.

🤔17🔥6😁6❤‍🔥1

2.38K views13:45

[31/100] Витя Тарнавский

Skyscanner, TripAdvisor и другие компании с картинки это на самом деле китайский trip.com - один из самых крупных международных travel-игроков.

Они инвестируют $400 млн в год на искусственный интеллект. При этом ассистент у них в приложениях косячит на глазах и вклада в бизнес не делает.

На поддержке, правда, 70%+ запросов они оптимизируют. Это как будто стандарт индустрии - 70% оптимизация поддержки за счет AI.

❤‍🔥18

2.62K views08:05

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Прямо в навигаторе подсвечено сколько секунд до зеленого на светофоре. Будущее!

Это все та же государственная система обмена дорожной информации, к которой подключены все навигаторы.

❤‍🔥70💅13

2.87K views14:45

[31/100] Витя Тарнавский

This media is not supported in your browser

VIEW IN TELEGRAM

Высокоскоростные поезда в Китае едут с сильным креном на поворотах чтобы держать скорость на повороте.

На видосе смотрите на горизонт, постарался его держать ровно. А поезд под углом.

Ощущения как на американских горках!

❤‍🔥40💅10

2.33K views10:15

[31/100] Витя Тарнавский

90% качество AI продуктов

ML основан на статистике и вероятностях - значит, в фундаменте заложена вероятность ошибки.

Ваш ассистент подумает что шенжень это женьшень и отправит человека на Алтай, ваша камера будет видеть в котенке qr-код, ваша Алиса будет реагировать на подлизу.

Вам нужна метрика качества. Хотя бы такая простая: какой процент реальных задач пользователей вы обрабатываете правильно. Без прибора качества развивать AI продукт не получится, можно только демку собрать.

В среднем люди считают что продукт работает «надежно» или «хорошо» если он имеет качество 90%+. Это может казаться как «много» но на самом деле это буквально «ошибся каждый десятый раз».

Обычно AI-метрик качества несколько и строить их довольно сложно.

Работа над AI продуктом это прежде всего правильное построение метрик качества и потом работа над получением заветных 90+. Вот здесь вам и нужны лучшие инженеры и лучшие умеющие работать с этим продакты.

❤‍🔥25💅9

2.34K views11:10

[31/100] Витя Тарнавский

Как использовать o1 от OpenAI

o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ информации.

Давайте сразу на примере.

Допустим, мне понадобилось посмотреть на рынок FMCG в USA - доля онлайна и динамика, основные игроки, как всё вообще устроено.

Я на лету из головы пишу такой запрос:

I need a research about online fmcg market in USA, actual for 2023.
- main online players and shares in GMV and orders if possible - in table format
- distinction of main players in terms of product prop, region and any other interesting details
- what ecosystem they are part of if any
- any other important details
- share of online market and dynamics in 10 yrs span

all data should be from reliable sources, check it plz. and make the report compact

И получаю вот такой потрясающий отчет - посмотрите!

Этот отчет отлично структурирован, данные как я просил в табличке, все ссылки на источники есть, всё отвалидировано. Я получил ответ за 32 секунды. Я бы ковырялся 3 часа чтобы собрать все эти выводы.

Модель пока не умеет работать с вашими файлами, но полноценная o1 уже анонсирована, ждем. Тогда это станет x100 инструмент для исследовательско-консалтерской работы.

Используйте!

❤‍🔥52💅7

3.14K views07:07

[31/100] Витя Тарнавский

[31/100] Витя Тарнавский

Как использовать o1 от OpenAI o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ…

В комментах очень верно напомнили что результат надо проверять.

Моя практика такая:
- если просить o1 проверять информацию и не выдумывать то по опыту ошибок почти нет
- помогает проверить пару чисел по источнику

В целом все как с живым консультантом, только быстро работает. Как по мне так получается предсказуемей и управляемый чем люди.

И напомню что все текущие решения это копилот а не замена человеку.

💅13❤‍🔥5

2.43K views09:05

[31/100] Витя Тарнавский

[31/100] Витя Тарнавский

Как использовать o1 от OpenAI o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ…

Мои любимцы Perplexity не отстают и недавно запустили advanced pro search в котором тоже есть multi-step reasoning как они его сами называют.

В духе Perplexity в ответе есть все источники (легко всё проверить). Правда, на этом запросе потеряли один важный источник.

Кто-нибудь знает бенч или арену где можно сравнивать результаты на подобных сложных кейсах?

❤‍🔥20💅7

2.6K views16:30

[31/100] Витя Тарнавский

Недавно CPO Лавки Никита Толстой (🫂 hugs bro) запустил агрегатор для телеграм каналов за несколько часов в обнимку с ChatGPT. Код Никита в жизни в целом писал, что важно.

На этом примере хочу донести простую мысль, которую подсмотрел в Y Combinator подкасте про replit.

Способность программировать с развитием технологий открывает всё больше возможностей.

- 20 лет назад опытный разработчик мог написать за пару часов сортировку. Вроде полезно, но не очень.
- 10 лет назад средний разработчик собирал за несколько часов небольшой сайт, если имел в этом опыт. Уже сильно больше пользы для общества.
- Сегодня Никита Толстой может собрать интеллектуальный законченный продукт без знаний конкретных библиотек и подходов и вообще с другой работы.

Завтра - больше.

Да, немного про no-code. Возможно, когда-нибудь и придет фаза победившего low-code/no-code, но пока что практика скорее обратная. Самые классные платформы ускоренной разработки основаны на генерации кода и возможности с ним работать, а не на blackbox кубиках.

Учитесь программировать.

❤‍🔥40🤔5

3.77K views09:20

[31/100] Витя Тарнавский

Gigachat MAX / YandexGPT 4.0

Вчера два наших технологических лидера представили новые версии своих моделей. Да, день в день 🤔

Gigachat MAX — 32k контекста, серьезный прогресс по MERA
YandexGPT 4.0 — 32k контекста, "близки к gpt-4o"

Сравнить довольно сложно. Сравниваются компании по своим бенчмаркам, прямого сравнения как будто избегают, третьих площадок для сравнения скорее нет. Даже перевод mmlu у двух компаний разный.

По относительным позициям в бенчах мой вывод такой: модели довольно похожи и находятся на уровне "несколько лучше llama 3.1 70b" и "значимо ниже gpt-4o". Собственно, это их два основных конкурента на нашем рынке.

Долгосрочно, мерило — это рынок. Бенчмарки хороши для первичной оценки, но на практике всё может быть иначе. Это как разработчиков сравнивать по их характеристикам.

Радуюсь за ребят - оба релиза выглядят крутыми, особенно на фоне дикого отставания в железе.

❤‍🔥39💅16

3.05K views10:08