This media is not supported in your browser
VIEW IN TELEGRAM
Здесь Альтман говорит про «one man unicorn» - компанию на 1B из одного человека. Классный тренд, я за ним слежу.
Образ будущего здесь такой: у руководителя бизнеса вместо работников шуруют цифровые агенты. Один разбирает заявки на почте, другой карточки товаров создает, третий бухгалтерию ведет, и так далее.
Те, кто пробовал такое делать, знают, что пока что сложновато получается: модели нестабильны, качество обеспечивать сложно, платформ удобных нет и так далее. Но все это улучшается.
А вот преимущества таких агентов неоспоримы:
- Работают стабильно и 24/7. Не болеют, не ходят в декрет
- Дешевле; и чем дальше тем более дешёвые
- Масштабируются по кнопке
Понятно что люди тоже останутся и это скорее комбинация. Тем более что физический мир роботам пока плохо удаётся.
Но уже понятно что новый навык управления и работы это создание, обучение и контроль таких агентов.
Образ будущего здесь такой: у руководителя бизнеса вместо работников шуруют цифровые агенты. Один разбирает заявки на почте, другой карточки товаров создает, третий бухгалтерию ведет, и так далее.
Те, кто пробовал такое делать, знают, что пока что сложновато получается: модели нестабильны, качество обеспечивать сложно, платформ удобных нет и так далее. Но все это улучшается.
А вот преимущества таких агентов неоспоримы:
- Работают стабильно и 24/7. Не болеют, не ходят в декрет
- Дешевле; и чем дальше тем более дешёвые
- Масштабируются по кнопке
Понятно что люди тоже останутся и это скорее комбинация. Тем более что физический мир роботам пока плохо удаётся.
Но уже понятно что новый навык управления и работы это создание, обучение и контроль таких агентов.
❤27⚡12🔥4👍1
Потрясающий материал по ML для обычных людей.
Если вы хотите разобраться в ML в деталях но без цели быть инженером - золотой контент для вас!
https://vas3k.blog/blog/machine_learning/
Если вы хотите разобраться в ML в деталях но без цели быть инженером - золотой контент для вас!
https://vas3k.blog/blog/machine_learning/
vas3k.blog
Машинное обучение для людей
None
❤44🔥21👍15😍2👏1
Часто хожу по улице и говорю с gpt-4o advanced voice mode в режиме звонка.
Можно обсудить сложные темы на высоком уровне - знаний в ней больше чем в среднем человеке. Можно обсудить личные дилеммы и попросить поработать коучем. Можно попросить быть преподавателем по языку и корректировать английский.
Как замена тренировки разговорного языка уж точно лучше кожаных партнеров - знаний больше, всегда доступен, в любой момент трубку положил.
Long memory тоже есть и со временем погружать в контекст нужно все меньше. Все как с людьми.
Пользуйтесь!
Можно обсудить сложные темы на высоком уровне - знаний в ней больше чем в среднем человеке. Можно обсудить личные дилеммы и попросить поработать коучем. Можно попросить быть преподавателем по языку и корректировать английский.
Как замена тренировки разговорного языка уж точно лучше кожаных партнеров - знаний больше, всегда доступен, в любой момент трубку положил.
Long memory тоже есть и со временем погружать в контекст нужно все меньше. Все как с людьми.
Пользуйтесь!
❤74👍14🔥8🤔2
OpenAI выпустили MLE-bench - новый сложный бенчмарк для LLM.
По сути это бенчмарк в котором одни модели должны учиться обучать другие модели. Ну то есть обучать себе подобные системы.
o1 выбивает уже неплохие 16.9% бронзовых мест в их наборе Kaggle соревнований.
Что там по сингулярности?
По сути это бенчмарк в котором одни модели должны учиться обучать другие модели. Ну то есть обучать себе подобные системы.
o1 выбивает уже неплохие 16.9% бронзовых мест в их наборе Kaggle соревнований.
Что там по сингулярности?
🔥5🤯5❤4🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
На этой неделе в Китае, буду кидать интересные AI-решения и другие приколы из местных сервисов.
В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!
В JD - второй по размеру маркетплейс - встроен свой тик-ток на второй вкладке. Любое видео можно ставить на паузу, найти все товары на кадре и положить в корзину. Довольно круто!
🔥37❤6👍4🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
Baidu - 65% поискового рынка в Китае. Вот такую милую девушку ассистента имеют в приложении, с виду она довольно бесполезная.
Интересно другое.
Классический поиск в Китае не такой уж роскошный бизнес как в других странах. Очень закрытые экосистемы (WeChat, etc) не дают нормально искать по ним. Поиск как бизнес в Китае в 3-4 раза меньше чем в USA относительно остального технологического сектора в стране (o1 research)
В кулуарах рассказали что Baidu не очень на него ставят долгосрочно, хотя сейчас это основной источник дохода. Экосистемы будут закрываться все больше и трафик будет жить внутри этих экосистем. В Китае не строят perplexity, это не имеет смысла.
Компания перестраивается в технологического провайдера AI решений. Основные ставки: self-driving и ai b2b решения. Ресурсов вваливают много: 100к+ видеочипов имеются, например.
Интересно, насколько рынок РФ будет превращаться в рынок закрытых экосистем. Пока что это не очевидно.
Интересно другое.
Классический поиск в Китае не такой уж роскошный бизнес как в других странах. Очень закрытые экосистемы (WeChat, etc) не дают нормально искать по ним. Поиск как бизнес в Китае в 3-4 раза меньше чем в USA относительно остального технологического сектора в стране (o1 research)
В кулуарах рассказали что Baidu не очень на него ставят долгосрочно, хотя сейчас это основной источник дохода. Экосистемы будут закрываться все больше и трафик будет жить внутри этих экосистем. В Китае не строят perplexity, это не имеет смысла.
Компания перестраивается в технологического провайдера AI решений. Основные ставки: self-driving и ai b2b решения. Ресурсов вваливают много: 100к+ видеочипов имеются, например.
Интересно, насколько рынок РФ будет превращаться в рынок закрытых экосистем. Пока что это не очевидно.
🔥20❤5👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Alipay - главная платежная система страны с дневной аудиторией около 500 миллионов человек. Это три с половиной России каждый день.
А на второй вкладке у них - дорамы. Дорамы! Видеосериалы 🥴
Они вставляют их чтобы растить время в приложении и бороться с тиктоком.
Кажется, в этом месте цивилизация свернула не туда 😅
А на второй вкладке у них - дорамы. Дорамы! Видеосериалы 🥴
Они вставляют их чтобы растить время в приложении и бороться с тиктоком.
Кажется, в этом месте цивилизация свернула не туда 😅
😁37👍6
Дикий замес вокруг Китая, Тайваня и чипов для AI
На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела.
TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD. Крупные фабрики есть еще у Intel и Samsung. Фактически все кто хотят производить крутые чипы идут в TSMC.
У TSMC есть запрет на производство для Китая топовых чипов, так как они используют технологии США.
Все производители чипов живут на оборудовании одной компании - нидерландская компания ASML. Она делает топовые станки для литографии, позволяющие делать чипы на 7nm и 5nm. Больше никто в мире не умеет, совсем.
Компания ASML может продавать станки только с разрешения голландского правительства. Которое это разрешение Китаю не дает (как и России, кстати).
То есть, для Китая:
- станки для производства закупать не дают;
- заказать производство не дают;
- покупать Nvidia тоже толком не дают;
- все эти заводы и станки находятся в Тайване который прямо рядом с Китаем и который они считают своей территорией.
И примерно все топовые чипы Nvidia производятся на этом же клочке земли.
Такой вот замес!
На фоне новостей о китайских учениях вокруг Тайваня давайте расскажу в чем суть дела.
TSMC (Тайвань) - безусловный лидер в производстве самых передовых чипов для AI. На их можностях работают Nvidia и AMD. Крупные фабрики есть еще у Intel и Samsung. Фактически все кто хотят производить крутые чипы идут в TSMC.
У TSMC есть запрет на производство для Китая топовых чипов, так как они используют технологии США.
Все производители чипов живут на оборудовании одной компании - нидерландская компания ASML. Она делает топовые станки для литографии, позволяющие делать чипы на 7nm и 5nm. Больше никто в мире не умеет, совсем.
Компания ASML может продавать станки только с разрешения голландского правительства. Которое это разрешение Китаю не дает (как и России, кстати).
То есть, для Китая:
- станки для производства закупать не дают;
- заказать производство не дают;
- покупать Nvidia тоже толком не дают;
- все эти заводы и станки находятся в Тайване который прямо рядом с Китаем и который они считают своей территорией.
И примерно все топовые чипы Nvidia производятся на этом же клочке земли.
Такой вот замес!
😱31🔥14❤3💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот это прикольная тема. Автопилот Baidu видит участников движения не только своими глазами, но и глазами дорожных камер.
В Китае есть государственная система обмена информацией в которую можно воткнуться если ты делаешь self-driving. И это позволяет видеть в том числе участников движения вне зоны видимости. На видео - желтым цветом.
Они вместе с правительством двигаются к роевому управлению флотом. Это когда автопилоты знают друг про друга и управляются совместно. Если при этом убрать живых водителей, можно разогнать машины по скорости и при этом сделать движение безопасней.
В Китае есть государственная система обмена информацией в которую можно воткнуться если ты делаешь self-driving. И это позволяет видеть в том числе участников движения вне зоны видимости. На видео - желтым цветом.
Они вместе с правительством двигаются к роевому управлению флотом. Это когда автопилоты знают друг про друга и управляются совместно. Если при этом убрать живых водителей, можно разогнать машины по скорости и при этом сделать движение безопасней.
❤🔥51👍19🔥8❤2
Не люди ищут товар, а товар ищет людей
Пропитываемся мудростью от ByteDance - создателей TikTok. Их ключевое стратегическое убеждение такое: раньше люди искали контент, а теперь контент ищет людей.
Раньше люди читали новости сами и искали информацию в интернете. А теперь всё наоборот: люди смотрят в тик-ток или другую трубу получения информации, а уже сервис сам подбирает информацию которая человеку нужна.
Они уже сделали это с контентом в TikTok и активно делают с товарами. Сегодня тик-ток это еще и крупная e-commerce площадка.
Кстати, tiktok в Китае это 700 млн dau 😅
Пропитываемся мудростью от ByteDance - создателей TikTok. Их ключевое стратегическое убеждение такое: раньше люди искали контент, а теперь контент ищет людей.
Раньше люди читали новости сами и искали информацию в интернете. А теперь всё наоборот: люди смотрят в тик-ток или другую трубу получения информации, а уже сервис сам подбирает информацию которая человеку нужна.
Они уже сделали это с контентом в TikTok и активно делают с товарами. Сегодня тик-ток это еще и крупная e-commerce площадка.
Кстати, tiktok в Китае это 700 млн dau 😅
🤔18👍8🔥6❤5🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Каждая уважающая себя тех компания в Китае делает свой копайлот интерфейс похожий на UI ChatGPT. И непременно на своих моделях.
Причем не очень важно комплиментарно ли это их бизнесу ) Baidu, Alibaba, Tencent - все они.
Как я понял из разговоров, это такое доказательство что они действительно делают AI.
Причем не очень важно комплиментарно ли это их бизнесу ) Baidu, Alibaba, Tencent - все они.
Как я понял из разговоров, это такое доказательство что они действительно делают AI.
🤔17🔥6😁6❤🔥1
Skyscanner, TripAdvisor и другие компании с картинки это на самом деле китайский trip.com - один из самых крупных международных travel-игроков.
Они инвестируют $400 млн в год на искусственный интеллект. При этом ассистент у них в приложениях косячит на глазах и вклада в бизнес не делает.
На поддержке, правда, 70%+ запросов они оптимизируют. Это как будто стандарт индустрии - 70% оптимизация поддержки за счет AI.
Они инвестируют $400 млн в год на искусственный интеллект. При этом ассистент у них в приложениях косячит на глазах и вклада в бизнес не делает.
На поддержке, правда, 70%+ запросов они оптимизируют. Это как будто стандарт индустрии - 70% оптимизация поддержки за счет AI.
❤🔥18
This media is not supported in your browser
VIEW IN TELEGRAM
Прямо в навигаторе подсвечено сколько секунд до зеленого на светофоре. Будущее!
Это все та же государственная система обмена дорожной информации, к которой подключены все навигаторы.
Это все та же государственная система обмена дорожной информации, к которой подключены все навигаторы.
❤🔥70💅13
This media is not supported in your browser
VIEW IN TELEGRAM
Высокоскоростные поезда в Китае едут с сильным креном на поворотах чтобы держать скорость на повороте.
На видосе смотрите на горизонт, постарался его держать ровно. А поезд под углом.
Ощущения как на американских горках!
На видосе смотрите на горизонт, постарался его держать ровно. А поезд под углом.
Ощущения как на американских горках!
❤🔥40💅10
90% качество AI продуктов
ML основан на статистике и вероятностях - значит, в фундаменте заложена вероятность ошибки.
Ваш ассистент подумает что шенжень это женьшень и отправит человека на Алтай, ваша камера будет видеть в котенке qr-код, ваша Алиса будет реагировать на подлизу.
Вам нужна метрика качества. Хотя бы такая простая: какой процент реальных задач пользователей вы обрабатываете правильно. Без прибора качества развивать AI продукт не получится, можно только демку собрать.
В среднем люди считают что продукт работает «надежно» или «хорошо» если он имеет качество 90%+. Это может казаться как «много» но на самом деле это буквально «ошибся каждый десятый раз».
Обычно AI-метрик качества несколько и строить их довольно сложно.
Работа над AI продуктом это прежде всего правильное построение метрик качества и потом работа над получением заветных 90+. Вот здесь вам и нужны лучшие инженеры и лучшие умеющие работать с этим продакты.
ML основан на статистике и вероятностях - значит, в фундаменте заложена вероятность ошибки.
Ваш ассистент подумает что шенжень это женьшень и отправит человека на Алтай, ваша камера будет видеть в котенке qr-код, ваша Алиса будет реагировать на подлизу.
Вам нужна метрика качества. Хотя бы такая простая: какой процент реальных задач пользователей вы обрабатываете правильно. Без прибора качества развивать AI продукт не получится, можно только демку собрать.
В среднем люди считают что продукт работает «надежно» или «хорошо» если он имеет качество 90%+. Это может казаться как «много» но на самом деле это буквально «ошибся каждый десятый раз».
Обычно AI-метрик качества несколько и строить их довольно сложно.
Работа над AI продуктом это прежде всего правильное построение метрик качества и потом работа над получением заветных 90+. Вот здесь вам и нужны лучшие инженеры и лучшие умеющие работать с этим продакты.
❤🔥25💅9
Как использовать o1 от OpenAI
o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ информации.
Давайте сразу на примере.
Допустим, мне понадобилось посмотреть на рынок FMCG в USA - доля онлайна и динамика, основные игроки, как всё вообще устроено.
Я на лету из головы пишу такой запрос:
И получаю вот такой потрясающий отчет - посмотрите!
Этот отчет отлично структурирован, данные как я просил в табличке, все ссылки на источники есть, всё отвалидировано. Я получил ответ за 32 секунды. Я бы ковырялся 3 часа чтобы собрать все эти выводы.
Модель пока не умеет работать с вашими файлами, но полноценная o1 уже анонсирована, ждем. Тогда это станет x100 инструмент для исследовательско-консалтерской работы.
Используйте!
o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ информации.
Давайте сразу на примере.
Допустим, мне понадобилось посмотреть на рынок FMCG в USA - доля онлайна и динамика, основные игроки, как всё вообще устроено.
Я на лету из головы пишу такой запрос:
I need a research about online fmcg market in USA, actual for 2023.
- main online players and shares in GMV and orders if possible - in table format
- distinction of main players in terms of product prop, region and any other interesting details
- what ecosystem they are part of if any
- any other important details
- share of online market and dynamics in 10 yrs span
all data should be from reliable sources, check it plz. and make the report compact
И получаю вот такой потрясающий отчет - посмотрите!
Этот отчет отлично структурирован, данные как я просил в табличке, все ссылки на источники есть, всё отвалидировано. Я получил ответ за 32 секунды. Я бы ковырялся 3 часа чтобы собрать все эти выводы.
Модель пока не умеет работать с вашими файлами, но полноценная o1 уже анонсирована, ждем. Тогда это станет x100 инструмент для исследовательско-консалтерской работы.
Используйте!
❤🔥52💅7
[31/100] Витя Тарнавский
Как использовать o1 от OpenAI o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ…
В комментах очень верно напомнили что результат надо проверять.
Моя практика такая:
- если просить o1 проверять информацию и не выдумывать то по опыту ошибок почти нет
- помогает проверить пару чисел по источнику
В целом все как с живым консультантом, только быстро работает. Как по мне так получается предсказуемей и управляемый чем люди.
И напомню что все текущие решения это копилот а не замена человеку.
Моя практика такая:
- если просить o1 проверять информацию и не выдумывать то по опыту ошибок почти нет
- помогает проверить пару чисел по источнику
В целом все как с живым консультантом, только быстро работает. Как по мне так получается предсказуемей и управляемый чем люди.
И напомню что все текущие решения это копилот а не замена человеку.
💅13❤🔥5
[31/100] Витя Тарнавский
Как использовать o1 от OpenAI o1-preview это недооцененная алмазная кирка про которую пока не знают финансисты и бизнес-люди. Модель нужно использовать в сложных задачах где нужно подумать. Это может быть исследование, написание стратегии, сложный анализ…
Мои любимцы Perplexity не отстают и недавно запустили advanced pro search в котором тоже есть multi-step reasoning как они его сами называют.
В духе Perplexity в ответе есть все источники (легко всё проверить). Правда, на этом запросе потеряли один важный источник.
Кто-нибудь знает бенч или арену где можно сравнивать результаты на подобных сложных кейсах?
В духе Perplexity в ответе есть все источники (легко всё проверить). Правда, на этом запросе потеряли один важный источник.
Кто-нибудь знает бенч или арену где можно сравнивать результаты на подобных сложных кейсах?
❤🔥20💅7
Недавно CPO Лавки Никита Толстой (🫂 hugs bro) запустил агрегатор для телеграм каналов за несколько часов в обнимку с ChatGPT. Код Никита в жизни в целом писал, что важно.
На этом примере хочу донести простую мысль, которую подсмотрел в Y Combinator подкасте про replit.
Способность программировать с развитием технологий открывает всё больше возможностей.
- 20 лет назад опытный разработчик мог написать за пару часов сортировку. Вроде полезно, но не очень.
- 10 лет назад средний разработчик собирал за несколько часов небольшой сайт, если имел в этом опыт. Уже сильно больше пользы для общества.
- Сегодня Никита Толстой может собрать интеллектуальный законченный продукт без знаний конкретных библиотек и подходов и вообще с другой работы.
Завтра - больше.
Да, немного про no-code. Возможно, когда-нибудь и придет фаза победившего low-code/no-code, но пока что практика скорее обратная. Самые классные платформы ускоренной разработки основаны на генерации кода и возможности с ним работать, а не на blackbox кубиках.
Учитесь программировать.
На этом примере хочу донести простую мысль, которую подсмотрел в Y Combinator подкасте про replit.
Способность программировать с развитием технологий открывает всё больше возможностей.
- 20 лет назад опытный разработчик мог написать за пару часов сортировку. Вроде полезно, но не очень.
- 10 лет назад средний разработчик собирал за несколько часов небольшой сайт, если имел в этом опыт. Уже сильно больше пользы для общества.
- Сегодня Никита Толстой может собрать интеллектуальный законченный продукт без знаний конкретных библиотек и подходов и вообще с другой работы.
Завтра - больше.
Да, немного про no-code. Возможно, когда-нибудь и придет фаза победившего low-code/no-code, но пока что практика скорее обратная. Самые классные платформы ускоренной разработки основаны на генерации кода и возможности с ним работать, а не на blackbox кубиках.
Учитесь программировать.
❤🔥40🤔5
Gigachat MAX / YandexGPT 4.0
Вчера два наших технологических лидера представили новые версии своих моделей. Да, день в день 🤔
Gigachat MAX — 32k контекста, серьезный прогресс по MERA
YandexGPT 4.0 — 32k контекста, "близки к gpt-4o"
Сравнить довольно сложно. Сравниваются компании по своим бенчмаркам, прямого сравнения как будто избегают, третьих площадок для сравнения скорее нет. Даже перевод mmlu у двух компаний разный.
По относительным позициям в бенчах мой вывод такой: модели довольно похожи и находятся на уровне "несколько лучше llama 3.1 70b" и "значимо ниже gpt-4o". Собственно, это их два основных конкурента на нашем рынке.
Долгосрочно, мерило — это рынок. Бенчмарки хороши для первичной оценки, но на практике всё может быть иначе. Это как разработчиков сравнивать по их характеристикам.
Радуюсь за ребят - оба релиза выглядят крутыми, особенно на фоне дикого отставания в железе.
Вчера два наших технологических лидера представили новые версии своих моделей. Да, день в день 🤔
Gigachat MAX — 32k контекста, серьезный прогресс по MERA
YandexGPT 4.0 — 32k контекста, "близки к gpt-4o"
Сравнить довольно сложно. Сравниваются компании по своим бенчмаркам, прямого сравнения как будто избегают, третьих площадок для сравнения скорее нет. Даже перевод mmlu у двух компаний разный.
По относительным позициям в бенчах мой вывод такой: модели довольно похожи и находятся на уровне "несколько лучше llama 3.1 70b" и "значимо ниже gpt-4o". Собственно, это их два основных конкурента на нашем рынке.
Долгосрочно, мерило — это рынок. Бенчмарки хороши для первичной оценки, но на практике всё может быть иначе. Это как разработчиков сравнивать по их характеристикам.
Радуюсь за ребят - оба релиза выглядят крутыми, особенно на фоне дикого отставания в железе.
❤🔥39💅16