Предлагаю решить ее двумя способами:
- Самим, написав код по старинке.
- С помощью любой LLM-ки
Бонусом можно еще через PandasAI решить - это такой LLM агент с Pandas знаниями под капотом. Вот хороший гугл колаб с примерами кода.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥10👎1
Оказывается, я знал не все! Видимо упустил, потому вот вам видео для повторения на 20 минут.
Ссылка
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Изучите 47 строковых методов + 3 супер секретных, о которых вы не слышали🤫
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
🔥17👎6👍4 4❤3
🏆 Data Feeling | AI
Круто! Чекнул некоторые решения их поста выше, многие реально шарят за Pandas )
Вот вам решение от PandasAI:
Статью про PandasAI можно глянуть на хабре или в гугл колабе .
Вот вам решение от PandasAI:
df = (df
.sort_values(by='score', ascending=False)
.groupby('book')
.head(3)
.groupby('book')['page']
.apply(list)
.reset_index()
)
Статью про PandasAI можно глянуть на хабре или в гугл колабе .
Хабр
PandasAI — кратно ускоряем работу аналитика данных в одну строчку
Привет, чемпион! За прошедший год появилось много полезных AI инструментов для упрощения работы разработчиков, аналитиков данных и даже дизайнеров: Copilot допишет за тебя код, EverSQL оптимизирует...
❤29🔥11👍1👎1😁1
Смотрите, как Спикадора сейчас затащит каточку…
Я прям кайфую, когда так четко отрабатывает. И так почти в 99% случаев
Нативное изучение языка) А еще она идеально решает задания из экзаменов по английскому, но хорошо, что школьники про это не знают)
Я прям кайфую, когда так четко отрабатывает. И так почти в 99% случаев
👍10❤7👎3
Вы знаете, что моя работа напрямую связана с умением конвертировать данные в доп доход. Мне за это платят.
А еще, вы знаете, что утечка персональных данных является крайне нежелательным событием. Хотя утекают часто.
🧠 Кейс на подумать.
Вот если вам все-таки достались перс данные. Что вы будите с ними делать? Сможете хотя бы копеечку с этого поиметь?) А миллион? уверены что, да?!
Допустим вам достался 1М строк всевозможных персональный данных людей из одного города
(ФИО, ДР, ГОРОД, НОМЕРА, ПОЧТА, деятельность, привязанные номера документов и прочая мета инфа)
Ограничение:
- перепродажа запрещена
- спам и обзвоны запрещены
- скам запрещен
Сможете ли для себя придумать хотя бы 3+ рабочих способа, как вы смогли вытащить из этого для себя пользу? Подумайте!
Полезное и сложное упражнение для дата-спецов.
Картинка меня в любимом худи как заглужка для картинки)
А еще, вы знаете, что утечка персональных данных является крайне нежелательным событием. Хотя утекают часто.
Вот если вам все-таки достались перс данные. Что вы будите с ними делать? Сможете хотя бы копеечку с этого поиметь?) А миллион? уверены что, да?!
Допустим вам достался 1М строк всевозможных персональный данных людей из одного города
(ФИО, ДР, ГОРОД, НОМЕРА, ПОЧТА, деятельность, привязанные номера документов и прочая мета инфа)
Ограничение:
- перепродажа запрещена
- спам и обзвоны запрещены
- скам запрещен
Сможете ли для себя придумать хотя бы 3+ рабочих способа, как вы смогли вытащить из этого для себя пользу? Подумайте!
Полезное и сложное упражнение для дата-спецов.
Картинка меня в любимом худи как заглужка для картинки)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👎9❤8👍6🏆3🥰1
Media is too big
VIEW IN TELEGRAM
Voice2Order в Dodo Pizza
🍕 Еще год назад придумали с командой фичу - быстрый голосовой заказ. В приложение не добавили т.к кастдев показал себя не очень. И только сейчас дошли руки поднять качество и найти, где применить. Оказалось удобным для заказа через телеграм. Приложил пример работы, собранный на коленке для коллег.
🍔 Говорят, Макдоналдс закрыл эту опцию спустя год т.к Voice2Order у них отрабатывал некачественно. Вместо «трех чизбургеров» выдавал «72 картошки» 🫠
Скажу, что похожие фичи требуют определенной сноровки в реализации. Есть как минимум 3 тонких момента:
- Качественный few-shot и ранжирование
- Правильное переиспользование контекста
- Максимальное отсутствие галлюцинаций и умная реакция на них
#dodo #pizza #ai
🍕 Еще год назад придумали с командой фичу - быстрый голосовой заказ. В приложение не добавили т.к кастдев показал себя не очень. И только сейчас дошли руки поднять качество и найти, где применить. Оказалось удобным для заказа через телеграм. Приложил пример работы, собранный на коленке для коллег.
🍔 Говорят, Макдоналдс закрыл эту опцию спустя год т.к Voice2Order у них отрабатывал некачественно. Вместо «трех чизбургеров» выдавал «72 картошки» 🫠
Скажу, что похожие фичи требуют определенной сноровки в реализации. Есть как минимум 3 тонких момента:
- Качественный few-shot и ранжирование
- Правильное переиспользование контекста
- Максимальное отсутствие галлюцинаций и умная реакция на них
#dodo #pizza #ai
🔥49👍10👎3❤1😁1
Второй год запускаю соревновательный ML бут кемп. В этом году на кегле летом много посильных сорев. Рекомендую участвовать пока идет лето и есть свободное время 😉
К чему можно присмотреться?
- LMSYS - по сути текстовые таблички
- ISIC - бинарная классификация на картинках
К чему можно присмотреться?
- LMSYS - по сути текстовые таблички
- ISIC - бинарная классификация на картинках
👍23👎3❤2
Forwarded from 🏄 Соревновательный Data Science | Kaggle | Чемпионаты
This media is not supported in your browser
VIEW IN TELEGRAM
❤18🔥9👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Шестеренки, детали, запчасти и различные конструкции — ИИ спроектирует почти что угодно. Готовые файлы можно скачать и импортировать в любой софт.
Пользуемся здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥46👍5👎2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый феймворк Congnita для RAG систем
🤔 Системы RAG (Поисковая дополненная генерация) — это мощные инструменты, но их создание и развертывание может оказаться сложной задачей.
🚀 Cognita стремится стать удобным и модульным решением, решающим общие проблемы RAG.
Проблемы с текущими фреймворками:
⚙️ Задания по фрагментированию и внедрению часто требуют отдельной настройки, но не встроены в существующие платформы, известные мне на данный момент.
💻 Развертывание сервисов запросов для производства может оказаться сложной задачей.
🤖 Для управления развертыванием моделей (языковых моделей, моделей внедрения) отсутствует встроенная поддержка.
🗄 Векторные базы данных могут оказаться сложными для масштабирования.
Нет единого готового шаблона, который можно было бы легко адаптировать.
Как Cognita решает эти проблемы
🎯 Cognita сочетает в себе настройку и простоту использования.
🧠 Масштабируемый дизайн для интеграции прорывных решений по мере их возникновения.
Cognita — библиотека для создания модульных приложений RAG с открытым исходным кодом для производства.
Модульная конструкция: разбейте RAG на этапы для упрощения управления и обновлений.
♻️ Многоразовые компоненты: парсеры, загрузчики и т. д. для экономии времени в проектах.
🚀 Оптимизированное развертывание: Cognita справляется со всеми тонкостями производственных систем.
⚖️ Масштабируемость: компоненты масштабируются независимо, чтобы справиться с возросшим трафиком.
✨ Удобный интерфейс: даже нетехнические пользователи могут играть с настройками RAG.
🔌 На основе API: Cognita хорошо работает с другими системами.
Компоненты Когниты
Индексирование задания
1) Загрузчики данных 🚚
Что: Извлекать данные из разных мест (папок, баз данных и т. д.).
Почему: RAG нуждается в данных для работы!
2) Парсеры 🗂️
Что: Преобразовать различные типы файлов в общий формат.
Почему: упрощает обработку всей информации системой RAG.
3) Эмбеддеры 🔎
Что: создавать кодовые представления текста для быстрого сравнения.
Зачем: помогает найти наиболее актуальную информацию по вашему вопросу.
Хранилище метаданных 🧠
Что: «мозг» системы, хранящий детали конфигурации.
Зачем: сохраняет вашу RAG организованной и простой в управлении.
LLM Gateway 💬
Что: «Переводчик» для разных языковых моделей.
Почему: позволяет переключаться между моделями, не перекодируя все.
Векторные БД 🗄️
Что: хранит встроенные файлы для сверхбыстрого поиска данных.
Почему: Эффективный поиск имеет решающее значение для больших наборов данных.
API-сервер ⚙️
Что: Координатор, который обрабатывает вопросы пользователей и генерирует ответы.
Почему: Он соединяет все части системы RAG вместе.
🤔 Системы RAG (Поисковая дополненная генерация) — это мощные инструменты, но их создание и развертывание может оказаться сложной задачей.
🚀 Cognita стремится стать удобным и модульным решением, решающим общие проблемы RAG.
Проблемы с текущими фреймворками:
⚙️ Задания по фрагментированию и внедрению часто требуют отдельной настройки, но не встроены в существующие платформы, известные мне на данный момент.
💻 Развертывание сервисов запросов для производства может оказаться сложной задачей.
🤖 Для управления развертыванием моделей (языковых моделей, моделей внедрения) отсутствует встроенная поддержка.
🗄 Векторные базы данных могут оказаться сложными для масштабирования.
Нет единого готового шаблона, который можно было бы легко адаптировать.
Как Cognita решает эти проблемы
🎯 Cognita сочетает в себе настройку и простоту использования.
🧠 Масштабируемый дизайн для интеграции прорывных решений по мере их возникновения.
Cognita — библиотека для создания модульных приложений RAG с открытым исходным кодом для производства.
Модульная конструкция: разбейте RAG на этапы для упрощения управления и обновлений.
♻️ Многоразовые компоненты: парсеры, загрузчики и т. д. для экономии времени в проектах.
🚀 Оптимизированное развертывание: Cognita справляется со всеми тонкостями производственных систем.
⚖️ Масштабируемость: компоненты масштабируются независимо, чтобы справиться с возросшим трафиком.
✨ Удобный интерфейс: даже нетехнические пользователи могут играть с настройками RAG.
🔌 На основе API: Cognita хорошо работает с другими системами.
Компоненты Когниты
Индексирование задания
1) Загрузчики данных 🚚
Что: Извлекать данные из разных мест (папок, баз данных и т. д.).
Почему: RAG нуждается в данных для работы!
2) Парсеры 🗂️
Что: Преобразовать различные типы файлов в общий формат.
Почему: упрощает обработку всей информации системой RAG.
3) Эмбеддеры 🔎
Что: создавать кодовые представления текста для быстрого сравнения.
Зачем: помогает найти наиболее актуальную информацию по вашему вопросу.
Хранилище метаданных 🧠
Что: «мозг» системы, хранящий детали конфигурации.
Зачем: сохраняет вашу RAG организованной и простой в управлении.
LLM Gateway 💬
Что: «Переводчик» для разных языковых моделей.
Почему: позволяет переключаться между моделями, не перекодируя все.
Векторные БД 🗄️
Что: хранит встроенные файлы для сверхбыстрого поиска данных.
Почему: Эффективный поиск имеет решающее значение для больших наборов данных.
API-сервер ⚙️
Что: Координатор, который обрабатывает вопросы пользователей и генерирует ответы.
Почему: Он соединяет все части системы RAG вместе.
❤17🔥8👍3👎1
OpenAI планирует выпускать свои чипы.
Альтман ведёт переговоры с американским полупроводниковым гигантом Broadcom. На данный момент Nvidia производит 80% чипов, на которых произошла нейрореволюция и развитие ИИ.
Проблема в том, что Хуанг почти монополист и контролирует рынок, задавая на нем дефицит и диктуя цены. Альтман в коллабе с Broadcom хочет положить конец этой диктатуре...
За 9 месяцев Open AI схантили большое количество народу из Google, которые занимались в бигтехе разработкой чипов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍9 5👎1
Опа!
Дуров открыл российским телеграм-каналам монетизацию. Вот же красавчик!
Найти её можно в разделе «Статистика» — если у вас такой вкладки нет, обновите приложение. Выводить прибыть с рекламы можно во внутренней валюте ⭐️.
Монетизация доступна каналам от 1к подписчиков 👀 Прям жутко интересно стало, как это все будет
Дуров открыл российским телеграм-каналам монетизацию. Вот же красавчик!
Найти её можно в разделе «Статистика» — если у вас такой вкладки нет, обновите приложение. Выводить прибыть с рекламы можно во внутренней валюте ⭐️.
Монетизация доступна каналам от 1к подписчиков 👀 Прям жутко интересно стало, как это все будет
🔥40👍19👎6🏆4
Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite
Статья уже на Хабре
Моделька бьет третью ламу (Llama3-8b-instruct). Чекайте
Ссылка на HuggingFace 🤗
Статья уже на Хабре
Моделька бьет третью ламу (Llama3-8b-instruct). Чекайте
Ссылка на HuggingFace 🤗
Хабр
Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite
Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель...
🔥43👍12😁6 4❤3👎1
🏆 Data Feeling | AI
Ребята, написал вторую часть! От неё еще больше людей скажет: «да ну не, этот миллион снова не считается. Вот если бы тебе с неба лям капнул бы на карточку просто так, тогда бы да …», но история все равно топ Давайте добьем бустами до уровня 9, чтоб я обои…
«4 моих первый миллиона, которые чуть не свели меня с ума»
Продолжаю серию рассказов. Как обещал, добавил сразу вторую и третью части. Истории для вдохновения. Постарался написать интересно. Все по порядку:
🍋 Часть 1 - Мой самый первый миллион
🍋 Часть 2 - Теряем работу в обмен на рост.
🍋 Часть 3 - Миллион на инвестициях
А если мы все-таки добьем бустами до 9-го уровня, и я смогу поменять обои на канале на свой любимый ламповый фиолетовый цвет, то сразу выпущу последние две части. Они отражают меня актуального.
🍋 Часть 4 - закапываем, кредитуемся и снова взлетаем 🛫
🍋 Часть 5 - цель в 100М выручки или почему я не ушел с работы
Кидайте https://news.1rj.ru/str/datafeeling?boost если интересно узнать продолжение💪
Продолжаю серию рассказов. Как обещал, добавил сразу вторую и третью части. Истории для вдохновения. Постарался написать интересно. Все по порядку:
А если мы все-таки добьем бустами до 9-го уровня, и я смогу поменять обои на канале на свой любимый ламповый фиолетовый цвет, то сразу выпущу последние две части. Они отражают меня актуального.
🍋 Часть 5 - цель в 100М выручки или почему я не ушел с работы
Кидайте https://news.1rj.ru/str/datafeeling?boost если интересно узнать продолжение
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Мой первый миллион
Сейчас будет красивый и понятный кейс, который я рассказываю, чтоб вдохновит молодых предпринимателей и доказать, что навык программирования, окупает себя в один удачный проект Контекст: Мне 19. Я заканчиваю второй курс Физтеха. Период перед сессией. Так…
❤34🏆10🔥4⚡2👎2👍1🦄1 1
🦙 Опубликована мощнейшая опенсорс модель Llama-3
Статья уже на Хабре
🔥Судя по бенчмаркам, Llama 3.1 даже лучше GPT-4o (!)
Ссылка на HuggingFace
Статья уже на Хабре
🔥Судя по бенчмаркам, Llama 3.1 даже лучше GPT-4o (!)
Ссылка на HuggingFace
👍19🔥6❤4
🏆 Data Feeling | AI
Фейлы Спикадоры или как я занимался благотворительностью
Основная работа забрала мой фокус, поэтому мы немного забросили интенсивную разработку.
Пока тушил пожары на работе и продолжал фиксировать убытки, Спикадора почти два месяца не принимала оплату и разговаривала с пользователям без ограничений. Вот умничка! 😭
🥲 Мы это заметили и починили. Попросил Спикадорушку больше так не делать. Платежи начали медленно капать.
😐 Потом заметили, что платежи подключены только карточные. Включили все варианты. Типо SberPay/T-Pay и тп. Оплаты резко выросли .
🙂 Далее мы заметили, что не списываем повторные платежи. Починили и тоже немного вернули платежей.
😃 Тут же дошли руки подрубить скидки за покупку подписки в первый день. И это тоже добавило платежей.
И так, реклама внезапно начала окупаться. Вот же магия 🙌
Основная работа забрала мой фокус, поэтому мы немного забросили интенсивную разработку.
Пока тушил пожары на работе и продолжал фиксировать убытки, Спикадора почти два месяца не принимала оплату и разговаривала с пользователям без ограничений. Вот умничка! 😭
🥲 Мы это заметили и починили. Попросил Спикадорушку больше так не делать. Платежи начали медленно капать.
😐 Потом заметили, что платежи подключены только карточные. Включили все варианты. Типо SberPay/T-Pay и тп. Оплаты резко выросли .
🙂 Далее мы заметили, что не списываем повторные платежи. Починили и тоже немного вернули платежей.
😃 Тут же дошли руки подрубить скидки за покупку подписки в первый день. И это тоже добавило платежей.
И так, реклама внезапно начала окупаться. Вот же магия 🙌
🔥22👍6😁6❤3👎3🥰1
Пока мы тут с вами делаем IT продукты, пишем код, кто-то делает бизнес на промптах. Чисто по приколу выкупил сборник из 165 промптов для генерации маркетинговых текстов.
Стоило 35$ 😎
Есть неочевидные 😳
Например для генерации текстовых хуков к видео.
Давайте обмен? 10 бустов и я скинул этот pdf файл сюда
https://news.1rj.ru/str/datafeeling?boost
Стоило 35$ 😎
Есть неочевидные 😳
Например для генерации текстовых хуков к видео.
Давайте обмен? 10 бустов и я скинул этот pdf файл сюда
https://news.1rj.ru/str/datafeeling?boost
Telegram
🏆 Data Feeling | AI
Проголосуйте за канал, чтобы он получил больше возможностей.
👍31👎12❤7⚡5🔥5
🏆 Data Feeling | AI
Пока мы тут с вами делаем IT продукты, пишем код, кто-то делает бизнес на промптах. Чисто по приколу выкупил сборник из 165 промптов для генерации маркетинговых текстов. Стоило 35$ 😎 Есть неочевидные 😳 Например для генерации текстовых хуков к видео. Давайте…
165prompts_AI_engineering.pdf
426.5 KB
Красавцы! Теперь в этом канале стало уютнее)
🚀 Вы мне бусты, а я вам гайд по маркетинговым промптам 📝
Пользуйтесь!
🚀 Вы мне бусты, а я вам гайд по маркетинговым промптам 📝
Пользуйтесь!
❤38😁8👍5