🏆 Data Feeling | AI
Круто! Чекнул некоторые решения их поста выше, многие реально шарят за Pandas )
Вот вам решение от PandasAI:
Статью про PandasAI можно глянуть на хабре или в гугл колабе .
Вот вам решение от PandasAI:
df = (df
.sort_values(by='score', ascending=False)
.groupby('book')
.head(3)
.groupby('book')['page']
.apply(list)
.reset_index()
)
Статью про PandasAI можно глянуть на хабре или в гугл колабе .
Хабр
PandasAI — кратно ускоряем работу аналитика данных в одну строчку
Привет, чемпион! За прошедший год появилось много полезных AI инструментов для упрощения работы разработчиков, аналитиков данных и даже дизайнеров: Copilot допишет за тебя код, EverSQL оптимизирует...
❤29🔥11👍1👎1😁1
Смотрите, как Спикадора сейчас затащит каточку…
Я прям кайфую, когда так четко отрабатывает. И так почти в 99% случаев
Нативное изучение языка) А еще она идеально решает задания из экзаменов по английскому, но хорошо, что школьники про это не знают)
Я прям кайфую, когда так четко отрабатывает. И так почти в 99% случаев
👍10❤7👎3
Вы знаете, что моя работа напрямую связана с умением конвертировать данные в доп доход. Мне за это платят.
А еще, вы знаете, что утечка персональных данных является крайне нежелательным событием. Хотя утекают часто.
🧠 Кейс на подумать.
Вот если вам все-таки достались перс данные. Что вы будите с ними делать? Сможете хотя бы копеечку с этого поиметь?) А миллион? уверены что, да?!
Допустим вам достался 1М строк всевозможных персональный данных людей из одного города
(ФИО, ДР, ГОРОД, НОМЕРА, ПОЧТА, деятельность, привязанные номера документов и прочая мета инфа)
Ограничение:
- перепродажа запрещена
- спам и обзвоны запрещены
- скам запрещен
Сможете ли для себя придумать хотя бы 3+ рабочих способа, как вы смогли вытащить из этого для себя пользу? Подумайте!
Полезное и сложное упражнение для дата-спецов.
Картинка меня в любимом худи как заглужка для картинки)
А еще, вы знаете, что утечка персональных данных является крайне нежелательным событием. Хотя утекают часто.
Вот если вам все-таки достались перс данные. Что вы будите с ними делать? Сможете хотя бы копеечку с этого поиметь?) А миллион? уверены что, да?!
Допустим вам достался 1М строк всевозможных персональный данных людей из одного города
(ФИО, ДР, ГОРОД, НОМЕРА, ПОЧТА, деятельность, привязанные номера документов и прочая мета инфа)
Ограничение:
- перепродажа запрещена
- спам и обзвоны запрещены
- скам запрещен
Сможете ли для себя придумать хотя бы 3+ рабочих способа, как вы смогли вытащить из этого для себя пользу? Подумайте!
Полезное и сложное упражнение для дата-спецов.
Картинка меня в любимом худи как заглужка для картинки)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👎9❤8👍6🏆3🥰1
Media is too big
VIEW IN TELEGRAM
Voice2Order в Dodo Pizza
🍕 Еще год назад придумали с командой фичу - быстрый голосовой заказ. В приложение не добавили т.к кастдев показал себя не очень. И только сейчас дошли руки поднять качество и найти, где применить. Оказалось удобным для заказа через телеграм. Приложил пример работы, собранный на коленке для коллег.
🍔 Говорят, Макдоналдс закрыл эту опцию спустя год т.к Voice2Order у них отрабатывал некачественно. Вместо «трех чизбургеров» выдавал «72 картошки» 🫠
Скажу, что похожие фичи требуют определенной сноровки в реализации. Есть как минимум 3 тонких момента:
- Качественный few-shot и ранжирование
- Правильное переиспользование контекста
- Максимальное отсутствие галлюцинаций и умная реакция на них
#dodo #pizza #ai
🍕 Еще год назад придумали с командой фичу - быстрый голосовой заказ. В приложение не добавили т.к кастдев показал себя не очень. И только сейчас дошли руки поднять качество и найти, где применить. Оказалось удобным для заказа через телеграм. Приложил пример работы, собранный на коленке для коллег.
🍔 Говорят, Макдоналдс закрыл эту опцию спустя год т.к Voice2Order у них отрабатывал некачественно. Вместо «трех чизбургеров» выдавал «72 картошки» 🫠
Скажу, что похожие фичи требуют определенной сноровки в реализации. Есть как минимум 3 тонких момента:
- Качественный few-shot и ранжирование
- Правильное переиспользование контекста
- Максимальное отсутствие галлюцинаций и умная реакция на них
#dodo #pizza #ai
🔥49👍10👎3❤1😁1
Второй год запускаю соревновательный ML бут кемп. В этом году на кегле летом много посильных сорев. Рекомендую участвовать пока идет лето и есть свободное время 😉
К чему можно присмотреться?
- LMSYS - по сути текстовые таблички
- ISIC - бинарная классификация на картинках
К чему можно присмотреться?
- LMSYS - по сути текстовые таблички
- ISIC - бинарная классификация на картинках
👍23👎3❤2
Forwarded from 🏄 Соревновательный Data Science | Kaggle | Чемпионаты
This media is not supported in your browser
VIEW IN TELEGRAM
❤18🔥9👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Шестеренки, детали, запчасти и различные конструкции — ИИ спроектирует почти что угодно. Готовые файлы можно скачать и импортировать в любой софт.
Пользуемся здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥46👍5👎2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый феймворк Congnita для RAG систем
🤔 Системы RAG (Поисковая дополненная генерация) — это мощные инструменты, но их создание и развертывание может оказаться сложной задачей.
🚀 Cognita стремится стать удобным и модульным решением, решающим общие проблемы RAG.
Проблемы с текущими фреймворками:
⚙️ Задания по фрагментированию и внедрению часто требуют отдельной настройки, но не встроены в существующие платформы, известные мне на данный момент.
💻 Развертывание сервисов запросов для производства может оказаться сложной задачей.
🤖 Для управления развертыванием моделей (языковых моделей, моделей внедрения) отсутствует встроенная поддержка.
🗄 Векторные базы данных могут оказаться сложными для масштабирования.
Нет единого готового шаблона, который можно было бы легко адаптировать.
Как Cognita решает эти проблемы
🎯 Cognita сочетает в себе настройку и простоту использования.
🧠 Масштабируемый дизайн для интеграции прорывных решений по мере их возникновения.
Cognita — библиотека для создания модульных приложений RAG с открытым исходным кодом для производства.
Модульная конструкция: разбейте RAG на этапы для упрощения управления и обновлений.
♻️ Многоразовые компоненты: парсеры, загрузчики и т. д. для экономии времени в проектах.
🚀 Оптимизированное развертывание: Cognita справляется со всеми тонкостями производственных систем.
⚖️ Масштабируемость: компоненты масштабируются независимо, чтобы справиться с возросшим трафиком.
✨ Удобный интерфейс: даже нетехнические пользователи могут играть с настройками RAG.
🔌 На основе API: Cognita хорошо работает с другими системами.
Компоненты Когниты
Индексирование задания
1) Загрузчики данных 🚚
Что: Извлекать данные из разных мест (папок, баз данных и т. д.).
Почему: RAG нуждается в данных для работы!
2) Парсеры 🗂️
Что: Преобразовать различные типы файлов в общий формат.
Почему: упрощает обработку всей информации системой RAG.
3) Эмбеддеры 🔎
Что: создавать кодовые представления текста для быстрого сравнения.
Зачем: помогает найти наиболее актуальную информацию по вашему вопросу.
Хранилище метаданных 🧠
Что: «мозг» системы, хранящий детали конфигурации.
Зачем: сохраняет вашу RAG организованной и простой в управлении.
LLM Gateway 💬
Что: «Переводчик» для разных языковых моделей.
Почему: позволяет переключаться между моделями, не перекодируя все.
Векторные БД 🗄️
Что: хранит встроенные файлы для сверхбыстрого поиска данных.
Почему: Эффективный поиск имеет решающее значение для больших наборов данных.
API-сервер ⚙️
Что: Координатор, который обрабатывает вопросы пользователей и генерирует ответы.
Почему: Он соединяет все части системы RAG вместе.
🤔 Системы RAG (Поисковая дополненная генерация) — это мощные инструменты, но их создание и развертывание может оказаться сложной задачей.
🚀 Cognita стремится стать удобным и модульным решением, решающим общие проблемы RAG.
Проблемы с текущими фреймворками:
⚙️ Задания по фрагментированию и внедрению часто требуют отдельной настройки, но не встроены в существующие платформы, известные мне на данный момент.
💻 Развертывание сервисов запросов для производства может оказаться сложной задачей.
🤖 Для управления развертыванием моделей (языковых моделей, моделей внедрения) отсутствует встроенная поддержка.
🗄 Векторные базы данных могут оказаться сложными для масштабирования.
Нет единого готового шаблона, который можно было бы легко адаптировать.
Как Cognita решает эти проблемы
🎯 Cognita сочетает в себе настройку и простоту использования.
🧠 Масштабируемый дизайн для интеграции прорывных решений по мере их возникновения.
Cognita — библиотека для создания модульных приложений RAG с открытым исходным кодом для производства.
Модульная конструкция: разбейте RAG на этапы для упрощения управления и обновлений.
♻️ Многоразовые компоненты: парсеры, загрузчики и т. д. для экономии времени в проектах.
🚀 Оптимизированное развертывание: Cognita справляется со всеми тонкостями производственных систем.
⚖️ Масштабируемость: компоненты масштабируются независимо, чтобы справиться с возросшим трафиком.
✨ Удобный интерфейс: даже нетехнические пользователи могут играть с настройками RAG.
🔌 На основе API: Cognita хорошо работает с другими системами.
Компоненты Когниты
Индексирование задания
1) Загрузчики данных 🚚
Что: Извлекать данные из разных мест (папок, баз данных и т. д.).
Почему: RAG нуждается в данных для работы!
2) Парсеры 🗂️
Что: Преобразовать различные типы файлов в общий формат.
Почему: упрощает обработку всей информации системой RAG.
3) Эмбеддеры 🔎
Что: создавать кодовые представления текста для быстрого сравнения.
Зачем: помогает найти наиболее актуальную информацию по вашему вопросу.
Хранилище метаданных 🧠
Что: «мозг» системы, хранящий детали конфигурации.
Зачем: сохраняет вашу RAG организованной и простой в управлении.
LLM Gateway 💬
Что: «Переводчик» для разных языковых моделей.
Почему: позволяет переключаться между моделями, не перекодируя все.
Векторные БД 🗄️
Что: хранит встроенные файлы для сверхбыстрого поиска данных.
Почему: Эффективный поиск имеет решающее значение для больших наборов данных.
API-сервер ⚙️
Что: Координатор, который обрабатывает вопросы пользователей и генерирует ответы.
Почему: Он соединяет все части системы RAG вместе.
❤17🔥8👍3👎1
OpenAI планирует выпускать свои чипы.
Альтман ведёт переговоры с американским полупроводниковым гигантом Broadcom. На данный момент Nvidia производит 80% чипов, на которых произошла нейрореволюция и развитие ИИ.
Проблема в том, что Хуанг почти монополист и контролирует рынок, задавая на нем дефицит и диктуя цены. Альтман в коллабе с Broadcom хочет положить конец этой диктатуре...
За 9 месяцев Open AI схантили большое количество народу из Google, которые занимались в бигтехе разработкой чипов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍9 5👎1
Опа!
Дуров открыл российским телеграм-каналам монетизацию. Вот же красавчик!
Найти её можно в разделе «Статистика» — если у вас такой вкладки нет, обновите приложение. Выводить прибыть с рекламы можно во внутренней валюте ⭐️.
Монетизация доступна каналам от 1к подписчиков 👀 Прям жутко интересно стало, как это все будет
Дуров открыл российским телеграм-каналам монетизацию. Вот же красавчик!
Найти её можно в разделе «Статистика» — если у вас такой вкладки нет, обновите приложение. Выводить прибыть с рекламы можно во внутренней валюте ⭐️.
Монетизация доступна каналам от 1к подписчиков 👀 Прям жутко интересно стало, как это все будет
🔥40👍19👎6🏆4
Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite
Статья уже на Хабре
Моделька бьет третью ламу (Llama3-8b-instruct). Чекайте
Ссылка на HuggingFace 🤗
Статья уже на Хабре
Моделька бьет третью ламу (Llama3-8b-instruct). Чекайте
Ссылка на HuggingFace 🤗
Хабр
Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite
Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель...
🔥43👍12😁6 4❤3👎1
🏆 Data Feeling | AI
Ребята, написал вторую часть! От неё еще больше людей скажет: «да ну не, этот миллион снова не считается. Вот если бы тебе с неба лям капнул бы на карточку просто так, тогда бы да …», но история все равно топ Давайте добьем бустами до уровня 9, чтоб я обои…
«4 моих первый миллиона, которые чуть не свели меня с ума»
Продолжаю серию рассказов. Как обещал, добавил сразу вторую и третью части. Истории для вдохновения. Постарался написать интересно. Все по порядку:
🍋 Часть 1 - Мой самый первый миллион
🍋 Часть 2 - Теряем работу в обмен на рост.
🍋 Часть 3 - Миллион на инвестициях
А если мы все-таки добьем бустами до 9-го уровня, и я смогу поменять обои на канале на свой любимый ламповый фиолетовый цвет, то сразу выпущу последние две части. Они отражают меня актуального.
🍋 Часть 4 - закапываем, кредитуемся и снова взлетаем 🛫
🍋 Часть 5 - цель в 100М выручки или почему я не ушел с работы
Кидайте https://news.1rj.ru/str/datafeeling?boost если интересно узнать продолжение💪
Продолжаю серию рассказов. Как обещал, добавил сразу вторую и третью части. Истории для вдохновения. Постарался написать интересно. Все по порядку:
А если мы все-таки добьем бустами до 9-го уровня, и я смогу поменять обои на канале на свой любимый ламповый фиолетовый цвет, то сразу выпущу последние две части. Они отражают меня актуального.
🍋 Часть 5 - цель в 100М выручки или почему я не ушел с работы
Кидайте https://news.1rj.ru/str/datafeeling?boost если интересно узнать продолжение
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegraph
Мой первый миллион
Сейчас будет красивый и понятный кейс, который я рассказываю, чтоб вдохновит молодых предпринимателей и доказать, что навык программирования, окупает себя в один удачный проект Контекст: Мне 19. Я заканчиваю второй курс Физтеха. Период перед сессией. Так…
❤34🏆10🔥4⚡2👎2👍1🦄1 1
🦙 Опубликована мощнейшая опенсорс модель Llama-3
Статья уже на Хабре
🔥Судя по бенчмаркам, Llama 3.1 даже лучше GPT-4o (!)
Ссылка на HuggingFace
Статья уже на Хабре
🔥Судя по бенчмаркам, Llama 3.1 даже лучше GPT-4o (!)
Ссылка на HuggingFace
👍19🔥6❤4
🏆 Data Feeling | AI
Фейлы Спикадоры или как я занимался благотворительностью
Основная работа забрала мой фокус, поэтому мы немного забросили интенсивную разработку.
Пока тушил пожары на работе и продолжал фиксировать убытки, Спикадора почти два месяца не принимала оплату и разговаривала с пользователям без ограничений. Вот умничка! 😭
🥲 Мы это заметили и починили. Попросил Спикадорушку больше так не делать. Платежи начали медленно капать.
😐 Потом заметили, что платежи подключены только карточные. Включили все варианты. Типо SberPay/T-Pay и тп. Оплаты резко выросли .
🙂 Далее мы заметили, что не списываем повторные платежи. Починили и тоже немного вернули платежей.
😃 Тут же дошли руки подрубить скидки за покупку подписки в первый день. И это тоже добавило платежей.
И так, реклама внезапно начала окупаться. Вот же магия 🙌
Основная работа забрала мой фокус, поэтому мы немного забросили интенсивную разработку.
Пока тушил пожары на работе и продолжал фиксировать убытки, Спикадора почти два месяца не принимала оплату и разговаривала с пользователям без ограничений. Вот умничка! 😭
🥲 Мы это заметили и починили. Попросил Спикадорушку больше так не делать. Платежи начали медленно капать.
😐 Потом заметили, что платежи подключены только карточные. Включили все варианты. Типо SberPay/T-Pay и тп. Оплаты резко выросли .
🙂 Далее мы заметили, что не списываем повторные платежи. Починили и тоже немного вернули платежей.
😃 Тут же дошли руки подрубить скидки за покупку подписки в первый день. И это тоже добавило платежей.
И так, реклама внезапно начала окупаться. Вот же магия 🙌
🔥22👍6😁6❤3👎3🥰1
Пока мы тут с вами делаем IT продукты, пишем код, кто-то делает бизнес на промптах. Чисто по приколу выкупил сборник из 165 промптов для генерации маркетинговых текстов.
Стоило 35$ 😎
Есть неочевидные 😳
Например для генерации текстовых хуков к видео.
Давайте обмен? 10 бустов и я скинул этот pdf файл сюда
https://news.1rj.ru/str/datafeeling?boost
Стоило 35$ 😎
Есть неочевидные 😳
Например для генерации текстовых хуков к видео.
Давайте обмен? 10 бустов и я скинул этот pdf файл сюда
https://news.1rj.ru/str/datafeeling?boost
Telegram
🏆 Data Feeling | AI
Проголосуйте за канал, чтобы он получил больше возможностей.
👍31👎12❤7⚡5🔥5
🏆 Data Feeling | AI
Пока мы тут с вами делаем IT продукты, пишем код, кто-то делает бизнес на промптах. Чисто по приколу выкупил сборник из 165 промптов для генерации маркетинговых текстов. Стоило 35$ 😎 Есть неочевидные 😳 Например для генерации текстовых хуков к видео. Давайте…
165prompts_AI_engineering.pdf
426.5 KB
Красавцы! Теперь в этом канале стало уютнее)
🚀 Вы мне бусты, а я вам гайд по маркетинговым промптам 📝
Пользуйтесь!
🚀 Вы мне бусты, а я вам гайд по маркетинговым промптам 📝
Пользуйтесь!
❤38😁8👍5
На данный момент это выглядит как безумие, но скорее всего это наше будущее.
Кажется, Skenet ближе чем нам казалось, еще год назад, когда нейросети нормально не могли нарисовать картнику по вашему запросу.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁53🔥12❤2 1
🏆 Data Feeling | AI
Video message
Media is too big
VIEW IN TELEGRAM
Этот личный блог потеряет душу, если я не поделюсь этим.
Месяц назад мы всем юнитом из Додо слетелись в Казахстане из 4-х стран, чтоб встретиться вживую на неделю.
В блокноте у меня сохранилась заметка:
Конвоем из 10 внедорожников мы катались по дикому Казахстану. Я видел миражи, табуны коней, редких птиц, артефакты истории. Мы ночевали в палатках в горах под звездным небом. Даже парились в бане, ныряя после в горную ледяную реку 😅
Такой опыт мне не дарила ранее ни одна компания 😍
Теперь вы знаете, как можно с умом и кайфом коллективно потратить часть бюджета компании.
Месяц назад мы всем юнитом из Додо слетелись в Казахстане из 4-х стран, чтоб встретиться вживую на неделю.
В блокноте у меня сохранилась заметка:
Я бы никогда не смог придумать себе такую поездку. А если бы придумал, то не смог бы купить, а если смог, то маловероятно, что там были б все эти 40 замечательных человек.
Конвоем из 10 внедорожников мы катались по дикому Казахстану. Я видел миражи, табуны коней, редких птиц, артефакты истории. Мы ночевали в палатках в горах под звездным небом. Даже парились в бане, ныряя после в горную ледяную реку 😅
Такой опыт мне не дарила ранее ни одна компания 😍
❤95🔥33🥰9👍6🦄2