🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
🏆 Data Feeling | AI
Найм и менторство 🏕️ На неделю оказался в станице, где живет моя бабуля. Скорее даже просто застрял тут по семейным обстоятельствам. Живу у тётки. Оказывается сейчас каникулы у школьников. И вот от безысходности я превратился в репетитора по python 🐍. Подсадил…
Найм и менторство часть //

Прошло 3 месяц с момента, как я впервые посадил своего двоюродного брата за ноутбук.

Спустя первую неделю совместной практики я вернулся в город. Однако, я хотел чтоб кто-то продолжал заниматься с Димой. Так я оформил его на онлайн курсы для школьников. С его слов ему понравилось то, как молодой преподаватель со старта начал энергично вести урок. Курсы стоят в месяц примерно 9к (4 занятия). Для моей родни это были большие деньги за какие-то там курсы в интернете - поэтому первое время я скрывал их стоимость и платил сам. Позже это вскрылось и платить продолжил уже не я. В третьем абзаце расскажу про результат.

Ближе к лету я столкнулся с новой сложностью. Мой план был подать Дмитрия на летнюю олимпиадную школу МФТИ. Однако, что вы думаете?! Дима напрочь отказался. Я не смог пока что замотивировать его. Для меня оказалось сверх сложным заинтересовать восьмиклассника. Зачем ему покидать деревню и ехать в Москву в лагерь на две недели ведь он планировал ходить с кентами на рыбалку. Это мы с вами знаем, насколько классно и полезно получить такой опыт, а школьник из глубинки не видит в этом ценности. Про то что это платно и стоит 80к+ я вообще промолчал, чтоб это не мешало и родители были на моей стороне. В общем, пока не хочется прибегать к силовым методам, попробую заинтересовать как-то иначе. Возможно через метод «социального одобрения».

И собственно, какие результаты у Дмитрия в программировании на python после 3-х месяцев в школе?! Если бы это был кто-то из моих ровесников - я бы посоветовал ему бросить это дело, но тут другой случай. Тут школьник 13-ти лет. И недавно мы с ним снова встретились. Я попросил его расспечать нечетный числа до N. И он с помощью мелких подсказок справился! На скрине его решение. Это прям зажгло во мне новый раунд мотивации. Юхуууу!
Да, задача простая, да, он решал её уже однажды на pythontutor.com, да, от 3-х месяцев обучения в онлайн школе ожидал большего, но все равно черт возьми приятно!

В общем, пока как-то так. Буду держать вас в курсе.
63🔥24👍10👎2
🧠 Ловите Pandas задачку на подумать )

Предлагаю решить ее двумя способами:
- Самим, написав код по старинке.
- С помощью любой LLM-ки


Бонусом можно еще через PandasAI решить - это такой LLM агент с Pandas знаниями под капотом. Вот хороший гугл колаб с примерами кода.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥10👎1
🐍 А вы знали, что в python аж 50 строковых метода?!

Оказывается, я знал не все! Видимо упустил, потому вот вам видео для повторения на 20 минут.

Ссылка
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👎6👍443
Смотрите, как Спикадора сейчас затащит каточку…

Я прям кайфую, когда так четко отрабатывает. И так почти в 99% случаев

Нативное изучение языка) А еще она идеально решает задания из экзаменов по английскому, но хорошо, что школьники про это не знают)
👍107👎3
Forwarded from 🇬🇧 Speakadora AI 👩‍🏫
👍9👎32
Вы знаете, что моя работа напрямую связана с умением конвертировать данные в доп доход. Мне за это платят.

А еще, вы знаете, что утечка персональных данных является крайне нежелательным событием. Хотя утекают часто.

🧠 Кейс на подумать.

Вот если вам все-таки достались перс данные. Что вы будите с ними делать? Сможете хотя бы копеечку с этого поиметь?) А миллион? уверены что, да?!

Допустим вам достался 1М строк всевозможных персональный данных людей из одного города

(ФИО, ДР, ГОРОД, НОМЕРА, ПОЧТА, деятельность, привязанные номера документов и прочая мета инфа)

Ограничение:
- перепродажа запрещена
- спам и обзвоны запрещены
- скам запрещен

Сможете ли для себя придумать хотя бы 3+ рабочих способа, как вы смогли вытащить из этого для себя пользу? Подумайте!

Полезное и сложное упражнение для дата-спецов.

Картинка меня в любимом худи как заглужка для картинки)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👎98👍6🏆3🥰1
Знайте в чем разница, если еще не определись кто вы.
😁9810🔥8👎41👍1
Media is too big
VIEW IN TELEGRAM
Voice2Order в Dodo Pizza

🍕 Еще год назад придумали с командой фичу - быстрый голосовой заказ. В приложение не добавили т.к кастдев показал себя не очень. И только сейчас дошли руки поднять качество и найти, где применить. Оказалось удобным для заказа через телеграм. Приложил пример работы, собранный на коленке для коллег.

🍔 Говорят, Макдоналдс закрыл эту опцию спустя год т.к Voice2Order у них отрабатывал некачественно. Вместо «трех чизбургеров» выдавал «72 картошки» 🫠

Скажу, что похожие фичи требуют определенной сноровки в реализации. Есть как минимум 3 тонких момента:
- Качественный few-shot и ранжирование
- Правильное переиспользование контекста
- Максимальное отсутствие галлюцинаций и умная реакция на них

#dodo #pizza #ai
🔥49👍10👎31😁1
Второй год запускаю соревновательный ML бут кемп. В этом году на кегле летом много посильных сорев. Рекомендую участвовать пока идет лето и есть свободное время 😉

К чему можно присмотреться?
- LMSYS - по сути текстовые таблички
- ISIC - бинарная классификация на картинках
👍23👎32
This media is not supported in your browser
VIEW IN TELEGRAM
18🔥9👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
💡 Появилась нейронка, которая генерирует CAD-модели из текстовых запросов.

Шестеренки, детали, запчасти и различные конструкции — ИИ спроектирует почти что угодно. Готовые файлы можно скачать и импортировать в любой софт.

Пользуемся здесь.

🎚️ Кажется, это первая такая нейронка в своем классе.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥46👍5👎21
This media is not supported in your browser
VIEW IN TELEGRAM
Новый феймворк Congnita для RAG систем

🤔 Системы RAG (Поисковая дополненная генерация) — это мощные инструменты, но их создание и развертывание может оказаться сложной задачей.
🚀 Cognita стремится стать удобным и модульным решением, решающим общие проблемы RAG.

Проблемы с текущими фреймворками:
⚙️ Задания по фрагментированию и внедрению часто требуют отдельной настройки, но не встроены в существующие платформы, известные мне на данный момент.
💻 Развертывание сервисов запросов для производства может оказаться сложной задачей.
🤖 Для управления развертыванием моделей (языковых моделей, моделей внедрения) отсутствует встроенная поддержка.
🗄 Векторные базы данных могут оказаться сложными для масштабирования.
Нет единого готового шаблона, который можно было бы легко адаптировать.

Как Cognita решает эти проблемы
🎯 Cognita сочетает в себе настройку и простоту использования.
🧠 Масштабируемый дизайн для интеграции прорывных решений по мере их возникновения.

Cognita — библиотека для создания модульных приложений RAG с открытым исходным кодом для производства.
Модульная конструкция: разбейте RAG на этапы для упрощения управления и обновлений.
♻️ Многоразовые компоненты: парсеры, загрузчики и т. д. для экономии времени в проектах.
🚀 Оптимизированное развертывание: Cognita справляется со всеми тонкостями производственных систем.
⚖️ Масштабируемость: компоненты масштабируются независимо, чтобы справиться с возросшим трафиком.
Удобный интерфейс: даже нетехнические пользователи могут играть с настройками RAG.
🔌 На основе API: Cognita хорошо работает с другими системами.

Компоненты Когниты

Индексирование задания

1) Загрузчики данных 🚚
Что: Извлекать данные из разных мест (папок, баз данных и т. д.).
Почему: RAG нуждается в данных для работы!

2) Парсеры 🗂️
Что: Преобразовать различные типы файлов в общий формат.
Почему: упрощает обработку всей информации системой RAG.

3) Эмбеддеры 🔎
Что: создавать кодовые представления текста для быстрого сравнения.
Зачем: помогает найти наиболее актуальную информацию по вашему вопросу.

Хранилище метаданных 🧠
Что: «мозг» системы, хранящий детали конфигурации.
Зачем: сохраняет вашу RAG организованной и простой в управлении.

LLM Gateway 💬
Что: «Переводчик» для разных языковых моделей.
Почему: позволяет переключаться между моделями, не перекодируя все.

Векторные БД 🗄️
Что: хранит встроенные файлы для сверхбыстрого поиска данных.
Почему: Эффективный поиск имеет решающее значение для больших наборов данных.

API-сервер ⚙️
Что: Координатор, который обрабатывает вопросы пользователей и генерирует ответы.
Почему: Он соединяет все части системы RAG вместе.
17🔥8👍3👎1
⚡️ Монополизм Nvidia хотят прекратить.

OpenAI планирует выпускать свои чипы.

Альтман ведёт переговоры с американским полупроводниковым гигантом Broadcom. На данный момент Nvidia производит 80% чипов, на которых произошла нейрореволюция и развитие ИИ.

Проблема в том, что Хуанг почти монополист и контролирует рынок, задавая на нем дефицит и диктуя цены. Альтман в коллабе с Broadcom хочет положить конец этой диктатуре...

За 9 месяцев Open AI схантили большое количество народу из Google, которые занимались в бигтехе разработкой чипов.

👀 Кажется, техническая игра престолов только набирает обороты.

🌐 @datafeeling
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍95👎1
Опа!

Дуров открыл российским телеграм-каналам монетизацию. Вот же красавчик!

Найти её можно в разделе «Статистика» — если у вас такой вкладки нет, обновите приложение. Выводить прибыть с рекламы можно во внутренней валюте ⭐️.

Монетизация доступна каналам от 1к подписчиков 👀 Прям жутко интересно стало, как это все будет
🔥40👍19👎6🏆4
🏆 Data Feeling | AI
Ребята, написал вторую часть! От неё еще больше людей скажет: «да ну не, этот миллион снова не считается. Вот если бы тебе с неба лям капнул бы на карточку просто так, тогда бы да …», но история все равно топ Давайте добьем бустами до уровня 9, чтоб я обои…
«4 моих первый миллиона, которые чуть не свели меня с ума»

Продолжаю серию рассказов. Как обещал, добавил сразу вторую и третью части. Истории для вдохновения. Постарался написать интересно. Все по порядку:

🍋 Часть 1 - Мой самый первый миллион
🍋 Часть 2 - Теряем работу в обмен на рост.
🍋 Часть 3 - Миллион на инвестициях

А если мы все-таки добьем бустами до 9-го уровня, и я смогу поменять обои на канале на свой любимый ламповый фиолетовый цвет, то сразу выпущу последние две части. Они отражают меня актуального.

🍋 Часть 4 - закапываем, кредитуемся и снова взлетаем 🛫 
🍋 Часть 5 - цель в 100М выручки или почему я не ушел с работы

Кидайте https://news.1rj.ru/str/datafeeling?boost если интересно узнать продолжение 💪
Please open Telegram to view this post
VIEW IN TELEGRAM
34🏆10🔥42👎2👍1🦄11
🦙 Опубликована мощнейшая опенсорс модель Llama-3

Статья уже на Хабре

🔥Судя по бенчмаркам, Llama 3.1 даже лучше GPT-4o (!)

Ссылка на HuggingFace
👍19🔥64
🏆 Data Feeling | AI
🤔 Романтика AI стартапов. Прошел первый месяц с запуска Спикадоры. Что вообще она делает? По сути это тренажер для тренировки разговорного английского за счет голосовых сообщений. Сразу скажу, давно я не получал столько удовольствия от ощущения вклада…
Фейлы Спикадоры или как я занимался благотворительностью

Основная работа забрала мой фокус, поэтому мы немного забросили интенсивную разработку.

Пока тушил пожары на работе и продолжал фиксировать убытки, Спикадора почти два месяца не принимала оплату и разговаривала с пользователям без ограничений. Вот умничка! 😭

🥲 Мы это заметили и починили. Попросил Спикадорушку больше так не делать. Платежи начали медленно капать.

😐 Потом заметили, что платежи подключены только карточные. Включили все варианты. Типо SberPay/T-Pay и тп. Оплаты резко выросли .

🙂 Далее мы заметили, что не списываем повторные платежи. Починили и тоже немного вернули платежей.

😃 Тут же дошли руки подрубить скидки за покупку подписки в первый день. И это тоже добавило платежей.

И так, реклама внезапно начала окупаться. Вот же магия 🙌
🔥22👍6😁63👎3🥰1
Пока мы тут с вами делаем IT продукты, пишем код, кто-то делает бизнес на промптах. Чисто по приколу выкупил сборник из 165 промптов для генерации маркетинговых текстов.

Стоило 35$ 😎

Есть неочевидные 😳
Например для генерации текстовых хуков к видео.

Давайте обмен? 10 бустов и я скинул этот pdf файл сюда

https://news.1rj.ru/str/datafeeling?boost
👍31👎1275🔥5