Есть боль при работе с PDF: пытаться скормить LLM’ке данные из PDF сложной структуры. Текст не копируется, форматирование ломается, таблицы и диаграммы превращаются в кашу. В итоге LLM генерирует бред
LlamaParse решает этот вопрос. Это суперумный парсер, который понимает структуру PDF – даже самых сложных. Он не просто выдирает текст, а видит заголовки, таблицы, код, сохраняя логику и структуру в markdown (текстовое представление текста).
Выдаются чистые, структурированные данные, готовые к работе. Он экономит кучу времени и увеличивает качество ответов, превращая работу с PDF в кайф.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤26🔥18👍15👎3
Crawl4ai.io – это просто мощная бомба для веб-парсинга всего, что плохо прибито. Полезно тем, кто пилит RAG пайпланы или автоматизации в n8n с использованием данных с веб ресурсов. Selenium тихо курит в сторонке 😶🌫️
Старый век, это писать парсеры сайтов на python. Забудьте про этот способ! Теперь можно в разы эффективнее автоматизировать поиск и парсинг нужной инфу, а ещё отсеивает всякий мусор. Попрактиковаться и поделать упражнения можно тут.
Факты такие:
- Собирает данные в 2 раза быстрее, чем вручную.
- Качество данных улучшается на 30% благодаря их фильтрам.
- Данные собираются в структурированной формате
- Экономия времени на подготовке данных.
- Универсален для любых сайтов + обходит детекции в большинстве случаев.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥7❤3👎3
🤗 Пора познакомиться
Смотрю на свой канал и радуюсь. На днях число тех, кто совершил одно из лучших стратегических действий в своей жизни — нажав на кнопку «Подписаться» — достигло 18 000 человек(если точнее 18 100, но после таких постов всегда кто-нибудь отписывается).
Здесь собрались одни из лучших людей страны:
— IT профессионалы или просто AI энтузиасты;
— студенты лучших ВУЗов страны;
— десятки, а может, и сотни тех, кто управляет корпорациями и страной;
— 3 человека из списка Forbes;
Давайте познакомимся друг с другом поближе?
Может, кто-то в комментариях найдёт себе новых друзей,разработчика вайбкодера на прибыльный пет-проект, а кто-то — жену.
Начну с себя
Меня зовут Алерон, мне 28. Пробовал свиные ребрышки в 8 странах мира. Люблю строить IT компании с интересными людьми. В прошлом генный инженер. Из нейронок предпочитаю Gemini и Claude. Год назад меня чуть не разнесло от вкусных пиццуль в Додо, пока лидировал там ML команду. Сейчас 3 раза в неделю кроссфит в Бразилии. В канале делюсь опытом IT предпринимателя. Больше обо мне в закрепе. Текущий запрос - найти себе технического кофаундера под новый проект.
Теперь ваша очередь. Расскажите, чем занимаетесь? 👇
Смотрю на свой канал и радуюсь. На днях число тех, кто совершил одно из лучших стратегических действий в своей жизни — нажав на кнопку «Подписаться» — достигло 18 000 человек
Здесь собрались одни из лучших людей страны:
— IT профессионалы или просто AI энтузиасты;
— студенты лучших ВУЗов страны;
— десятки, а может, и сотни тех, кто управляет корпорациями и страной;
— 3 человека из списка Forbes;
Давайте познакомимся друг с другом поближе?
Может, кто-то в комментариях найдёт себе новых друзей,
Начну с себя
Меня зовут Алерон, мне 28. Пробовал свиные ребрышки в 8 странах мира. Люблю строить IT компании с интересными людьми. В прошлом генный инженер. Из нейронок предпочитаю Gemini и Claude. Год назад меня чуть не разнесло от вкусных пиццуль в Додо, пока лидировал там ML команду. Сейчас 3 раза в неделю кроссфит в Бразилии. В канале делюсь опытом IT предпринимателя. Больше обо мне в закрепе. Текущий запрос - найти себе технического кофаундера под новый проект.
Теперь ваша очередь. Расскажите, чем занимаетесь? 👇
4❤50🔥18👍9👎3 2
🧠 В AI и ML часть секрета в правильной инфраструктуре 🤫
В мире ML есть множество задач, которые требуют серьезных вычислительных мощностей. Среди них:
✅ Обучение нейросетей
✅ Тестирование языковых моделей (LLM)
✅ Обработка и анализ BigData
✅ Развертывание и вывод моделей в продакшн (inference)
✅ Создание платформ данных и BI-аналитика
Вот вам один интересный и очень конкретный кейс:
💡Запуск более 400 голосовых роботов в облаке.
RobotMIA специализируется на технологиях машинного обучения и разработке голосовых роботов для call-центров. Их роботы одновременно отвечают на тысячи вопросов пользователей по телефону.
Была потребность:
1️⃣ Создать комфортные условия для пользователей при общении с голосовыми роботами.
2️⃣ Научить роботов предоставлять максимально релевантные ответы.
Своей инфры не было, закинули все на Selectel. Требовалось:
🆒 ML-платформа для экспериментов с языковыми моделями.
🆒 Быстрая обработка запросов.
🆒 Серверы с GPU для обучения нейросетей.
🆒 Объектное хранилище для хранения данных (S3).
Получилось сделать:
🔻Среднее время ответа голосового робота — всего 1-2 секунды, даже в пиковые моменты;
🔻Инфраструктура поддерживается в 4 регионах ЦОД;
🔻Более 400 видов роботов с разными сценариями и голосами функционируют на платформе.
Кроме того, компания активно экспериментирует с большими языковыми моделями, используя ML-платформу Selectel для обучения и тестирования. Это позволяет им интегрировать LLM в свои сервисы и улучшать качество ответов.
🎚 В общем, в эру AI не стоит бояться облачных решений и пора решать свои ML-задачи с помощью новых мощных инструментов!
В мире ML есть множество задач, которые требуют серьезных вычислительных мощностей. Среди них:
✅ Обучение нейросетей
✅ Тестирование языковых моделей (LLM)
✅ Обработка и анализ BigData
✅ Развертывание и вывод моделей в продакшн (inference)
✅ Создание платформ данных и BI-аналитика
Вот вам один интересный и очень конкретный кейс:
💡Запуск более 400 голосовых роботов в облаке.
RobotMIA специализируется на технологиях машинного обучения и разработке голосовых роботов для call-центров. Их роботы одновременно отвечают на тысячи вопросов пользователей по телефону.
Была потребность:
1️⃣ Создать комфортные условия для пользователей при общении с голосовыми роботами.
2️⃣ Научить роботов предоставлять максимально релевантные ответы.
Своей инфры не было, закинули все на Selectel. Требовалось:
🆒 ML-платформа для экспериментов с языковыми моделями.
🆒 Быстрая обработка запросов.
🆒 Серверы с GPU для обучения нейросетей.
🆒 Объектное хранилище для хранения данных (S3).
Получилось сделать:
🔻Среднее время ответа голосового робота — всего 1-2 секунды, даже в пиковые моменты;
🔻Инфраструктура поддерживается в 4 регионах ЦОД;
🔻Более 400 видов роботов с разными сценариями и голосами функционируют на платформе.
Кроме того, компания активно экспериментирует с большими языковыми моделями, используя ML-платформу Selectel для обучения и тестирования. Это позволяет им интегрировать LLM в свои сервисы и улучшать качество ответов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍1
Привет, народ!
Начинаем наш ламповый стрим уже через 20 минут. Трансляцию запущу в 17:00 по Мск.
👇Под этим постом можно будет задавать вопросы. Можно задавать уже сейчас. Разберем на стриме. И чай/кофе успейте себе сделать)
Записи не будет. Сегодня чисто ламповый формат.
Начинаем наш ламповый стрим уже через 20 минут. Трансляцию запущу в 17:00 по Мск.
👇Под этим постом можно будет задавать вопросы. Можно задавать уже сейчас. Разберем на стриме. И чай/кофе успейте себе сделать)
Записи не будет. Сегодня чисто ламповый формат.
🔥10❤3
🎁 Как обещал, дарю бонус самым активным участникам вебинара.
За лучший вопрос, который понравился мне и LLM’ке 😅:
@DewDrop_Msk - Константину за полезный вопрос про парсинг веб сайтов. Получает полный доступ к любому из наших продвинутых интенсивов на выбор (программирование с AI или LLM практика).
И еще доп бонус трем авторам вопросов:
@ruslan745 - Руслану за очень точные вопросы в самые боли. В том числе тестирование RAG систем. Их было много 😅
@Cheldieval - Людмиле за идею хакнуть кодинг на Kaggle
@dim_web - Дмитрию за логичный вопрос про дизайн проекта
Получить можно тут: @Ale_v2
Спасибо всем, кто пришел! Разобрали решения очень многих проблем и болей.Промокод озвученный на стриме действует сутки . Записи в этот раз не будет.
За лучший вопрос, который понравился мне и LLM’ке 😅:
@DewDrop_Msk - Константину за полезный вопрос про парсинг веб сайтов. Получает полный доступ к любому из наших продвинутых интенсивов на выбор (программирование с AI или LLM практика).
И еще доп бонус трем авторам вопросов:
@ruslan745 - Руслану за очень точные вопросы в самые боли. В том числе тестирование RAG систем. Их было много 😅
@Cheldieval - Людмиле за идею хакнуть кодинг на Kaggle
@dim_web - Дмитрию за логичный вопрос про дизайн проекта
Получить можно тут: @Ale_v2
Спасибо всем, кто пришел! Разобрали решения очень многих проблем и болей.
3❤19👍8🏆3😁1 1
1. Нейрореволюция
Мозг покупателя — новый black box. Бренды сканируют эмоции через айтрекинг и ИИ, подбирая триггеры точнее психотерапевта 🧠. Конверсия взлетела на 30%.
2. Наноинфлюенсеры рулят
50К подписчиков — новый 1 млн. Их вовлечённость 15% (у звезд — 3%). Wildberries уже в теме — продажи растут как на дрожжах.
3. Rutube наступает
+40% аудитории. Алгоритмы заточены под русский контент — здесь дешевле охваты и горячее лояльность.
Фишка месяца:
Голосовой поиск — уже 50% запросов. "Окей, Яндекс, купи слона" — теперь не шутка, а тренд.
— Тестируйте нейротесты
— Вкладывайтесь в микроблогеров
— Переезжайте на Rutube
Всех обнял
Please open Telegram to view this post
VIEW IN TELEGRAM
The Velvet Sundown собрали около полумиллиона слушателей, но недавно все обалдели от новости, что группы-то, оказывается, нет! Все песни, история и даже фотки — всё это сгенерировано. При этом группе всего-то меньше месяца, а её уже пихали во все подборки и дайджесты стриминга, так она и стала популярной. Теперь в интернете все думают, что Spotify специально продвигает музыку, созданную ИИ, чтобы не платить реальным артистам.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁39🤯10❤4👎1
🧩 Как сделать SQL-запрос в MongoDB и Redis?
Наткнулся на Хабре на статью о том, как пишут продакшн-код для YDB – распределённой СУБД для построения высоконагруженных систем с открытым исходным кодом. Развитием её федеративных возможностей занимаются студенты во время написания дипломов.
Какие есть результаты:
📌 PostgreSQL, ClickHouse, MySQL, MS SQL Server, MongoDB, Redis — данные из всех этих источников можно консолидировать с помощью YDB Federated Query.
🚀 Разработали SQL-интерфейс к NoSQL базам данных MongoDB и Redis, реализовали алгоритм вывода схемы для коллекций записей без фиксированной структуры.
Крутые кейсы на старте карьеры: разработка с ревью экспертов Яндекс Образования и польза для open-source сообщества.
📚 Данные раскиданы по разным хранилищам, и непонятно, как их проанализировать? Федеративные запросы спешат на помощь🎚️
Наткнулся на Хабре на статью о том, как пишут продакшн-код для YDB – распределённой СУБД для построения высоконагруженных систем с открытым исходным кодом. Развитием её федеративных возможностей занимаются студенты во время написания дипломов.
Какие есть результаты:
📌 PostgreSQL, ClickHouse, MySQL, MS SQL Server, MongoDB, Redis — данные из всех этих источников можно консолидировать с помощью YDB Federated Query.
🚀 Разработали SQL-интерфейс к NoSQL базам данных MongoDB и Redis, реализовали алгоритм вывода схемы для коллекций записей без фиксированной структуры.
Крутые кейсы на старте карьеры: разработка с ревью экспертов Яндекс Образования и польза для open-source сообщества.
📚 Данные раскиданы по разным хранилищам, и непонятно, как их проанализировать? Федеративные запросы спешат на помощь
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13🔥10👍4
Наверняка сталкивались с дилеммой: "Почему LLM глючит?" Или "Как вообще его улучшить?".
Если да, то ответ простой - Langfuse! Это крутой инструмент, который помогает отслеживать, отлаживать и оценивать каждый шаг ваших LLM-цепочек.
Представьте: вы видите всю логику и размышления LLM, а не просто гадаете, что пошло не так. Удобно же?
Исследования показывают, до 80% разработчиков не всегда осознают, что их LLM-приложения "косячат».
Langfuse решает эту боль и дает полную прозрачность. Меньше затыков, пытаясь понять, почему LLM «отшила» человека, хотя нужная информация была (см. скрин реального кейса).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤5⚡2
Есть такая «боль» выбрать LLM'ку на старте проекта. При этом желательно не потратить денег на тесты, и попробовать несколько, и чтобы удобно в одном окне.
- моментально видишь, кто на что горазд;
- находишь лучшую модель конкретно под свою задачу;
- экономишь кучу времени на тесты и подбор решений.
Не нужно верить графикам очередных убийц GPT/DeepSeek/Claude — проверяешь всё на своих задачах. Запустил и кайфуешь, наблюдая, как нейросетки соревнуются друг с другом в борьбе на твоих данных
Please open Telegram to view this post
VIEW IN TELEGRAM
❤31👍16⚡6
Media is too big
VIEW IN TELEGRAM
Логика такая: когда вы общаетесь с ChatGPT, Claude или Gemini, OpenMemory запоминает какие-то факты о вас или вашей работе, а затем автоматически предлагает удачные дополнения из памяти в зависимости от контекста текущего разговора, даже если вы общаетесь уже с другим ИИ
Ничего не поняли? Я сказал ChatGPT, что люблю додстер с кофе, а когда спросил у Gemini, какая моя любимая еда и напиток — расширение предложило Gemini подсказку.
Из жирных плюсов: конский бесплатный тариф и возможность развернуть свой сервак, если не очень хочется передавать факты о себе третьим лицам.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22⚡5❤3
В этот раз бесплатный кредит на 300$ в Google Cloud, можно потратить на генерацию видео-роликов в Vertex AI Studio.
Есть нюансы:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2
Среди участников проекта — Трапит Бансал, один из ключевых исследователей OpenAI, который работал с Ильёй Суцкевером. Новое подразделение, получившее название Meta Superintelligence Labs, сфокусируется на разработке AGI-системы и будет функционировать как автономная структура, имеющая прямой доступ к Цукербергу.
Пока неизвестно, все ли новые сотрудники получили бонусы в размере $100 млн. К слову, эта сумма превышает годовые зарплаты CEO Apple, Microsoft и Uber.
Кайфую от этих переходов между биг-тех компаниями с выплатами дороже чем у мировых звезд футбола
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25🔥18👍6😁3👎1 1
Кто не в курсе Grok 4 — это модель ИИ типа ChatGPT, Gemini, Claude, DeepSeek
Сначала я сам не поверил, но после пары тестов стало ясно: Grok стал реально мощнее! Он уделывает конкурентов почти во всех тестах. Даже в "Последнем экзамене человечества" Grok прилично обходит топовые модели. (Кстати, прикрепил фотки и табличку от самого Grok, где он сравнивает себя с другими). А ещё, Grok 4 Heavy на 100% прошёл тест по математике AIME25 — вообще без ошибок!
Если коротко — модель стала быстрее, выше, сильнее. Вот что стоит знать о свежих фичах, о которых все спрашивают:
- Контекстное окно стало в два раза больше! Теперь оно целых 256 тысяч токенов.
- API уже тут! Цены такие же, как у Gork3, так что ничего неожиданного.
- С мультимодальностью пока не очень, но Илон Маск клянётся исправить это в ближайшее время. Ждём!
- Появился новый тариф — SuperGrok Heavy за $3000 в год. В него входит самая мощная версия Grok 4 Heavy, которую вы, кстати, можете увидеть на графиках.
- Бесплатно пока никак. Работает только по подписке — либо через X (бывший Twitter), либо напрямую на сайте Grok.
+ ещё стартуют обучение видео-модели. Интересно, что у них выйдет.
Кто уже успел потестить, как ваши впечатления? Для вайб-кодинга тоже лучший или нет?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Comet от Perplexity: новый браузер или просто очередной хайп?
Слышали про новый ИИ-браузер Comet от Perplexity с кучей фишек?
Что умеет:
✅ Встроенный ИИ делает саммари страниц, заполняет формы, решает задачки
✅ Запросы прямо из адресной строки
✅ Умное управление вкладками (можно группировать в папки)
✅ Боковой ассистент с функциями Perplexity
Реальная польза:
👍 Автоматизирует рутину (экономит 2-3 часа в день)
👍 Структурирует исследования (все материалы в одном месте)
👍 Ускоряет поиск информации
Стоит ли игра свеч?
Да, если вы готовы платить $200/месяц. Для остальных — пока рано говорить. Альтернативы: Arc (бесплатен) или ждать удешевления подписки.
🎚 Ваше мнение? Кто уже протестил — делитесь впечатлениями👇
Слышали про новый ИИ-браузер Comet от Perplexity с кучей фишек?
Что умеет:
✅ Встроенный ИИ делает саммари страниц, заполняет формы, решает задачки
✅ Запросы прямо из адресной строки
✅ Умное управление вкладками (можно группировать в папки)
✅ Боковой ассистент с функциями Perplexity
Реальная польза:
👍 Автоматизирует рутину (экономит 2-3 часа в день)
👍 Структурирует исследования (все материалы в одном месте)
👍 Ускоряет поиск информации
Стоит ли игра свеч?
Да, если вы готовы платить $200/месяц. Для остальных — пока рано говорить. Альтернативы: Arc (бесплатен) или ждать удешевления подписки.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥3👍2👎1