Как готовят топ-специалистов по ИИ: очная сессия программ обучения ДПО в ИТМО
📌 21 июля в Университете ИТМО стартовала очная сессия обучения по программам ДПО для руководителей и преподавателей программ топ-уровня в сфере ИИ. Обучение организовано в рамках гранта Минцифры на подготовку топ-специалистов в области искусственного интеллекта. Среди участников — Максим Абрамов, руководитель образовательной программы ИИНД, вошедшей в число победителей грантового отбора.
📆 Открыла очную неделю обучения Юлия Раковская, руководитель Центра исследований и разработки Сбера в Санкт-Петербурге, с лекцией «Дизайн образовательной программы в сфере ИИ под задачи индустриального партнёра». В своём выступлении Юлия Александровна представила опыт Сбера в проектировании образовательных программ и подчеркнула важность построения партнёрства между индустрией и университетами.
🎙 Основной акцент был сделан на том, как адаптировать содержание программ под реальные запросы рынка, интегрировать практические кейсы и формировать выпускников, востребованных в ИТ и финтехе.
Вовлечение индустрии в образование — часть большой работы по развитию ИИ-экосистемы в России и подготовке кадров для быстрорастущего рынка.
😀 В рамках обучения 24 июля состоялся круглый стол «Проблемы внедрения в образовательный процесс современных технологий и методик обучения», где с докладом от СПбГУ выступил Сергей Николенко — руководитель ОП «AI360: Математика машинного обучения». Он представил усовершенствованную структуру пяти образовательных программ, которые реализуются в рамках гранта. Программы разработаны совместно с индустриальными партнёрами, что обеспечивает их практическую направленность и соответствие актуальным требованиям ИТ-отрасли.
👨🎓 Следим за тем, как развивается система подготовки ИИ-специалистов в стране — и гордимся тем, что наша программа ИИНД — в числе лучших.
Вовлечение индустрии в образование — часть большой работы по развитию ИИ-экосистемы в России и подготовке кадров для быстрорастущего рынка.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Разбираемся вместе с Артёмом Вяткиным, младшим научным сотрудником лПИИ СПб ФИЦ РАН и руководителем направления по исследованию данных Сбера.
На бенчмарке Humanity's Last Exam она показала 44.4% (Grok 4 Heavy), что ставит её в топ среди конкурентов!
- Высокая точность в математических и научно-логических задачах благодаря многоступенчатому анализу.
- Глубокие рассуждения: Grok 4 отвечает в 2–5 раз более развернуто, чем, например, DeepSeek R1.
- Интеграция с X: нативный доступ к открытым постам X для анализа трендов в реальном времени.
- Избыточность: длинные глубокие рассуждения могут стать недостатком, замедляя работу с простыми запросами.
- Слабости в кодинге и изображениях: не силен в визуале, значительно уступает Gemini и Claude в программировании.
- Политизированность: бунтарский стиль приводит к ответам с правым уклоном. Илон Маск обещает исправления, но вопросы к объективности остаются.
- Отсутствие новых фич: Grok не предлагает уникальных функций, кроме улучшенного анализа.
Grok 4 уверенно справляется с русским языком, как и большинство современных LLM. Проблемы минимальны, но иногда встречаются вкрапления английского или китайского (например, «extremно низкий» или «более 代表ительным»). Эти случаи несущественны и не влияют на общий опыт взаимодействия.
Уже тестировали Grok 4? Делитесь опытом в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Гостем первого выпуска нового сезона подкаста «Фичи Катятся» стал преподаватель нашей магистерской программы «Искусственный интеллект и наука о данных» и Chief Data Scientist B2C в Сбере Дмитрий Бугайченко.
Выпуск — про эволюцию ИИ, мультиагентные системы, вызовы индустрии и будущее технологий.
Слушать и смотреть можно на:
Rutube, Яндекс.Музыка
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Уставший техдир
Первый выпуск второго сезона подкаста "Фичи Катятся"!
Дима Бугайченко — CDS B2C в Сбере. Мы познакомились в Минске, где выступали на митапе по рекомендательным системам. Мне понравился его доклад, а после, на афтерпати, несколько часов обсуждали машинное…
Дима Бугайченко — CDS B2C в Сбере. Мы познакомились в Минске, где выступали на митапе по рекомендательным системам. Мне понравился его доклад, а после, на афтерпати, несколько часов обсуждали машинное…
🔥11 6 5❤2😁1
Хотите выжать максимум из Python для анализа данных? Делимся 5 проверенными способами, которые сэкономят время и ресурсы!
Используйте NumPy и Pandas для операций над массивами — это в 10-100 раз быстрее, чем использовать стандартные типы данных Python. Векторизация минимизирует накладные расходы Python, передавая вычисления низкоуровневым библиотекам.
Используйте Polars вместо Pandas. Polars — это библиотека для обработки данных, написанная на Rust. Она быстрее Pandas за счёт многопоточности и использования Apache Arrow, что снижает потребление памяти и ускоряет операции с большими данными (2–10 раз быстрее для группировок и объединений)
Numba — JIT-компилятор, который преобразует Python-код в машинный, приближая производительность к C. Он идеально подходит для числовых вычислений с циклами. Numba компилирует функции на лету, устраняя накладные расходы интерпретатора Python.
Apache Parquet — столбцовый формат хранения данных, который компактнее и быстрее CSV благодаря продвинутым алгоритмам сжатия и выборочного чтения. Чтение/запись данных может быть в 5–20 раз быстрее.
cProfile — встроенный модуль Python для анализа времени выполнения кода. Он позволяет выявить неоптимальные по скорости выполнения участки кода для того, чтобы программисты могли их улучшить.
Эти лайфхаки помогут вам ускорить анализ данных и справляться с задачами быстрее!
А что упрощает работу вам? Делитесь опытом в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Хотите работать над инновационным продуктом с использованием больших языковых моделей? Наша команда блока «Корпоративно-инвестиционный бизнес» Сбера разрабатывает AI-помощников на базе GigaChat для сотрудников банка. Мы ищем стажёра-ассистента проджект-менеджера, который поможет выстраивать бизнес-процессы внутри продукта!
— Анализировать корпоративную документацию;
— Вести деловую переписку и взаимодействовать с партнерами внутри Сбера;
— Готовить презентации и отчёты по продукту;
— Резюмировать итоги встреч и формировать задачи;
— Участвовать в планировании и координации процессов;
— Организовывать работу команды по отдельным задачам.
Вы идеально подходите, если:
— Внимательны к деталям и умеете структурировать информацию;
— Легко справляетесь с большими объёмами данных;
— Коммуникабельны и знаете основы деловой переписки;
— Уверенно владеете PowerPoint и Excel;
— Пишете грамотные и понятные тексты;
— Самостоятельны и готовы организовывать процессы.
— Опыт программирования;
— Понимание основ IT-архитектуры.
Готовы присоединиться к нашей команде и развивать навыки в AI-проектах?
Please open Telegram to view this post
VIEW IN TELEGRAM
В первой части мы рассказали, как устроен процесс дообучения GigaChat: какие данные используем и как оцениваем прогресс.
Теперь поговорим о главном — как дообучение помогает решать реальные задачи бизнеса и пользователей!
Разбираемся вместе с Валерием Олисеенко — исполнительным директором по исследованию данных Сбера и научным сотрудником лПИИ СПб ФИЦ РАН.
Дообучение — это насыщение модели знаниями и умениями. Без него LLM может не понимать суть вопроса, даже если имеет валидный материал внутри себя.
Яркий пример — ИИ-помощник Центра индустрии здоровья, который дает врачам и пациентам подсказки по вопросам здоровья. В его основе — сложная система с интеграциями, логикой, RAG и агентами. Но главное — это дообучение. Именно оно помогает модели понимать запросы и давать осмысленные, достоверные ответы.
Всё просто: чем больше разнообразных примеров видит модель при дообучении, тем глубже и креативнее она отвечает. Опыт — главный источник вдохновения даже для ИИ.
По мнению Валерия Дмитриевича, LLM достигли пика развития: сами по себе они уже не становятся радикально лучше. Новые возможности появляются благодаря модулям, таким как Operator или DeepResearch от OpenAI, которые расширяют функциональность моделей.
Главный тренд сегодня — это движение к AGI. Речь идёт о системах, которые не просто отвечают на вопросы, а способны к осмысленному анализу, построению выводов и прогнозов. Например, по финансовым метрикам и новостному фону — предсказывать состояние компании точнее, чем классические ML-модели или даже человек.
Создавать и обучать собственные LLM могут единицы стран в мире. Поэтому появление GigaChat — это важный шаг, который сложно переоценить!
Как думаете, с какими задачами GigaChat будет справляться через 5 лет? Делитесь в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
Что нового принесла эта неделя? В России создают мощные языковые модели и борются с мошенниками, а за рубежом готовят релиз GPT-5. Все главные события — в нашем дайджесте!
Yandex B2B Tech открыл доступ к ИИ-модели Alibaba Qwen3-235B-A22B-Instruct-2507 в облаке
Холдинг VK обновил и выложил в открытый доступ модель RuModernBERT для обработки естественного русского языка. Доступны версии на 150 млн и на 35 млн параметров
В «Билайне» разработали ИИ-алгоритм для выявления воздействия мошенников на человека по изменению активности общения абонента
В НИУ ВШЭ представили архитектуру нейросетей GLGENN, которая упрощает работу ИИ с симметриями данных
В ВТБ до конца 2026 года планируют разработать платформу для создания и тренировки навыков ИИ-помощников
Исследователи тюменского научного центра «Роснефти» создали и внедрили ПО на основе LLM для снижения рутинной нагрузки, связанной с поиском, проверкой и оформлением текстов
Ozon планирует создать ИИ-ассистента для помощи в поиске товаров
OpenAI, по информации СМИ, планирует выпустить GPT-5 в августе
На Всемирной конференции по искусственному интеллекту в Шанхае представят более 3 тыс. экспонатов, включая 40 языковых моделей, 50 ИИ-решений и 60 роботов
Разработчик Anthropic создал три ИИ-агента для аудита LLM
Исследователи американской «Лаборатории Джексона» применили ИИ для открытия ранее неизвестных биомаркеров синдрома хронической усталости
Microsoft анонсировала новый режим Copilot Mode для браузера Edge. Он объединяет ИИ-помощника и веб-поиск в одном текстовом поле
В OpenAI представили новый инструмент в ChatGPT — «Режим обучения». Он помогает студентам разбираться в задачах поэтапно, а не генерирует готовые ответы
Исследователи Шанхайского университета Цзяотун (Китай) и компании MiniMax AI создали ИИ-систему ASI-Arch для автоматизации научных исследований в области нейронных архитектур
Please open Telegram to view this post
VIEW IN TELEGRAM
Команда блока «Корпоративно-инвестиционный бизнес» Сбера снова ищет таланты — на этот раз нужен Backend developer-стажёр. Если вы уверенно работаете с Python, знакомы с асинхронными фреймворками и владеете SQL, приглашаем присоединиться к разработке AI-помощников на основе GigaChat для сотрудников банка.
— Разрабатывать и поддерживать системы парсинга интернет-ресурсов;
— Работать с логами;
— Рефакторить программные модули для повышения производительности.
— Уверенно владеете Python
— Знаете библиотеки sqlalchemy, aiohttp (+requests), telethon, bs4, fastapi, pandas
— Имеете навыки асинхронного программирования
— Разбираетесь в SQL и ORM
— Умеете работать с Git
— Знаете принципы ООП и SOLID
— Понимаете, как работает REST API
— Готовы брать сложные задачи и расти профессионально
— Опыт работы с RabbitMQ, Celery
— Знание Docker/Kubernetes
— Опыт работы с Elastic Search Kibana
— Навыки работы с Nginx
— Опыт использования LLM
— Знание методов NLP (Natural Language Processing)
Готовы присоединиться к нашей команде и развивать навыки в AI-проектах?
Please open Telegram to view this post
VIEW IN TELEGRAM
Конечно, 80% работы все же сделали люди, но результат действительно впечатляет. Японское издание The Japan News приводит концовку книги:
«Я корчился от радости, которую испытал впервые, и продолжал с волнением писать. Это тот день, когда компьютер написал роман! В этот день, когда компьютер расставил приоритеты и начал писать для собственного удовольствия, он прекратил работать на людей»
В прошлом году GigaChat взялся за воссоздание утраченного второго тома «Мёртвых душ» Николая Гоголя. Модель обучается на письмах, черновиках и сохранившихся фрагментах под руководством филологов, историков и биографов. Проект ещё не завершён, но, возможно, именно GigaChat докажет: рукописи не горят!
Прочитали бы книгу, написанную ИИ? Поделитесь в комментариях
Please open Telegram to view this post
VIEW IN TELEGRAM
Викторина 2️⃣
Классификация фишинговых URL
Фишинговые URL — это вредоносные ссылки, созданные для кражи личных данных или распространения зловредного ПО. Классификация таких URL — задача машинного обучения, где нужно определить, является ли ссылка фишинговой или безопасной.
Готовы проверить себя и узнать что-то новое? Тогда вперед!⬇️
Классификация фишинговых URL
Фишинговые URL — это вредоносные ссылки, созданные для кражи личных данных или распространения зловредного ПО. Классификация таких URL — задача машинного обучения, где нужно определить, является ли ссылка фишинговой или безопасной.
Готовы проверить себя и узнать что-то новое? Тогда вперед!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9 6 5
Какой алгоритм машинного обучения лучше подходит для классификации фишинговых URL?
Anonymous Quiz
54%
Random Forest
15%
K-Means
14%
Linear Regression
17%
Apriori
😁4 2 1
Разбор Викторины #2: Классификация фишинговых URL
💜 Спасибо за участие в нашей викторине! Пришло время разобрать ваши ответы.
✅ Правильный ответ: а) Random Forest
🔍 Почему Random Forest?
Классификация фишинговых URL — это задача бинарной классификации, где Random Forest показывает высокую точность благодаря ансамблевому подходу.
Random Forest может обрабатывать сложные признаки, такие как текстовые данные URL, числовые метрики (длина, количество символов) и категориальные данные (например, доменные зоны).
Алгоритм минимизирует переобучение и хорошо работает даже с несбалансированными наборами данных, что часто встречается в задаче обнаружения фишинга.
📌 Почему другие варианты не подходят?
➖ K-Means: подходит для кластеризации, а не для классификации с известными метками.
➖ Linear Regression: разработана для регрессии, а не для классификации. Плохо справляется с нелинейными зависимостями.
➖ Apriori: используется для поиска ассоциаций, а не для предсказания классов.
Был ли ваш ответ верным? Делитесь мыслями в комментариях.
Новые викторины уже скоро!
Классификация фишинговых URL — это задача бинарной классификации, где Random Forest показывает высокую точность благодаря ансамблевому подходу.
Random Forest может обрабатывать сложные признаки, такие как текстовые данные URL, числовые метрики (длина, количество символов) и категориальные данные (например, доменные зоны).
Алгоритм минимизирует переобучение и хорошо работает даже с несбалансированными наборами данных, что часто встречается в задаче обнаружения фишинга.
Был ли ваш ответ верным? Делитесь мыслями в комментариях.
Новые викторины уже скоро!
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Что там в СПбГУ
Социальные сети — это призма, через которую мы бессознательно проецируем себя. Даже если вам кажется, что аватарка — просто случайное фото, для алгоритмов это чёткий сигнал: от уровня экстраверсии до эмоциональной устойчивости.
Цвет, композиция, даже отсутствие фото на странице — всё это данные для алгоритмов. Но пока их точность составляет около 80% — юмор, иронию и контекст они понимают с трудом
А ещё Фёдор Витальевич рекомендует книги, которые помогут по-новому взглянуть на технологии вокруг нас — от создания цифровых двойников до защиты приватности в эпоху Big Data.
Информационный партнёр проекта — издание «Петербургский дневник».
Подкаст доступен на площадках:
✔️ВКонтакте
✔️Яндекс.Музыка
✔️Apple Podcasts
✔️Google Podcasts
✔️Castbox
✔️SoundStream
✔️Pocket Casts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь Нео и Морфеус дерутся в бассейне, а Пираты Карибского моря могут спокойно уходить на пенсию. Aleph выдает эпик кинематографического уровня, меняя локации, объекты и стиль ролика по текстовому описанию без искажений и швов. Это первый инструмент, который точечно редактирует указанные элементы, а не генерирует видео с нуля.
На прошлой неделе Aleph вышел из закрытой беты и стал доступен по платной подписке.
Тем, кто мечтает делать крутой визуал без студии, команды и бюджета Netflix. Aleph сокращает время на производство контента, заменяет часть пост-продакшна и открывает новые горизонты для креатива.
Теперь блокбастеры можно собирать без дорогостоящего оборудования и толп специалистов! А монтажёрам и графистам — самое время подружиться с нейросетью.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM