Научный опенсорс – Telegram
Научный опенсорс
730 subscribers
77 photos
1 video
1 file
130 links
Канал сообщества ITMO OpenSource, посвященного созданию и использованию наукоёмких open-source проектов, в том числе в области AI/ML.

Чат: https://news.1rj.ru/str/itmo_opensource

По всем вопросам - @nicl_nno
Download Telegram
В цикле хабропостов Дмитрия Кабанова, посвященном опенсорсу, вышел новый материал - расширенный вариант одного из докладов с нашей секции Datafest:

От экосистемы KScience к опенсорс-хабу — рассказывает Александр Нозик, директор Центра научного программирования

Внутри - много подробностей про экосистему KScience, опыте опенсорс-разработчиков решений с бизнесом, а также обсуждение концепции университетского open source-хаба и его потенциальной финансовой модели.

При этом, если мы фокусируемся больше на опенсорсе в науке (пусть и с большим креном в сторону AI/ML), то тематику нового хаба (создаваемого на базе МФТИ) Александр обозначил как "Индустриальный open-source" (уже есть чат хаба, в котором можно поучаствовать всем заинтересованным).
👍9
Недавно обещал рассказать про то, как статью о нашем инструменте OSA приняли на воркшоп CODEML конференции ICML 2025.

Формат воркшопа любопытный - рассматривают статьи про новые ML-проекты с открытым кодом, багфиксы и улучшения в существующих, опыт разработки и предложения по улучшению процессов.

Поэтому написали туда короткую статью с описанием Осы и небольшими экспериментами по оценка качества генерации README и его сравнению с аналогами (ReadmeAI и др.). Получилось, на мой взгляд неплохо - с чем рецензенты и согласились.

Публикации non-archival - так что учтем полученные рецензии (довольно содержательные и позитивные) и подадим куда-нибудь ещё. Из минусов - нужна анонимизация (мне кажется, что для статей про опенсорс это несколько излишне).

Порадовало что организаторы отнесли нашу статью к категории spotlight - т.е. предложили выступить с докладом, а не только с постером. К сожалению, вживую добраться до ICML не удалось (получить визу в Канаду непросто) - но с доставкой постера помогли коллеги из AIRI, так что на воркшопе мы засветились (см. фото).

Текст статьи доступен на openreview, код - всё в том же репозитории https://github.com/aimclub/OSA.
🔥1933🤩2👍1
Всем летний привет от нашего сообщества!

Рады анонсировать внеочередной Scientific Open Source Meetup от нашего сообщества ITMO Opensource, который пройдет 24 июля 2025 года с 18:30 до 22:00 в Санкт-Петербурге.

Формат необычный - митап частично проводится как элемент обучения в рамках программы дополнительного профессионального образования для преподавателей и руководителей образовательных программ подготовки топ-специалистов в области ИИ. Поэтому и уклон выступлений - в сторону образования. Из-за ограниченной вместимости площадки, для широкой публики все выступления будут доступны в формате live-трансляции.

Какие доклады будут в программе митапа:

- Николай Никитин, руководитель группы научно-технического развития, Институт ИИ ИТМО - Практики создания и поддержки культуры и экосистемы открытого кода в сфере ИИ в университете

- Владислав Терещенко, аспирант лаборатории LISA, ИТМО - Как мы научили LLM-ассистента рецензировать научные работы студентов ИТМО: вновь о проекте Edulytica

- Юлия Борисова, аспирант лаборатории NSS, ИТМО - Репозитории и опенсорс для студентов - что, зачем и как?

- Дмитрий Чуканов, ведущий эксперт по технологиям GitVerse - GitVerse — пространство для развития, обучения и новых открытий

- Олег Сиротюк, лидер сообщества OpenScaler - Секреты DeepSeek: академический open source как катализатор китайских инноваций и технологической независимости

Мероприятие проходит при поддержке:
OpenScaler — сообщество разработчиков ОС с открытым исходным кодом. Они уже несколько лет исследуют китайскую open-source экосистему, а также ведут канал Китай.AI, где публикуют и разбирают статьи из первоисточников про достижения Китая в ИИ. На этот раз коллеги расскажут о том, как в Китае opensource применяется в образовании.

Дата: 24 июля 2025 года
Время: 18:30 - 22:00
Место: онлайн

Ждем вас в трансляции в четверг!
🔥131👍1
Небольшое объявление для тех, кто хочет попробовать себя на научной позиции в сфере AI/ML:

У нас Институте ИИ ИТМО открылось несколько вакансий уровня junior и middle, от NSS Lab и AI Industrial Research Lab.

Среди тематики выделали три основных трека: по AI4Science, AI4Industry и по мультиагентным LLM.

В ходе работы можно будет и поучаствовать в разработке наших многочисленных open-source решений, и поресерчить на уровне A* / Q1.
Так что если ищете позицию с уклоном в разработку ПО - такие тоже есть.

Все подробности и форма для откликов - тут (по ссылке - канал NSS Lab, там периодически пишем о наших достижениях и результатах).
🔥71
Вышел лонгрид от ICT Moscow про отечественные LLM и различные подходы к их созданию: Остаться в седле: кто и как в России обучает модели искусственного интеллекта.

Мне материал показался интересным, достаточно системно рассмотрены релизы ИИ-моделей этого года, опрошены эксперты как из бигтеха и университетов, так и стартапов.

Наверное, в не-бигтеховую часть подборки можно было бы включить мини-модели от "Сибирских нейросетей". Но, вероятно, не вошли по дате релиза.
Мы в ИТМО свои наработки по до-обучению специализированных моделей тоже ещё пока не успели опубликовать.

P.S. Про вчерашние open-source модели от OpenAI все, вероятно, уже прочитали. По метрикам выглядит многообещающе, у себя тоже попробуем поднять GPT-OSS-20B и протестировать в составе наших мультиагентных LLM-инструментов, вместо текущей Gemma 3 27b.
🔥11
Коллеги из Yandex анонсируют опенсорсные активности вокруг платформы SourceCraft:

- Рейтинг репозиториев на SourceCraft с лайками и ачивками. Про лучшие проекты обещают написать в канале, а авторов - снабдить мерчом.
Наверное, на будущее не хватает каких-то фильтров по языкам и тематикам.

- Очередной цикл уже традиционной грантовой программы от Yandex Open Source, подавать заявки можно будет с середины августа и до 15 марта 2026. Но в этом году репозитории-кандидаты должны быть размещены именно на SourceCraft-е.
9👍2❤‍🔥1🔥1
В канале pythonl узнал про любопытный open-source инструмент - https://github.com/HKUDS/DeepCode

C его помощью можно генерировать полноценные репозитории с кодом (включая не только алгоритмы, но и фронтенд и бекенд) на основе текста научной статьи:

- Paper2Code — реализация идей из исследований в рабочий код;
- Text2Web — генерация веь-интерфейсов по описанию ;
- Text2Backend — автоматическое создание масштабируемой серверной части;
- Поддержка длинных документов и больших проектов.

Тестируют планируют на бенчмарке по воспроизводимости научных статей (PaperBench), но это пока future plans.

В целом, выглядит весьма интересно, часть функциональности близка к нашей разработке OSA (у нас в планах как раз авто-анализ соответствия текста статьи и документации коду). Внутренняя реализация тоже схожа - внутри MAS LLM с множеством агентов и тулов.

У авторов проекта вообще очень сильный задел - ранее они выкатывали довольно популярные AutoAgent, AI-Researcher, Auto-Deep-Research, RAG-Anything и другие LLM-based инструменты.

Насколько DeepCode будет используем на практике - надо смотреть; но вообще концептуально ситуация когда код статьи надо с нуля восстанавливать по тексту - она какая-то не очень здоровая.
🔥81👍1
Не будем нарушать традицию анонсов этого цикла опенсорсных конференций:

«Базальт СПО» при поддержке Института программных систем им. А.К. Айламазяна РАН проводит "XXI конференцию разработчиков свободных программ". Она состоится 3-5 октября 2025 года в городе Переславле-Залесском на базе ИПС РАН.

7 сентября заканчивается прием заявок на участие в качестве докладчика, слушателям можно регистрироваться до 1 октября.

Тематики следующие:

- Разработка свободного программного обеспечения;
- Новейшие достижения проектов СПО;
- Формирование сообщества разработчиков СПО;
- Философские, культурные и правовые аспекты свободного ПО;
- Студенческие проекты разработки СПО;
- Разработка свободного аппаратного обеспечения (OSHW).

Заявлены следующие ограничения:
- Доклады о проприетарном ПО и бизнесе не допускаются.
- Если тема доклада связана с разработкой ПО, заявка должна содержать ссылку на код, опубликованный в любом общедоступном репозитории под любой свободной лицензией (по определению ГОСТ Р 54593-2011, FSF или OSI).
- Если тема доклада связана с разработкой свободного аппаратного обеспечения (OSHW), то все материалы проекта должны быть опубликованы в соответствии с требованиями Open Source Hardware (OSHW) Definition.


Актуальная информация о регистрации и участии публикуется на странице конференции. Там же будут размещены программа конференции и электронная версия сборника тезисов докладов.

Участие для докладчиков и слушателей бесплатное. Будет онлайн-трансляция.

На прошлогодней конференции от нас выступал Андрей Гетманов с докладом "Создание научного Open Source-сообщества — опыт ИТМО". На эту конференцию тоже постараемся добраться и рассказать про наши новые результаты - в частности про активно развиваемый улучшатель репозиториев OSA.
👍8🔥2
Пишут о запуске новой грантовой программы "Код без границ" от GitVerse, совместно с Cloud. ru и Хабром.

Обещают финансовую поддержку (150к, 100к и 50к рублей за 1, 2 и 3 места в каждой из четырех номинации), вычислительные ресурсы и менторинг для опенсорсных проектов.
Выглядит как полезный формат для поддержки небольших опенсорсных проектов, в том числе студенческих.

Номинации следующие:
1) AI-инновации: проекты, использующие искусственный интеллект для решения технологических задач: новые алгоритмы, фреймворки, AI-инструменты, реализации мультиагентных и RAG-систем и другие;

2) Наука и образование: проекты, направленные на улучшение образовательных процессов или научных исследований с использованием открытых технологий;

3) Проекты для всех: приложения и сервисы для конечного пользователя, средства коммуникации, программы для просмотра и редактирования файлов, цифровые помощники.

4) Разработка для разработчиков: проекты, которые ускоряют и облегчают работу. AI-инструменты разработки (кодовые ассистенты, ассистенты DevOps).

Из ограничений - проекты должны быть независимыми от конкретных компаний, а также размещаться на платформе gitverse (возможно и зеркалирование с других площадок).
Заявки - до 31 октября, результаты - в декабре.
🔥122
Интересное от Selectel - обещают оплату за решение задач по доработке open-source решений.

Сейчас предлагаемые задачи связаны с архиватором xz, библиотекой асинхронного разрешения DNS-имен c-ares и парсером libxml2.

Подробнее - https://promo.selectel.ru/openfix
🔥11👍4🤣1👀1
Выкатили сегодня совместное с Yandex B2B Tech исследование, посвященное ИИ-ассистентам для разработки ПО.

Все результаты и подробности проделанной работы представлены тут:
https://habr.com/ru/companies/yandex_cloud_and_infra/articles/947526

Там же доступен и полный текст исследования.

В ходе подготовки материала проведен опрос более 600 разработчиков из индустрии и академии; также пообщались с экспертами, про анализировали собственный опыт исследований в области LLM-агентов и AI4Code.

Надеюсь будет интересно и полезно!
Также будем рады обратной связи, а также идеям и предложениями для будущих исследований.
🔥16❤‍🔥2👍1
Осенний Scientific Open Source Meetup - в октябре!

Дорогие друзья и единомышленники!
С радостью приглашаем вас на очередной Scientific Open Source Meetup, который пройдет 2 октября 2025 года с 19:00 до 22:00 в Санкт-Петербурге в уютном лофте на Газовой, 10ж. Это отличная возможность встретиться, обсудить актуальные темы и поделиться опытом в мире открытого программного обеспечения.

Какие доклады вас ждут на митапе?
- Николай Никитин, руководитель группы научно-технического развития, Институт ИИ, ИТМО - “ИИ в разработке: как мы исследовали тренды и сценарии применения”
- Олег Чирухин, владелец продукта GigaIDE Cloud - “OpenSource и AI в GitVerse”
- Владимир Павлов, представитель технического комитета OpenScaler- “Внутренняя кухня OpenScaler: Свежий кейс о том, как открытый дистрибутив Linux усилиями сообщества и партнера лег в основу современного продуктового решения”
- Дмитрий Карловский, дракон гильдии Гипер Дев - “А что если… безумные идеи хранения данных”
- Станислав Чумаков, аспирант ФТИИ ИТМО - "Лучшие практики AI4Code. Кейс проекта ExperiPulse

Мероприятие проходит при поддержке:
GitVerse
Среди разработок GitVerse — не только платформа с возможностью размещать, зеркалировать и импортировать репозитории, запускать CI/CD, но и инструмент для обучения ИТ-специалистов, SmartClass.
Разработчики могут использовать встроенную среду разработки GigaIDE, в том числе в облачном варианте, а также AI-ассистент GigaCode, чтобы избавиться от рутинных задач!

OpenScaler
OpenScaler — сообщества разработчиков ОС с открытым исходным кодом. Они уже несколько лет исследуют китайскую open-source экосистему.


🗓 Дата: 2 октября 2025 года
🕢 Время: 19:00 - 22:00
📍 Место: Лофт на Газовой, 10ж

Участие бесплатное, но количество очных мест ограничено!
🔗 Ссылка на регистрацию
🔗 Ссылка на онлайн-трансляцию

Ждем вас на митапе!
6
Вот такую классную активность анонсируют. Сам Highload++ в представлении не нуждается - это топовая технологическая конференция (в этом году у меня как раз на нее приняли доклад про MAS LLM).

В опенсорс-трибуне участвовали в 2022-м с FEDOT-ом - мне понравилось, собирает интересные проекты и заинтересованную аудиторию. Здорово что возродили этот формат.
Так что если есть сильный проект - есть смысл попробовать!
🔥2
Forwarded from HighLoad++
Расскажите о своем решении IT-сообществу

На HighLoad++ 2025 мы проведем Open Source Трибуну — специальную секцию, где разработчики, тимлиды, СТО, архитекторы и комьюнити-энтузиасты представят свои проекты сообществу.

Если у вас есть:
🟣библиотека или инструмент, который упрощает жизнь другим разработчикам;
🟣решение для работы с высоконагруженными системами;
🟣сервис, утилита или фреймворк, которым может пользоваться комьюнити;
🟣проект, который уже нашел первых пользователей и продолжает развиваться ⤵️

.. подавайте заявку. Мы соберем проекты со всей страны, дадим экспертам и разработчикам проголосовать, а лучшие решения прозвучат на HighLoad++ 2025.

🔥 Участники, чьи заявки пройдут голосование, получат:
🟣билет на HighLoad++ 2025,
🟣возможность презентовать свое решение топовым разработчикам,
🟣признание и поддержку комьюнити,
🟣упоминание на медиаплощадках конференции.

🖐️ Мы ждем ваши заявки до 30 сентября, отправить которые можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Для тех кому интересно с утра прослушать про открытый код в индустрии и академии: в 10-00 на конференции РИФ начнётся дискуссия "Лидеры опенсорса: зачем компании делятся своими разработками бесплатно и как это развивает ИТ-рынок".

Трансляция:
https://rif2025.ru/
Зал "Лесной"

Я буду в роли модератора, среди участников:

- Сергей Бережной, директор по взаимодействию с разработчиками, Яндекс 
- Даниил Гаврилов, руководитель лаборатории научных исследований искусственного интеллекта T-Bank AI Research
- Анатолий Шипов, управляющий директор СберТеха, лидер платформы GitVerse
- Алексей Анисимов, заместитель руководителя Департамента  информационных технологий г. Москвы
- Владислав Куренков, руководитель научной группы "Адаптивные агенты" в Институте AIRI

UPD:

А вот и запись (ютуб-версия) + пересказ основных тезисов в "Российской газете".
👍10🔥31
Коллеги из МТС Web Services опубликовали пост на Хабре про инструменты для авто-генерации README и документации для открытых проектов:

https://habr.com/ru/companies/mws/articles/944316/

Приятно, что подборка начинается с нашего инструмента OSA. Также упомянуты ReadmeAI, Readme Forge, user-statistician, DeepWiki (и его сторонняя открытая реализация - deepwiki-open).

Инструменты довольно известные, но может кому-то будет полезно. Тот же дипвики довольно неплох в своей нише - быстрого обзора незнакомых проектов.
🔥10👍2
OpenScaler анонсирует опенсорс-конференцию в Нижнем Новгороде. Региональные мероприятия - это очень нужна вещь, так что всем заинтересованным рекомендуем поучаствовать!
🔥2
Forwarded from OpenScaler
🔥 Эта осень богата на события!

8 октября состоится наша ежегодная конференция OpenSourceDay'2025 в городе с самыми красивыми закатами, по мнению местных жителей. В Нижнем Новгороде!

Приглашаем принять участие в одном из главных офлайн событий для российского open source комьюнити!

Что будет на конференции?

Поговорим о том, как open source становится двигателем развития ИИ и цифровых технологий.
Разберем успешные кейсы Китая и России по созданию аналогов мировых open source платформ.
Поговорим с теми, кто уже создает открытые экосистемы и меняет правила игры.
Вы узнаете, куда идти новичку, как "найти своих" и получить оффер.
Разберем, какую роль играет open source и ИИ для студентов.
Нетворкинг и фуршет: знакомимся, общаемся с лидерами open source комьюнити, договариваемся о совместных проектах.

Место встречи:
📍 Б. Покровская, 18, пространство DKRT, 16:30–21:30

Регистрация обязательна, количество мест ограничено!

Присоединяйтесь и станьте частью нашего open source комьюнити!
🔥53
Научный опенсорс
Осенний Scientific Open Source Meetup - в октябре! Дорогие друзья и единомышленники! С радостью приглашаем вас на очередной Scientific Open Source Meetup, который пройдет 2 октября 2025 года с 19:00 до 22:00 в Санкт-Петербурге в уютном лофте на Газовой, 10ж.…
А тем временем, наш петербуржский митап приближается. Уже в этот четверг в 19-00 ждем всех в лофте на Газовой - доклады, интересный нетворкинг и угощения будут вас ждать - для участия успевайте зарегистрироваться!

Доклады будут про ИИ-агентов для разработки, идеи для хранения данных, платформы для виртуализации - и не только.

Ссылка на трансляцию будет тут ближе к делу.
🔥6
Научный опенсорс
Осенний Scientific Open Source Meetup - в октябре! Дорогие друзья и единомышленники! С радостью приглашаем вас на очередной Scientific Open Source Meetup, который пройдет 2 октября 2025 года с 19:00 до 22:00 в Санкт-Петербурге в уютном лофте на Газовой, 10ж.…
Наш митап уже завтра - время детализировать программу. Доклады будут следующие:

- Николай Никитин, руководитель группы научно-технического развития, Институт ИИ, ИТМО - “ИИ в разработке: как мы исследовали тренды и сценарии применения”
- Олег Чирухин, владелец продукта GigaIDE Cloud - “OpenSource и AI в GitVerse”
- Владимир Павлов, представитель технического комитета OpenScaler - “Внутренняя кухня OpenScaler: Свежий кейс о том, как открытый дистрибутив Linux усилиями сообщества и партнера лег в основу современного продуктового решения”
- Дмитрий Карловский, дракон гильдии Гипер Дев - “А что если… безумные идеи хранения данных”
- Станислав Чумаков, аспирант ФТИИ ИТМО - "Лучшие практики AI4Code. Кейс проекта ExperiPulse

Остались последние места на очную площадку - успевайте регистрироваться! А для тех, кто удаленно - трансляция будет тут.
🔥10
На недавно прошедшем митапе (видео докладов и фото скоро будут) докладчикам поступало много вопросов про пределы возможностей ИИ для разработки ПО.

В связи с этим, хочется упомянуть про интересное направление "моделей мира".
Коллеги из ICT Moscow на днях опубликовали как раз опубликовали обзор про таковые.

Помимо применимость для задач общего назначения - это довольно актуальное направление развития AI4Code.
Так, буквально на днях была выложена открытая Code World Model с 32B параметров - https://github.com/facebookresearch/cwm

В чем тут идея таких моделей в контексте работы с кодом (процитирую тут разбор) - в отличие от привычных LLM, они могут:
- Симулировать выполнение без запуска (даем ей код с аргументами, она предскажет результат)
- Планировать исправления (будет понимать, какие изменения к каким последствиям приведут)
- Работать как дебаггер (может прыгнуть к любой строке и предсказать состояние)

Направление пока скорее исследовательское, но результаты на бенчмарках уже вполне достойные:
"CWM offers strong performance on general coding and math tasks: it reaches pass@1 scores of 65.8 % on SWE-bench Verified (with test-time scaling), 68.6 % on LiveCodeBench, 96.6 % on Math-500, and 76.0 % on AIME 2024"
🔥94