Всё про Алгоритмы и Структуры данных – Telegram
Всё про Алгоритмы и Структуры данных
7.93K subscribers
329 photos
36 videos
5 files
2.8K links
Мы не претендуем на оригинальность контента, мы лишь собираем материал из открытых источников.

Ссылка: @Portal_v_IT

Сотрудничество, авторские права: @oleginc, @tatiana_inc

Канал на бирже: https://telega.in/c/structuredata
Download Telegram
От нестационарности к прогнозу: пайплайн анализа и моделирования временных рядов

Мы много предсказываем, классифицируем и прогнозируем. Впервые столкнувшись с последним и проведя исследование по этой теме, я столкнулся с большим количеством неструктурированной информации. Эта статья — одновременно описание моего пути и небольшое упорядоченное наставление по анализу и прогнозированию временных рядов, которое я сам хотел бы получить.

https://habr.com/ru/companies/sberbank/articles/954636/

Алгоритмы и Структуры данных
👍1
Seedream v4 — платный конкурент Nano Banana. Зачем он тогда нужен? И как использовать бесплатно + Гайды

Итак, Nano Banana — больше про быстрые и простые правки, бесплатно, но с водяными знаками и более строгими ограничениями. А Seedream v4 менее строг, а вдобавок предлагает качество 4K. Еще, можно закидывать в генерацию до 6 референсных изображений, хотя в Nano Banana можно загрузить до 10 референсов. Почему же креаторы предпочитают больше Nano Banana, а бизнесмены и агентства Seedream v4? Из-за целей и невидимого водяного знака.

https://habr.com/ru/articles/954638/

Алгоритмы и Структуры данных
1
Регулярная катастрофа и как её избежать. Подход к регулярным выражениям

Я Алексей, занимаюсь ассистентом в SberDevices. А в свободное время занимаюсь дискретной математикой, поэтому обожаю регулярные выражения — они по сути довольно близки к предмету моих интересов и делают код удобоваримее. В этой статье хочу рассказать о математике регулярных выражений и их интересной особенности, которая возникает внезапно.

Можно не писать самому регулярные выражения. Вообще не использовать их в коде. Но они всё равно там окажутся. Допустим, мы хотим написать проверку email-адреса, чтобы пускать людей с нужным корпоративным аккаунтом. Написали заглушку на FastAPI:

https://habr.com/ru/companies/sberdevices/articles/954296/

Алгоритмы и Структуры данных
Делим кастрюлю компота на ноль. Что получится? Спойлер: ничего хорошего

Одним томным вечером наши разработчики собрались в баре на тимбилдинг и подняли хрестоматийные вопросы: почему нельзя делить на ноль и почему ноль в степени ноль зачастую принимается за единицу. О том, что делить на ноль нельзя, всем известно ещё со школы. На деле это не просто правило, а фундаментальный запрет. Пример простой:

https://habr.com/ru/companies/yoomoney/articles/954946/

Алгоритмы и Структуры данных
Покодим на Yandex Cup?

Яндекс открыл регистрацию на Yandex Cup — чемпионат по программированию с призовым фондом 12 млн рублей и финалом в Стамбуле!

На выбор — шесть направлений, фанатов классического спортивного программирования ждёт трек «Алгоритм».

Главное:
— регистрация: до 29 октября
— пробный тур онлайн: 20–29 октября
— квалификация онлайн: 2 ноября

Офлайн-финал соберёт 180 программистов 5–7 декабря в Стамбуле. Лучшие участники получат призы от 100 тысяч рублей и возможность пройти собеседование в Яндекс по упрощённой схеме.

Регистрация и примеры задач на сайте.
👍1🤯1
Вышел Python 3.14. Насколько он быстр?

В ноябре 2024 года я написал пост «Действительно ли Python такой медленный?», в котором протестировал множество версий Python и отметил стабильный прогресс производительности языка.

Сегодня девятое октября 2025 года, прошла всего пара дней после официального релиза Python 3.14. Давайте снова запустим бенчмарки, чтобы проверить, насколько быстра новая версия Python!

https://habr.com/ru/articles/954996/

Алгоритмы и Структуры данных
🤯1
Scaled Rank Fusion — объединяет значения из нескольких списков с учётом масштаба

Семейство методов Rank Fusion включает различные алгоритмы объединения нескольких ранжированных списков результатов в один улучшенный ранжированный список с целью повышения качества и надежности итогового ранжирования.

Основная идея — агрегировать информацию из разных систем или моделей, которые могут по-разному оценивать релевантность документов.

Rank Fusion широко применяется в информационном поиске, мультимедийном поиске, гибридных системах поиска, системах на основе модели Retrieval Augmented Generation (RAG), а также в задачах ансамблевого обучения.

Таким образом, Rank Fusion — это семейство алгоритмов разной сложности и подходов, но с единой целью: объединить несколько списков результатов в один, более релевантный и устойчивый к ошибкам ранжирования.

https://habr.com/ru/articles/955050/

Алгоритмы и Структуры данных
👍1
Внедрить ИИ-ть или рассказать, доказать и показать

Меня зовут Алексей, и я руковожу направлением искусственного интеллекта в одном из крупнейших федеральных холдингов России — более 15k сотрудников, работающих от Калининграда до Владивостока. Компания — лидер в своей отрасли, обладает развитой автоматизацией, но не является IT-компанией. И это меняет всё.

Сегодня я хочу поделиться не просто тем, что мы сделали — а как мы это сделали. Потому что в крупной организации внедрение ИИ — это не про алгоритмы, а про людей, их страхи, их восприятие и готовность к изменениям.

Если ты будешь выполнять свою работу неверно — от того, как ты внедряешь ИИ в компании с большим количеством людей — ты будешь сеять настроение и отношения к искусственному интеллекту. А это может определить, будет ли ИИ в вашей компании развиваться — или останется "магией", которой боятся.

https://habr.com/ru/articles/955414/

Алгоритмы и Структуры данных
Как написать собственный класс линейной регрессии для маленьких

В этой статье показан простой способ создания собственного класса линейной регрессии с использованием стохастического градиентного спуска. Будет представлен легкий и понятный код с реализацией основных методов: fit, predict и score. Статья будет полезна тем, кто хочет вкратце разобраться, как работает класс LinearRegression из библиотеки sklearn. Также материал подходит для участников курса программирования "Школа 21".

https://habr.com/ru/articles/955520/

Алгоритмы и Структуры данных
👍1
TorusCSIDH: постквантовый аналог ECDSA с топологическим критерием безопасности

В этой статье я представляю принципиально новый подход к постквантовой криптографии — TorusCSIDH, где безопасность определяется не отсутствием структуры, а наличием правильной геометрической структуры, вдохновлённой топологией тора.

https://habr.com/ru/articles/955594/

Алгоритмы и Структуры данных
👍1
TorusCSIDH: постквантовая криптография для Bitcoin уже сегодня


**Мы представляем TorusCSIDH — полностью реализуемую постквантовую криптосистему на основе изогений суперсингулярных кривых. Она совместима с Bitcoin, не требует хардфорка и защищена не только алгеброй, но и оригинальным геометрическим критерием, основанным на структуре графа изогений.

Введение: квантовая угроза для Bitcoin
Сегодня Bitcoin использует ECDSA — алгоритм, основанный на эллиптических кривых. Его безопасность держится на сложности задачи дискретного логарифмирования. Однако в 1994 году Питер Шор показал, что на квантовом компьютере эта задача решается за полиномиальное время.
Как только появится достаточно мощный квантовый компьютер, все средства на адресах с известными публичными ключами окажутся под угрозой. Это не теория — это вопрос времени.

https://habr.com/ru/articles/955640/

Алгоритмы и Структуры данных
🔥1
Строим удобные автомобильные маршруты

Хороший автомобильный маршрут из точки А в точку Б должен, с одной стороны, быть кратчайшим, а с другой — удобным для водителя. Как правильно вычислить время в пути мы уже рассказали, теперь — об удобстве маршрутов: что это такое, как его измерить и как мы его повышали.

https://habr.com/ru/companies/2gis/articles/758688/

Алгоритмы и Структуры данных
Вывод оптимального алгоритма с помощью формализма Бёрда-Меертенса

Некоторые оптимальные алгоритмы, оказывается, можно вывести из неоптимальных, пользуясь эквивалентными преобразованиями алгоритма. Бёрд и Меертенс разработали формализм, который устанавливает свойства функций высшего порядка map, fold, scan, позволяющие преобразовывать алгоритмы в эквивалентные. (См. также на Вики). Ниже представлен вольный перевод статьи Бёрда.

https://habr.com/ru/articles/758810/

Алгоритмы и Структуры данных
1
Что такое арбитраж? Передовые технологии торговли на примере криптобиржи

Благодаря технологии блокчейн, криптовалютам, криптобиржам, приоритеты людей, компаний и даже стран меняются прямо на наших глазах. Один знакомый разработчик из этой сферы однажды сказал мне, что не возлагает больших надежд на все это, несмотря на перспективы и хорошую оплату. Однако присутствует некое чувство неуверенности. "Водопровод, — говорит он, — казалось бы, одна из самых простейших технологий, но как она изменила жизнь. Когда в конце 90-х в моей небольшой деревне в моем доме появилась вода, которую не нужно было добывать большим трудом, жизнь действительно стала на порядок лучше и приятнее." Блокчейн, по его словам, сейчас является чем-то вроде того же водопровода - он обязательно изменит жизнь к лучшему, но сколько труда и времени для этого понадобится?

https://habr.com/ru/articles/758476/

Алгоритмы и Структуры данных
👍1
Множественная кусочно-постоянная регрессия

Задача восстановления зависимости некоторой величины от ряда признаков распространена в анализе данных. Кусочно-постоянная регрессия будет полезна, если требуется выделить характерные диапазоны изменения интегрального признака (взвешенной суммы признаков), чтобы рассмотреть отдельно точки, принадлежащие этим диапазонам. Таким образом, получив информацию о распределении точек внутри каждого из них и исследовав зависимость от прочих факторов, можно сделать выводы о сегментированных данных.

https://habr.com/ru/articles/758262/

Алгоритмы и Структуры данных
Python шпильки: как заменить многоэтажные if-else на изящный словарь функций

Представьте: перед вами 200 строк кода, сплошь состоящих из if-elif-else конструкций. Каждый новый condition — еще одна ветка, еще сложнее читать, еще страшнее поддерживать. Знакомо?

В этой статье я покажу изящный прием, который превратит ваши многоэтажные условия в плоский, легко расширяемый и тестируемый код. Всего за 5 минут вы научитесь писать код, который коллеги будут показывать как пример для подражания.

https://habr.com/ru/articles/956020/

Алгоритмы и Структуры данных
Просто о сложном: Как работают нейросети

В статье есть упрощения, утрирования и технические неточности, это сделано намеренно, для облегчения понимания, т.к. статья не для профессионалов, хотя и они могут найти статью полезной, если захотят кому-то объяснить свою работу простыми словами.

Я ни в коем случае не хочу принижать профессионализм тех людей, которые трудятся в этой области, это действительно надо уметь и этим действительно занимаются профессионалы.

https://habr.com/ru/articles/956194/

Алгоритмы и Структуры данных
👍1
Игра на опережение с LLM: с чем вышли на Q4 (анализ 134 195 научных работ 2025 года)

Чтобы понять, какие технологии будут определять рынок завтра, компании опираются на прогнозы/отчёты аналитиков или (за рубежом) анализируют патенты. Но есть источник, который часто опережает и патенты - научные публикации. Именно в лабораториях и университетах появляются методы, которые через год-два становятся основой RnD бизнеса, а затем - реальными продуктами.

Однако этот потенциал почти не используется: академические работы компании анализируют крайне редко (и даже если это происходит – это ручной труд), обычно просто читают как теорию. Мой подход как раз в том, чтобы искать в статьях ранние сигналы практической применимости и инсайты для бизнеса: многие статьи уже содержат результаты A/B-тестов и конкретные метрики качества (RMSE, AUC, NDCG). В итоге можем не просто отследить появление нового метода, но и сразу оценить его потенциальный эффект.

https://habr.com/ru/articles/956220/

Алгоритмы и Структуры данных
🔥2
Предобусловливание и импульс в оптимизации: взгляд на алгоритмы PHB/PN от исследователей Яндекса

Современные задачи оптимизации в машинном обучении часто оказываются плохо обусловленными — грубо говоря, их ландшафт имеет долины с резко различающейся кривизной. В таких случаях методы на основе градиентного спуска сходятся медленно: шаг, выбранный для устойчивости на одном участке, оказывается слишком малым на другом.

Для ускорения сходимости широко применяются методы с механизмом импульса (momentum): классический метод Поляка — Heavy Ball (HB) — и метод Нестерова (ускоренный градиент). Оба эти метода используют идею накапливать «инерцию» градиента, благодаря чему могут двигаться по направлению оптимума быстрее обычного градиентного спуска.

https://habr.com/ru/companies/yandex/articles/955922/

Алгоритмы и Структуры данных
Как перестать верить в сказки и начать доставлять вовремя?

Меня зовут Денис, и я руковожу продуктами доставки. Сегодня я хочу рассказать вам об одной из самых больных тем в нашем деле - о вранье со сроками доставки.

Я не буду придумывать забавные аналогии, чтобы разукрасить эту проблему. Реальность и так достаточно горькая: постоянные опоздания бьют по деньгам, изматывают нервы и безвозвратно губят репутацию.

https://habr.com/ru/articles/956228/

Алгоритмы и Структуры данных
Рендеринг трёхмерных фрактальных множеств: от губки Менгера до Мандельбокса, часть 2

Меня всё также зовут Андрей Гринблат, и в первой части я начал рассказывать о такой технологии, как ray marching, и о нормированных пространствах. В этой части начнём с построения простых геометрических фракталов — губки Менгера и тетраэдра Серпинского, затем построим IFS-фракталы, рассмотрим технику орбитальных ловушек, и в завершение построим фрактал «Ящик Мандельброта», или Мандельбокс.

https://habr.com/ru/companies/sberbank/articles/954726/

Алгоритмы и Структуры данных