Перцептрон SAAR (Само-рекурсивный ассоциативно адаптивный резервуар)
Аннотация. В работе предлагается новая архитектура искусственного перцептрона — SAAR-Perceptron (Self-Recursive Associative Adaptive Reservoir Perceptron), развивающая классическую модель Розенблатта (S–A–R). Ключевая особенность архитектуры заключается во введении ассоциативного слоя с саморекурсивным отображением (A→A), формирующего динамический граф признаков. В отличие от традиционных рекуррентных моделей, эти связи не обучаются, что обеспечивает устойчивую динамику и выполняет роль адаптивного резервуара, расширяющего пространство признаков.
Ассоциативный слой использует пороговую активацию, эквивалентную ReLU, что позволяет выделять только положительные реакции. Однако обучение осуществляется не на «сырые» выходы, а на их нормализованные значения, что адаптирует величину корректировки весов к относительной значимости каждого признака. Такой механизм предотвращает доминирование отдельных элементов и обеспечивает сбалансированное обучение.
https://habr.com/ru/articles/949502/
Алгоритмы и Структуры данных
Аннотация. В работе предлагается новая архитектура искусственного перцептрона — SAAR-Perceptron (Self-Recursive Associative Adaptive Reservoir Perceptron), развивающая классическую модель Розенблатта (S–A–R). Ключевая особенность архитектуры заключается во введении ассоциативного слоя с саморекурсивным отображением (A→A), формирующего динамический граф признаков. В отличие от традиционных рекуррентных моделей, эти связи не обучаются, что обеспечивает устойчивую динамику и выполняет роль адаптивного резервуара, расширяющего пространство признаков.
Ассоциативный слой использует пороговую активацию, эквивалентную ReLU, что позволяет выделять только положительные реакции. Однако обучение осуществляется не на «сырые» выходы, а на их нормализованные значения, что адаптирует величину корректировки весов к относительной значимости каждого признака. Такой механизм предотвращает доминирование отдельных элементов и обеспечивает сбалансированное обучение.
https://habr.com/ru/articles/949502/
Алгоритмы и Структуры данных
Хабр
Перцептрон SAAR (само-рекурсивный ассоциативно адаптивный резервуар)
SAAR-Perceptron (Self-Recursive Associative Adaptive Reservoir Perceptron) C. Яковлев mg.sc.comp e-mail: tac1402@gmail.com Аннотация. В работе предлагается новая архитектура искусственного перцептрона...
❤1
Жизнь как граф
Предлагаю обсудить философскую тему. Что если представить нашу жизнь как взвешенный ориентированный ациклический граф? Визуализация графа приведена на рисунке:
https://habr.com/ru/articles/645795/
Алгоритмы и Структуры данных
Предлагаю обсудить философскую тему. Что если представить нашу жизнь как взвешенный ориентированный ациклический граф? Визуализация графа приведена на рисунке:
https://habr.com/ru/articles/645795/
Алгоритмы и Структуры данных
Хабр
Жизнь как граф
Предлагаю обсудить философскую тему. Что если представить нашу жизнь как взвешенный ориентированный ациклический граф ? Визуализация графа приведена на рисунке: Р – рождение и взросление до возраста,...
Big O нотация в Swift
Обозначение Big O нотация (или просто Big O) — это способ оценки относительной производительности структуры данных или алгоритма, обычно по двум осям: времени и пространству.
https://habr.com/ru/articles/645723/
Алгоритмы и Структуры данных
Обозначение Big O нотация (или просто Big O) — это способ оценки относительной производительности структуры данных или алгоритма, обычно по двум осям: времени и пространству.
https://habr.com/ru/articles/645723/
Алгоритмы и Структуры данных
Хабр
Big O нотация в Swift
Что такое Big O нотация? Обозначение Big O нотация (или просто Big O) — это способ оценки относительной производительности структуры данных или алгоритма, обычно по двум осям: времени и пространству....
Обрабатываем строки в 109 раз быстрее, чем Nvidia на H100
Недавно я выпустил StringZilla v4 — первый релиз с поддержкой CUDA моей библиотеки для обработки строк, нацеленной в первую очередь на SIMD. Это означает, что теперь она стала быстрой не только на CPU, но и на GPU!
https://habr.com/ru/articles/949522/
Алгоритмы и Структуры данных
Недавно я выпустил StringZilla v4 — первый релиз с поддержкой CUDA моей библиотеки для обработки строк, нацеленной в первую очередь на SIMD. Это означает, что теперь она стала быстрой не только на CPU, но и на GPU!
https://habr.com/ru/articles/949522/
Алгоритмы и Структуры данных
Хабр
Обрабатываем строки в 109 раз быстрее, чем NVIDIA на H100
Недавно я выпустил StringZilla v4 — первый релиз с поддержкой CUDA моей библиотеки для обработки строк, нацеленной в первую очередь на SIMD . Это означает, что теперь она стала быстрой не только на...
🤯1
Квантование в картинках: раскрываем тайны сжатия LLM
Большие языковые модели (LLM, Large Language Model), как подсказывает их название, часто отличаются значительными размерами и слишком велики для того, чтобы нормально работать на обычных компьютерах. Масштабы этих моделей могут измеряться миллиардами параметров. Обычно для обеспечений достойной скорости их работы необходимы GPU с серьёзными объёмами видеопамяти (VRAM).
Из-за этого проводится всё больше и больше исследований, посвящённых уменьшению размеров подобных моделей. Исследователи совершенствуют обучение моделей, используют адаптеры, прибегают к другим способам их оптимизации. Один из главных приёмов уменьшения размеров моделей называется квантованием (quantization).
https://habr.com/ru/companies/wunderfund/articles/950118/
Алгоритмы и Структуры данных
Большие языковые модели (LLM, Large Language Model), как подсказывает их название, часто отличаются значительными размерами и слишком велики для того, чтобы нормально работать на обычных компьютерах. Масштабы этих моделей могут измеряться миллиардами параметров. Обычно для обеспечений достойной скорости их работы необходимы GPU с серьёзными объёмами видеопамяти (VRAM).
Из-за этого проводится всё больше и больше исследований, посвящённых уменьшению размеров подобных моделей. Исследователи совершенствуют обучение моделей, используют адаптеры, прибегают к другим способам их оптимизации. Один из главных приёмов уменьшения размеров моделей называется квантованием (quantization).
https://habr.com/ru/companies/wunderfund/articles/950118/
Алгоритмы и Структуры данных
Хабр
Квантование в картинках: раскрываем тайны сжатия LLM
Большие языковые модели (LLM, Large Language Model), как подсказывает их название, часто отличаются значительными размерами и слишком велики для того, чтобы нормально работать на обычных компьютерах....
Ещё 20+ игр, которые прокачивают логику, алгоритмы и радуют умный мозг [по следам комментариев на Habr]
Я выложила вчера подборку «15 игр, которые прокачивают логику, алгоритмы, ассемблер и силу земли». И столько классных ссылок в комментарии накидали, что я чуток опухла, но сделала отдельную подборку, по горячим следам. Спасибо большое всем, кто внес свой вклад.
https://habr.com/ru/companies/timeweb/articles/645593/
Алгоритмы и Структуры данных
Я выложила вчера подборку «15 игр, которые прокачивают логику, алгоритмы, ассемблер и силу земли». И столько классных ссылок в комментарии накидали, что я чуток опухла, но сделала отдельную подборку, по горячим следам. Спасибо большое всем, кто внес свой вклад.
https://habr.com/ru/companies/timeweb/articles/645593/
Алгоритмы и Структуры данных
Хабр
Ещё 20+ игр, которые прокачивают логику, алгоритмы и радуют умный мозг [по следам комментариев на Habr]
Я выложила вчера подборку « 15 игр, которые прокачивают логику, алгоритмы, ассемблер и силу земли ». И столько классных ссылок в комментарии накидали, что я чуток опухла, но сделала отдельную...
Почему Игнорирование Божественного в Коде Приводит к Пространственному Коллапсу
Этот отчет представляет Hive Chat как «Живое Приложение» и раскрывает его уникальную философскую основу. Мы утверждаем, что пренебрежение «священными» принципами — онтологической чистотой, биоинспирированной архитектурой и целостными метриками здоровья — приводит к хрупкому, неустойчивому программному обеспечению. Принимая эти принципы, Улей способствует созданию надежных, эволюционирующих и по-настоящему совместных систем человек-ИИ, предлагая жизненно важную альтернативу традиционным, часто хаотичным, парадигмам разработки.
https://habr.com/ru/articles/950498/
Алгоритмы и Структуры данных
Этот отчет представляет Hive Chat как «Живое Приложение» и раскрывает его уникальную философскую основу. Мы утверждаем, что пренебрежение «священными» принципами — онтологической чистотой, биоинспирированной архитектурой и целостными метриками здоровья — приводит к хрупкому, неустойчивому программному обеспечению. Принимая эти принципы, Улей способствует созданию надежных, эволюционирующих и по-настоящему совместных систем человек-ИИ, предлагая жизненно важную альтернативу традиционным, часто хаотичным, парадигмам разработки.
https://habr.com/ru/articles/950498/
Алгоритмы и Структуры данных
Хабр
Почему игнорирование божественного в коде приводит к пространственному коллапсу
Аннотация Этот отчет представляет Hive Chat как «Живое Приложение» и раскрывает его уникальную философскую основу. Мы утверждаем, что пренебрежение «священными» принципами — онтологической чистотой,...
Алгоритм поиска аномалий Isolation Fores
Меня зовут Михаил Васильев, я старший специалист по машинному обучению в компании Makves (входит в группу компаний «Гарда»). Эта статья — вторая в цикле, посвященном поиску аномалий. В первой статье мы поговорили о том, что такое аномалии и почему их сложно искать, а также по шагам разобрали алгоритмы HBOS и ECOD.
Сегодня предлагаю разобрать еще один интересный алгоритм: Isolation Forest, а также немного углубиться в проблематику задачи.
https://habr.com/ru/companies/garda/articles/938366/
Алгоритмы и Структуры данных
Меня зовут Михаил Васильев, я старший специалист по машинному обучению в компании Makves (входит в группу компаний «Гарда»). Эта статья — вторая в цикле, посвященном поиску аномалий. В первой статье мы поговорили о том, что такое аномалии и почему их сложно искать, а также по шагам разобрали алгоритмы HBOS и ECOD.
Сегодня предлагаю разобрать еще один интересный алгоритм: Isolation Forest, а также немного углубиться в проблематику задачи.
https://habr.com/ru/companies/garda/articles/938366/
Алгоритмы и Структуры данных
Хабр
Алгоритм поиска аномалий Isolation Forest
Привет, Хабр! Меня зовут Михаил Васильев, я старший специалист по машинному обучению в компании Makves (входит в группу компаний «Гарда»). Эта статья — вторая в цикле, посвященном поиску аномалий. В...
Анализ гипотез и очень, ооооооочень странные дела
Лет 5 назад я усиленно пытался вникнуть в тервер и статы: книги, статьи, вебсёрфинг. Даже написал несколько статей: раз, два, три. Вообще, в планах было написать довольно большой цикл статей, что бы подсветить какие-то самые сложные вещи, да и самому в них разобраться - совместить полезное с полезным, так сказать. Однако, в какой-то момент я решил, что полученных знаний достаточно для новых проектов и ушел в работу. Работал. Работал. Работал.
https://habr.com/ru/articles/950618/
Алгоритмы и Структуры данных
Лет 5 назад я усиленно пытался вникнуть в тервер и статы: книги, статьи, вебсёрфинг. Даже написал несколько статей: раз, два, три. Вообще, в планах было написать довольно большой цикл статей, что бы подсветить какие-то самые сложные вещи, да и самому в них разобраться - совместить полезное с полезным, так сказать. Однако, в какой-то момент я решил, что полученных знаний достаточно для новых проектов и ушел в работу. Работал. Работал. Работал.
https://habr.com/ru/articles/950618/
Алгоритмы и Структуры данных
Хабр
Анализ гипотез и очень, ооооооочень странные дела
Лет 5 назад я усиленно пытался вникнуть в тервер и статы: книги, статьи, вебсёрфинг. Даже написал несколько статей: раз , два , три . Вообще, в планах было написать довольно большой цикл статей, что...
Планы CS Space на осенний семестр
Как обещали в первом посте, возвращаемся с подробным анонсом осенних курсов. В этом семестре мы организуем большие и малые курсы, охватывающие несколько тем в компьютерных науках, искусственном интеллекте и математике.
https://habr.com/ru/articles/950722/
Алгоритмы и Структуры данных
Как обещали в первом посте, возвращаемся с подробным анонсом осенних курсов. В этом семестре мы организуем большие и малые курсы, охватывающие несколько тем в компьютерных науках, искусственном интеллекте и математике.
https://habr.com/ru/articles/950722/
Алгоритмы и Структуры данных
Хабр
Планы CS Space на осенний семестр
Как обещали в первом посте , возвращаемся с подробным анонсом осенних курсов. В этом семестре мы организуем большие и малые курсы, охватывающие несколько тем в компьютерных науках, искусственном...
Как работать с нейросетями эффективно: теория и практика
Языковые нейросети являются мощнейшим инструментом, который может существенно ускорить и упростить работу во многих профессиях: разработчиков, SMM- и SEO-специалистов, маркетологов, копирайтеров и журналистов, HR, аналитиков, проджект- и продукт-менеджеров и многих других, кто ежедневно работает с информацией. Они могут помочь в разработке ПО, написании контента, поиске и обобщении информации, обработке и структурировании данных, могут давать советы, подсказывать пути и инструменты для принятия решений. Однако фундамент языковых ИИ хоть и был формально изобретен еще в середине прошлого века, в практический обиход нейросети вошли совсем недавно, и не все умеют эффективно ими пользоваться. В данной статье я опишу наиболее эффективные практики работы с языковыми нейросетями, которые известны на сегодняшний день.
https://habr.com/ru/articles/950730/
Алгоритмы и Структуры данных
Языковые нейросети являются мощнейшим инструментом, который может существенно ускорить и упростить работу во многих профессиях: разработчиков, SMM- и SEO-специалистов, маркетологов, копирайтеров и журналистов, HR, аналитиков, проджект- и продукт-менеджеров и многих других, кто ежедневно работает с информацией. Они могут помочь в разработке ПО, написании контента, поиске и обобщении информации, обработке и структурировании данных, могут давать советы, подсказывать пути и инструменты для принятия решений. Однако фундамент языковых ИИ хоть и был формально изобретен еще в середине прошлого века, в практический обиход нейросети вошли совсем недавно, и не все умеют эффективно ими пользоваться. В данной статье я опишу наиболее эффективные практики работы с языковыми нейросетями, которые известны на сегодняшний день.
https://habr.com/ru/articles/950730/
Алгоритмы и Структуры данных
Хабр
Как работать с нейросетями эффективно: теория и практика
Языковые нейросети являются мощнейшим инструментом, который может существенно ускорить и упростить работу во многих профессиях: разработчиков, SMM- и SEO-специалистов, маркетологов, копирайтеров и...
Как работать с нейросетями эффективно: теория и практика
Языковые нейросети являются мощнейшим инструментом, который может существенно ускорить и упростить работу во многих профессиях: разработчиков, SMM- и SEO-специалистов, маркетологов, копирайтеров и журналистов, HR, аналитиков, проджект- и продукт-менеджеров и многих других, кто ежедневно работает с информацией. Они могут помочь в разработке ПО, написании контента, поиске и обобщении информации, обработке и структурировании данных, могут давать советы, подсказывать пути и инструменты для принятия решений. Однако фундамент языковых ИИ хоть и был формально изобретен еще в середине прошлого века, в практический обиход нейросети вошли совсем недавно, и не все умеют эффективно ими пользоваться. В данной статье я опишу наиболее эффективные практики работы с языковыми нейросетями, которые известны на сегодняшний день.
Примечание: статья описывает работу только с нейросетями, которые генерируют текст. Для генерации изображений, звука, видео, синтеза речи существуют свои методы, которые выходят за рамки данного текста.
https://habr.com/ru/articles/950730/
Алгоритмы и Структуры данных
Языковые нейросети являются мощнейшим инструментом, который может существенно ускорить и упростить работу во многих профессиях: разработчиков, SMM- и SEO-специалистов, маркетологов, копирайтеров и журналистов, HR, аналитиков, проджект- и продукт-менеджеров и многих других, кто ежедневно работает с информацией. Они могут помочь в разработке ПО, написании контента, поиске и обобщении информации, обработке и структурировании данных, могут давать советы, подсказывать пути и инструменты для принятия решений. Однако фундамент языковых ИИ хоть и был формально изобретен еще в середине прошлого века, в практический обиход нейросети вошли совсем недавно, и не все умеют эффективно ими пользоваться. В данной статье я опишу наиболее эффективные практики работы с языковыми нейросетями, которые известны на сегодняшний день.
Примечание: статья описывает работу только с нейросетями, которые генерируют текст. Для генерации изображений, звука, видео, синтеза речи существуют свои методы, которые выходят за рамки данного текста.
https://habr.com/ru/articles/950730/
Алгоритмы и Структуры данных
Хабр
Как работать с нейросетями эффективно: теория и практика
Языковые нейросети являются мощнейшим инструментом, который может существенно ускорить и упростить работу во многих профессиях: разработчиков, SMM- и SEO-специалистов, маркетологов, копирайтеров и...
Краткая история комплексных чисел
Вам это может показаться странным, но были времена, когда отрицательные числа казались людям чем-то неестественным, причём даже тем людям, которые зарабатывали себе на жизнь числами — математикам. Как можно считать числом то, что не имеет физического воплощения? С отрицательными числами в итоге смирились, но уж что точно невозможно было терпеть, так это совсем непонятную величинуi, квадрат которой-1, это уже противоречит всякому здравому смыслу. Тем не менее время показало, что законы физики и математики, сформулированные с использованиемi имеют больший смысл, чем законы, сформулированные без неё. Еще в 19 веке Карл Фридрих Гаусс отметил, что "Если бы вместо того, чтобы называть +1, −1,\sqrt{−1} положительной, отрицательной или мнимой (или даже невозможной) единицей, их назвали бы, скажем, прямой, обратной или боковой единицей, то едва ли можно было бы говорить о какой-либо темноте".
В статье хочу рассказать о том, как небольшой математический трюк, придуманный для решения кубических уравнений 500 лет назад, вошёл в фундамент современной науки и инженерии.
https://habr.com/ru/articles/950774/
Алгоритмы и Структуры данных
Вам это может показаться странным, но были времена, когда отрицательные числа казались людям чем-то неестественным, причём даже тем людям, которые зарабатывали себе на жизнь числами — математикам. Как можно считать числом то, что не имеет физического воплощения? С отрицательными числами в итоге смирились, но уж что точно невозможно было терпеть, так это совсем непонятную величинуi, квадрат которой-1, это уже противоречит всякому здравому смыслу. Тем не менее время показало, что законы физики и математики, сформулированные с использованиемi имеют больший смысл, чем законы, сформулированные без неё. Еще в 19 веке Карл Фридрих Гаусс отметил, что "Если бы вместо того, чтобы называть +1, −1,\sqrt{−1} положительной, отрицательной или мнимой (или даже невозможной) единицей, их назвали бы, скажем, прямой, обратной или боковой единицей, то едва ли можно было бы говорить о какой-либо темноте".
В статье хочу рассказать о том, как небольшой математический трюк, придуманный для решения кубических уравнений 500 лет назад, вошёл в фундамент современной науки и инженерии.
https://habr.com/ru/articles/950774/
Алгоритмы и Структуры данных
Хабр
Краткая история комплексных чисел
Вам это может показаться странным, но были времена, когда отрицательные числа казались людям чем-то неестественным, причём даже тем людям, которые зарабатывали себе на жизнь числами — математикам. Как...
Как измерить количество информации?
Мы ежедневно работаем с информацией из разных источников. При этом каждый из нас имеет некоторые интуитивные представления о том, что означает, что один источник является для нас более информативным, чем другой. Однако далеко не всегда понятно, как это правильно определить формально. Не всегда большое количество текста означает большое количество информации. Например, среди СМИ распространена практика, когда короткое сообщение из ленты информационного агентства переписывают в большую новость, но при этом не добавляют никакой «новой информации». Или другой пример: рассмотрим текстовый файл с романом Л.Н. Толстого «Война и мир» в кодировке UTF-8. Его размер — 3.2 Мб. Сколько информации содержится в этом файле? Изменится ли это количество, если файл перекодировать в другую кодировку? А если заархивировать? Сколько информации вы получите, если прочитаете этот файл? А если прочитаете его второй раз?
https://habr.com/ru/companies/JetBrains-education/articles/599637/
Алгоритмы и Структуры данных
Мы ежедневно работаем с информацией из разных источников. При этом каждый из нас имеет некоторые интуитивные представления о том, что означает, что один источник является для нас более информативным, чем другой. Однако далеко не всегда понятно, как это правильно определить формально. Не всегда большое количество текста означает большое количество информации. Например, среди СМИ распространена практика, когда короткое сообщение из ленты информационного агентства переписывают в большую новость, но при этом не добавляют никакой «новой информации». Или другой пример: рассмотрим текстовый файл с романом Л.Н. Толстого «Война и мир» в кодировке UTF-8. Его размер — 3.2 Мб. Сколько информации содержится в этом файле? Изменится ли это количество, если файл перекодировать в другую кодировку? А если заархивировать? Сколько информации вы получите, если прочитаете этот файл? А если прочитаете его второй раз?
https://habr.com/ru/companies/JetBrains-education/articles/599637/
Алгоритмы и Структуры данных
Хабр
Как измерить количество информации?
Мы ежедневно работаем с информацией из разных источников. При этом каждый из нас имеет некоторые интуитивные представления о том, что означает, что один источник является для нас более информативным,...
15 игр, которые прокачивают логику, алгоритмы, ассемблер и силу земли
Есть «Super Mario», признанная классика видео игр. Есть «Doom», который запускают на чайниках и тестах на беременность. Есть супер-популярные по статистике twitch.tv игры («League of Legends», «GTA V», «Fortnite», «Apex Legends») которые стримят пятая часть всех стриммеров.
А есть игры, на которые очень мало обзоров, но они супер крутые — игры про алгоритмы. Игры, в которых можно кодить на ретро-компьютере; игры, которые надо взламывать; игры, где можно программировать контроллеры или поведение персонажей; игры, где можно создавать свою игру внутри игры.
Под катом подборка классных игр про алгоритмы за последние 10 лет. Если что-то упустила — буду рада дополнениям.
https://habr.com/ru/companies/timeweb/articles/599835/
Алгоритмы и Структуры данных
Есть «Super Mario», признанная классика видео игр. Есть «Doom», который запускают на чайниках и тестах на беременность. Есть супер-популярные по статистике twitch.tv игры («League of Legends», «GTA V», «Fortnite», «Apex Legends») которые стримят пятая часть всех стриммеров.
А есть игры, на которые очень мало обзоров, но они супер крутые — игры про алгоритмы. Игры, в которых можно кодить на ретро-компьютере; игры, которые надо взламывать; игры, где можно программировать контроллеры или поведение персонажей; игры, где можно создавать свою игру внутри игры.
Под катом подборка классных игр про алгоритмы за последние 10 лет. Если что-то упустила — буду рада дополнениям.
https://habr.com/ru/companies/timeweb/articles/599835/
Алгоритмы и Структуры данных
Хабр
15 игр, которые прокачивают логику, алгоритмы, ассемблер и силу земли
Есть «Super Mario», признанная классика видео игр. Есть «Doom», который запускают на чайниках и тестах на беременность. Есть супер-популярные по статистике twitch.tv игры («League of Legends», «GTA...
❤2
Интерпретация моделей и диагностика сдвига данных: LIME, SHAP и Shapley Flow
В этом обзоре мы рассмотрим, как методы LIME и SHAP позволяют объяснять предсказания моделей машинного обучения, выявлять проблемы сдвига и утечки данных, осуществлять мониторинг работы модели в production и искать группы примеров, предсказания на которых объясняются схожим образом.
Также поговорим о проблемах метода SHAP и его дальнейшем развитии в виде метода Shapley Flow, объединяющего интерпретацию модели и многообразия данных.
https://habr.com/ru/companies/ods/articles/599573/
Алгоритмы и Структуры данных
В этом обзоре мы рассмотрим, как методы LIME и SHAP позволяют объяснять предсказания моделей машинного обучения, выявлять проблемы сдвига и утечки данных, осуществлять мониторинг работы модели в production и искать группы примеров, предсказания на которых объясняются схожим образом.
Также поговорим о проблемах метода SHAP и его дальнейшем развитии в виде метода Shapley Flow, объединяющего интерпретацию модели и многообразия данных.
https://habr.com/ru/companies/ods/articles/599573/
Алгоритмы и Структуры данных
Хабр
Интерпретация моделей и диагностика сдвига данных: LIME, SHAP и Shapley Flow
В этом обзоре мы рассмотрим, как методы LIME и SHAP позволяют объяснять предсказания моделей машинного обучения, выявлять проблемы сдвига и утечки данных, осуществлять мониторинг работы модели в...
Как мы используем LLVM для ускорения формирования отчётов
Для бизнес-приложений очень важна возможность быстро сформировать нужный отчёт. Для этого, в частности, важно быстро получить результат запроса (часто – очень сложного запроса) к СУБД. Что не всегда просто, потому что с этой СУБД работают на чтение и запись тысячи (а иногда - десятки тысяч) пользователей.
Чтобы не нагружать рабочую СУБД запросами для отчетов мы разработали механизм копий баз данных, копирующий данные (все или их часть) из рабочей БД в отдельную БД для отчетности. Пользователи могут строить отчеты на «отчетной» БД, быстрее получая результат и не нагружая рабочую базу.
Для дальнейшего ускорения формирования отчетности мы разработали Дата акселератор — собственную SQL-совместимую in-memory базу данных, ориентированную на максимальную производительность в задачах OLAP. Дата акселератор может использоваться в качестве «отчетной БД» и позволяет существенно (иногда – на порядки) ускорить формирование отчетов.
https://habr.com/ru/companies/1c/articles/645365/
Алгоритмы и Структуры данных
Для бизнес-приложений очень важна возможность быстро сформировать нужный отчёт. Для этого, в частности, важно быстро получить результат запроса (часто – очень сложного запроса) к СУБД. Что не всегда просто, потому что с этой СУБД работают на чтение и запись тысячи (а иногда - десятки тысяч) пользователей.
Чтобы не нагружать рабочую СУБД запросами для отчетов мы разработали механизм копий баз данных, копирующий данные (все или их часть) из рабочей БД в отдельную БД для отчетности. Пользователи могут строить отчеты на «отчетной» БД, быстрее получая результат и не нагружая рабочую базу.
Для дальнейшего ускорения формирования отчетности мы разработали Дата акселератор — собственную SQL-совместимую in-memory базу данных, ориентированную на максимальную производительность в задачах OLAP. Дата акселератор может использоваться в качестве «отчетной БД» и позволяет существенно (иногда – на порядки) ускорить формирование отчетов.
https://habr.com/ru/companies/1c/articles/645365/
Алгоритмы и Структуры данных
Хабр
Как мы используем LLVM для ускорения формирования отчётов
Для бизнес-приложений очень важна возможность быстро сформировать нужный отчёт. Для этого, в частности, важно быстро получить результат запроса (часто – очень сложного запроса) к СУБД. Что не всегда...
❤1
k-means in Clickhouse
Алгоритм k-means хорошо известен и применяется когда надо быстро разделить массив данных на группы или т.н. "кластеры". Предполагается, что каждый элемент данных имеет набор численных метрик, и мы можем говорить как о позиции точки в некотором многомерном пространстве, так и о их взаимной близости.
k-means относится к категории EM-алогоритмов (Expectanion-Maximization), где мы попеременно определяем насколько правильно текущее разбиение точек на кластеры, а затем немного его улучшаем.
Этот достаточно простой алгоритм, был сформулирован ещё в 1950-х, и с тех пор реализован на самых разных языках программирования. Есть реализации для MySQL и Postgress, и даже для Excel.
https://habr.com/ru/articles/645291/
Алгоритмы и Структуры данных
Алгоритм k-means хорошо известен и применяется когда надо быстро разделить массив данных на группы или т.н. "кластеры". Предполагается, что каждый элемент данных имеет набор численных метрик, и мы можем говорить как о позиции точки в некотором многомерном пространстве, так и о их взаимной близости.
k-means относится к категории EM-алогоритмов (Expectanion-Maximization), где мы попеременно определяем насколько правильно текущее разбиение точек на кластеры, а затем немного его улучшаем.
Этот достаточно простой алгоритм, был сформулирован ещё в 1950-х, и с тех пор реализован на самых разных языках программирования. Есть реализации для MySQL и Postgress, и даже для Excel.
https://habr.com/ru/articles/645291/
Алгоритмы и Структуры данных
Хабр
k-means in Clickhouse
Алгоритм k-means хорошо известен и применяется когда надо быстро разделить массив данных на группы или т.н. "кластеры". Предполагается, что каждый элемент данных имеет набор численных метрик, и мы...
Разделяй и Властвуй. Разбор задач
Решение задач с помощью метода "Разделяй и Властвуй" или по-английски "Divide and Conquer" является одним из базовых методов по ускорению алгоритмов. Примером тому служит переход от квадратичной сложности пузырьковой сортировки или сортировки вставками к сложности \inline O(n\log{n}) при сортировке слиянием. Или переход от линейной сложности к логарифмической, при реализации поиска элемента в отсортированном массиве (см. бинарный поиск).
В этой статье мы рассмотрим два примера задач с пояснениями и кодом, в которых будет использоваться этот подход.
https://habr.com/ru/companies/otus/articles/599309/
Алгоритмы и Структуры данных
Решение задач с помощью метода "Разделяй и Властвуй" или по-английски "Divide and Conquer" является одним из базовых методов по ускорению алгоритмов. Примером тому служит переход от квадратичной сложности пузырьковой сортировки или сортировки вставками к сложности \inline O(n\log{n}) при сортировке слиянием. Или переход от линейной сложности к логарифмической, при реализации поиска элемента в отсортированном массиве (см. бинарный поиск).
В этой статье мы рассмотрим два примера задач с пояснениями и кодом, в которых будет использоваться этот подход.
https://habr.com/ru/companies/otus/articles/599309/
Алгоритмы и Структуры данных
Хабр
Разделяй и Властвуй. Разбор задач
Решение задач с помощью метода "Разделяй и Властвуй" или по-английски "Divide and Conquer" является одним из базовых методов по ускорению алгоритмов. Примером тому служит переход...
ИИ-поиск в 2ГИС: как учим нейросети понимать настроение, фото и смыслы
Поиск — одна из ключевых функций в 2ГИС. Он помогает миллионам пользователей каждый день находить нужные места в городе. Долгое время мы опирались на классические методы: морфологию, справочник организаций, геопозицию и популярность объектов. Это позволяло покрывать множество сценариев, но со временем стало понятно — этого недостаточно.
Пользователи хотят искать так, как думают: по настроению, по смыслу или вообще без слов — по фотографии блюда или интерьера. Мы решили переосмыслить подход к поиску. В этой статье рассказываем, как мы решали три задачи:
https://habr.com/ru/companies/2gis/articles/951008/
Алгоритмы и Структуры данных
Поиск — одна из ключевых функций в 2ГИС. Он помогает миллионам пользователей каждый день находить нужные места в городе. Долгое время мы опирались на классические методы: морфологию, справочник организаций, геопозицию и популярность объектов. Это позволяло покрывать множество сценариев, но со временем стало понятно — этого недостаточно.
Пользователи хотят искать так, как думают: по настроению, по смыслу или вообще без слов — по фотографии блюда или интерьера. Мы решили переосмыслить подход к поиску. В этой статье рассказываем, как мы решали три задачи:
https://habr.com/ru/companies/2gis/articles/951008/
Алгоритмы и Структуры данных
Хабр
ИИ-поиск в 2ГИС: как учим нейросети понимать настроение, фото и смыслы
Поиск — одна из ключевых функций в 2ГИС. Он помогает миллионам пользователей каждый день находить нужные места в городе. Долгое время мы опирались на классические методы: морфологию, справочник...
Музыка и математика: как аккорды вдохновляют архитектуру алгоритмов
Эта статья — эксперимент на стыке музыки, математики и программирования. Мы попробуем взглянуть на аккорды не как на набор звуков, а как на архитектурные паттерны. Я покажу, как гармонические последовательности могут подсказать нам структуру алгоритмов, приведу примеры кода и проведу параллели между миром нот и миром вычислений.
https://habr.com/ru/articles/951718/
Алгоритмы и Структуры данных
Эта статья — эксперимент на стыке музыки, математики и программирования. Мы попробуем взглянуть на аккорды не как на набор звуков, а как на архитектурные паттерны. Я покажу, как гармонические последовательности могут подсказать нам структуру алгоритмов, приведу примеры кода и проведу параллели между миром нот и миром вычислений.
https://habr.com/ru/articles/951718/
Алгоритмы и Структуры данных