Продолжаю вещать про поисковики, и сегодня легенда поисковых алгоритмов - PageRank.
Тут написано про то, как он устроен. Принцип достаточно прост и понятен, потому и гениален.
Кроме того, PageRank можно использовать не только для веб-ссылок, но и для выделения ключевых слов, например. Такая модификация называется TextRank (об этом может быть позже напишу, или сами в сети найдёте).
Скажу, что знать его устройство обязательно. Гугл частично его использует до сих пор, да и сами вы можете его модифицировать под свои задачи.
Тут написано про то, как он устроен. Принцип достаточно прост и понятен, потому и гениален.
Кроме того, PageRank можно использовать не только для веб-ссылок, но и для выделения ключевых слов, например. Такая модификация называется TextRank (об этом может быть позже напишу, или сами в сети найдёте).
Скажу, что знать его устройство обязательно. Гугл частично его использует до сих пор, да и сами вы можете его модифицировать под свои задачи.
Хабр
PAGERANK: алгоритм ранжирования WEB-страниц
Итак, рассмотрим ориентированный взвешенный граф. Пусть у графа n вершин. Каждой паре вершин соответствует некоторый вес (вероятность перехода). Стоит отмет...
👍4
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Многорукие бандиты Баейса
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
7 Февраля (Вторник) в 19:00 по МСК
Программа практикума:
🔹Многорукие бандиты, как продвинутые инструменты А/B/n-тестирования
🔹Практическое применение байесовских многоруких бандитов
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
7 Февраля (Вторник) в 19:00 по МСК
Программа практикума:
🔹Многорукие бандиты, как продвинутые инструменты А/B/n-тестирования
🔹Практическое применение байесовских многоруких бандитов
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
❤1
Вот это меня очень заинтересовало.
Пока не удалось попробовать, но выглядит впечатляюще.
Меня такое устраивает 😉
Пока не удалось попробовать, но выглядит впечатляюще.
Меня такое устраивает 😉
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Open-sources PhyCV: The First Physics-inspired Computer Vision Library
Unlike traditional algorithms that are a sequence of hand-crafted empirical rules, physics-inspired algorithms leverage physical laws of nature as blueprints.
PhyCV - новый класс алгоритмов компьютерного зрения, высокой точности, которые имитируют распространение света через физические объекты. Алгоритмы основаны на уравнениях дифракции света в оптических системах.
🖥 Github: https://github.com/JalaliLabUCLA/phycv
📝 Paper: https://arxiv.org/abs/2301.12531v1
🎥 Video: https://www.youtube.com/watch?v=PJXXwXVyjdk&embeds_euri=https%3A%2F%2Fwww.imveurope.com%2F&feature=emb_logo
⭐️ Project: https://photonics.ucla.edu/2022/05/12/jalali-lab-open-sources-phycv-a-physics-inspired-computer-vision-library/
@ai_machinelearning_big_data
Unlike traditional algorithms that are a sequence of hand-crafted empirical rules, physics-inspired algorithms leverage physical laws of nature as blueprints.
PhyCV - новый класс алгоритмов компьютерного зрения, высокой точности, которые имитируют распространение света через физические объекты. Алгоритмы основаны на уравнениях дифракции света в оптических системах.
pip install phycv📝 Paper: https://arxiv.org/abs/2301.12531v1
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
Интересовались ли вы, как устроены «эти ваши» автозамены?
Тогда предлагаю познакомиться с историей и дайджестом классических фонетических алгоритмов.
Можно было бы сказать, что это лишь история, но нет, они актуальны и по сей день.
В наших телефонах и на сайтах работают именно подобные алгоритмы.
Иногда, конечно, разбавляют чем-то ещё, но суть особо не меняется.
Почему полезно и ценно это? Вы можете сделать свой нечёткий поиск по сайту, спеллчекинг для работы с текстами, расширить свой айтишный кругозор, а затем развить это направление.
Вариантов много 😉☀️
Тогда предлагаю познакомиться с историей и дайджестом классических фонетических алгоритмов.
Можно было бы сказать, что это лишь история, но нет, они актуальны и по сей день.
В наших телефонах и на сайтах работают именно подобные алгоритмы.
Иногда, конечно, разбавляют чем-то ещё, но суть особо не меняется.
Почему полезно и ценно это? Вы можете сделать свой нечёткий поиск по сайту, спеллчекинг для работы с текстами, расширить свой айтишный кругозор, а затем развить это направление.
Вариантов много 😉☀️
Хабр
Фонетические алгоритмы
Фонетические алгоритмы сопоставляют двум словам со схожим произношением одинаковые коды, что позволяет осуществлять сравнение и индексацию множества таких слов н...
❤1
Такое нужно знать всем разработчикам ☺️
Надеюсь, объяснять не нужно 😉
Надеюсь, объяснять не нужно 😉
Forwarded from Библиотека программиста | программирование, кодинг, разработка
binary_fund.pdf
386.4 KB
🔥2
А я сегодня вечером вещаю. Кто не слушал эту тему раньше - заходите)
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Ансамбли машинного обучения
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
14 Февраля (Вторник) в 19:00 по МСК
Программа практикума:
🔹Для чего они нужны? И почему они нужны в век нейронных сетей?
🔹Виды ансамблирования
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
14 Февраля (Вторник) в 19:00 по МСК
Программа практикума:
🔹Для чего они нужны? И почему они нужны в век нейронных сетей?
🔹Виды ансамблирования
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Открытый практикум DevOps by REBRAIN
Вебинары by REBRAIN
DevOps, Kubernetes, Docker, обучение DevOps, корпоративное обучение DevOps, обучение Kubernetes, обучение Docker, корпоративное обучение Docker, корпоративное обучение Kubernetes
Свежая статья про распознавание рукописного текста.
Пробежался по содержанию - годная!
Всех деталей нет, но зато есть ссылки на датасеты, некоторые подходы и умозрения по решению задачи.
Изучайте!
Пробежался по содержанию - годная!
Всех деталей нет, но зато есть ссылки на датасеты, некоторые подходы и умозрения по решению задачи.
Изучайте!
Хабр
Как написать пайплайн для чтения рукописного текста
Привет, Хабр! В этой статье мы, команда Sber AI, расскажем о пайплайне для распознавания текста и о нюансах обучения HTR‑моделей, а также поделимся датасетом школьных...
👍2
Тут ещё альтернатива "Панде" появилась - "Полярный медведь" (чую, "бурый медведь" станет вишенкой на торте)
Пишут и показывают, что Polars гораздо быстрее привычной Pandas, и плюсом есть некоторые "фишки".
Например, ленивые вычисления, где результат отложенно получаешь.
Я думаю, стоит брать, и изучать детальней. Изначально кажется приятной альтернативой, но нужно посмотреть по более тонкому функционалу.
Как там со строками работать, например.
Пишут и показывают, что Polars гораздо быстрее привычной Pandas, и плюсом есть некоторые "фишки".
Например, ленивые вычисления, где результат отложенно получаешь.
Я думаю, стоит брать, и изучать детальней. Изначально кажется приятной альтернативой, но нужно посмотреть по более тонкому функционалу.
Как там со строками работать, например.
Towards Data Science
Pandas vs. Polars: A Syntax and Speed Comparison | Towards Data Science
Understanding the major differences between the Python libraries Pandas and Polars for Data Science
👍3
Вроде не совсем про DS новость, но чисто DS-мышление прослеживается.
Человек догадался так кодировать информацию!
Я такое уважаю и ценю.
Конечно, все это заблочат в перспективе, но мысль, про которую многим говорю, что всё представляет плюс/минус одно и то же, только под разным углом здесь можно увидеть.
Человек догадался так кодировать информацию!
Я такое уважаю и ценю.
Конечно, все это заблочат в перспективе, но мысль, про которую многим говорю, что всё представляет плюс/минус одно и то же, только под разным углом здесь можно увидеть.
Forwarded from Типичный программист
Энтузиаст написал алгоритм, который превращает видео на YouTube в бесплатное бесконечное хранилище данных
Суть алгоритма AKA ISG в том, что он позволяет вставлять файлы в видео и загружать их на YouTube в качестве хранилища. Все файлы состоят из байтов, а байты можно интерпретировать как числа. Каждый пиксель либо белый — 1, либо чёрный — 0.
Исходники написаны на Rust и лежат на гитхабе: https://github.com/DvorakDwarf/Infinite-Storage-Glitch
«YouTube не имеет ограничений на количество видео, которые вы можете загрузить. Это означает, что это фактически бесконечное облачное хранилище», — говорит разработчик в описании проекта.
#кек #rust #opensource
Суть алгоритма AKA ISG в том, что он позволяет вставлять файлы в видео и загружать их на YouTube в качестве хранилища. Все файлы состоят из байтов, а байты можно интерпретировать как числа. Каждый пиксель либо белый — 1, либо чёрный — 0.
Исходники написаны на Rust и лежат на гитхабе: https://github.com/DvorakDwarf/Infinite-Storage-Glitch
«YouTube не имеет ограничений на количество видео, которые вы можете загрузить. Это означает, что это фактически бесконечное облачное хранилище», — говорит разработчик в описании проекта.
#кек #rust #opensource
🔥3
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Основы работы с аудио
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
21 Февраля (Вторник) в 19:00 по МСК
Программа практикума:
🔹Какие задачи решаются с помощью анализа аудио
🔹Инструменты для работы с аудио
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
21 Февраля (Вторник) в 19:00 по МСК
Программа практикума:
🔹Какие задачи решаются с помощью анализа аудио
🔹Инструменты для работы с аудио
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
🔥2👍1