Кстати спасибо всем кто рассказывает об этом канале друзьям. Он не особо полезный, немного всратый, но вы это читаете и я радуюсь :) Недавно мне мой прекрасный товарищ Алексей рассказывал, что видел на паре, как его друг читает мой канал. И это не единичная история, мне очень приятно от такого. В будущем (когда аудитория будет чуть больше) надо будет проводить много нетворкинга и прочих мероприятий, потому что нетворкинг это круто и полезно. И на 500 подписчиков (если этот момент настанет) я планирую провести сходку, нормальную такую, арендовав коворкинг/что-то такое, пообщаемся, поедим питсы и вот это все
👍12👎3
#поисковыйдвижок
Парсер сайта с морфемами готов, но я пока что не пропарсил, так как нужен час стабильного интернета (надо бы что-то оптимизировать, и будет лучше) + кажется, где-то утечка памяти, надо будет пофиксить.
Про ассоциации/синонимы: предполагалось, что я буду их использовать для обогащения запроса полнотекстового поиска, и это действительно хорошая идея. Но! Видимо, придётся пожертвовать нечеткостью поиска по синонимам, сделав просто словарь, и стать более зависимым от качества лемматизации. Я думаю, что методы классического NLP/матричные разложения/методы векторизации вершин в графах могут помочь вытащить неплохие эмбеддинги из матрицы ассоциаций, но это все в будущем.
Планы:
1) заменить дерево синонимов на мапу, добавить в основной поисковик обогащение запроса таким образом
2) попробовать следующую идею: взять граф ассоциаций, отсортировать ребра по убыванию веса, взять top-k. После этого, есть гипотеза, данные граф разобьется на компоненты одной доменной области. Соответственно, в каждом графе можно будет провести pagerank и определить наиболее значимые вершины, получится эдакое тематическое моделирование. И либо использовать как эмбеддинги, либо обогащать запрос этими важными словами из кластера
Парсер сайта с морфемами готов, но я пока что не пропарсил, так как нужен час стабильного интернета (надо бы что-то оптимизировать, и будет лучше) + кажется, где-то утечка памяти, надо будет пофиксить.
Про ассоциации/синонимы: предполагалось, что я буду их использовать для обогащения запроса полнотекстового поиска, и это действительно хорошая идея. Но! Видимо, придётся пожертвовать нечеткостью поиска по синонимам, сделав просто словарь, и стать более зависимым от качества лемматизации. Я думаю, что методы классического NLP/матричные разложения/методы векторизации вершин в графах могут помочь вытащить неплохие эмбеддинги из матрицы ассоциаций, но это все в будущем.
Планы:
1) заменить дерево синонимов на мапу, добавить в основной поисковик обогащение запроса таким образом
2) попробовать следующую идею: взять граф ассоциаций, отсортировать ребра по убыванию веса, взять top-k. После этого, есть гипотеза, данные граф разобьется на компоненты одной доменной области. Соответственно, в каждом графе можно будет провести pagerank и определить наиболее значимые вершины, получится эдакое тематическое моделирование. И либо использовать как эмбеддинги, либо обогащать запрос этими важными словами из кластера
👍3👎1
ML-легушька
Ура, я смог вывести очень тупую, но хотя бы какую-то оценку сходимости метода в рамках больших отклонений (т.е. Что сходится не матожидание с такой оценкой, а сам результат, но с некоторой вероятностью)
Что-то поднадоело мне тут. Продвижений никаких особо нет, каждый день приходишь и делаешь +- одно и то же. Вчера будто бы был прогресс, но найденные леммы не обобщаются на случай бандитов из-за специфики их стохградиента :(
😢7👎2
Решил вспомнить славные времена карантина 10ого класса, когда все, что я делал - учил нейронки, ботал алгосы(две недели, зато непрерывно по 10 часов в день) и играл в Starbound. Собственно, есть ли тут ценители старбаунда? Можем поиграть как-нибудь. Игра очень похожа на террарию, только лучше, прям сильно лучше :)
👍5👎2
Итак. Сегодня последний день смены в Сириусе. Если я нигде не ошибся (а я все перепроверил, и плюс это сходится с теорией для этого), то я смог вывести оценку матожидания потерь для клипированного зеркального спуска в многоруких бандита. В какой-то момент я почти сдался, но буквально вчера смог доказать одну лемму, и сейчас довёл до конца. Я считаю, это хороший результат для второкурсника. Более того, из этого будет намного легче выйти на оценку в случае больших отклонений, что уже будет действительно хорошим научным результатом и потянет на статью
👍13🔥2👎1🤩1
Никто из моих друзей не хочет идти со мной в бар этим вечером... А дальше не получится, ибо куча работы и учёбы, в течение недель эдак двух
😢5👎2
Люблю все же Москву. Чувствуется, что деньги вливаются в комфорт людей. После всей сочинской инфраструктуры... Строили на окружной и наконец построили. Ультраудобные и приятные переходы между мцк, МЦД и метро. Это дикий кайф. А ещё метро!
❤22👎4🤯1
Дакимакура с каким изображением будет наиболее базированной?
👎2
Forwarded from Neural Meduza
Российские ученые нашли, что многие россияне стали гомосексуальными из-за нехватки счастья
🤔7👎2
Я тут подумал... Если я покрашусь в блонд, то буду относительно похож на Курта Кобейна
👍6👎4🔥1🤯1
ML-легушька
Я тут подумал... Если я покрашусь в блонд, то буду относительно похож на Курта Кобейна
Просто случайно сделанная фотка. Ну и лицо чуть худее сделать
👎8🔥7❤1👍1
Кстати, позавчера на небольшой пьянке с людьми из Сириуса один человек (он даже есть в этом канале) сказал, что российское ФСБ не признает шифрование на эллиптических кривых. Это же какой-то гигакринж
👎3🤔2