Как увеличить аудиторию канала? А то идёт уже некоторая стагнация. Я удивлён, что столько людей читают мой щитпостинг, но все же
👎11❤1
Неужели большая часть прикладной математики в компьютер саенсе это комбинаторика (кодирование, дискропт и прочее) и теорвер (обычный опт, матстат и вот это все)? Даже удивительно. Я сейчас делаю условно "рисерч" по оптимизации, и большую часть времени я просто делаю какой-то теорвер. И все доказательства в оптах это теорвер процентов на 95%
👍3👎2🔥1
Ещё я случайно подслушал, что Гасников говорил дедушке, с которым я в Сириусе работаю в основном (т.к. у него многорукие бандиты). И он меня достаточно хвалил. Сказал, что я проверенный человек, очень круто ему помогал в Сириусе, и что хорошо погружаюсь. Сказал, что небольшая проблема в том, что я лишь на 2ом курсе, но для 2ого курса у меня все очень неплохо и если я все пройду и изучу, то перспектива ему видится хорошей. И что конкретно в моем случае он планирует довести то, что тут будет на Сириусе, до статьи, так что это будет не просто проект. Гасников лучший
👏24👍4❤2👎1
Я все ещё не смог найти нормального инструмента, чтобы на питончике делать разбор слов по составу. Может плохо искал... Сделаю свою библиотеку, даже если такая уже есть. Попробую сделать удобно и быстро. Да и надо оформлять гитхабчик
👍6👎4
Яндекс такая крутая компания. Что может быть лучше, чем автобус, который телепортировался несколько раз на базу, пока ехал?
Upd. Поехал на автобусе, который не показывал яндекс в итоге. Спасибо) Сочи это волшебный город
Upd. Поехал на автобусе, который не показывал яндекс в итоге. Спасибо) Сочи это волшебный город
👎5
ML-легушька
Ещё я случайно подслушал, что Гасников говорил дедушке, с которым я в Сириусе работаю в основном (т.к. у него многорукие бандиты). И он меня достаточно хвалил. Сказал, что я проверенный человек, очень круто ему помогал в Сириусе, и что хорошо погружаюсь. Сказал…
Справедливости ради мне кажется что у меня ничего не получится)))) Потому что как-то это очень тяжело. Мне сейчас обычная стох.оптимизация, которая жёстко пугала, кажется детским лепетом в сравнении с Онлайн оптимизацией
👎3😢1
Я тут задумался... Наверняка многие знают что в питоне есть фрактальные списки. Но с помощью них же можно моделировать марковские процессы вы представляете???
👎5
Разговор двух душных (в хорошем смысле) геев-айтишников о своём айтишном(жизни не в России, конечных автоматах и человеке-бензопиле), волею судьбы живущих вместе, это so aesthetically 💅💅💅💅
👍14👎9
#лягушкаобразовательный
Раньше, когда мне надо было спарсить много ссылок, я писал свой кастомный класс, наследуемый от threading.thread, и в нем прописывал все что мне нужно (либо можно было использовать map, но там свои тонкости). Но даже это не работало так быстро... Сейчас у меня 200 веб-страниц спарсилось за секунду. Рассказываю магию:
import concurrent.futures
MAX_THREADS = 30
with concurrent.futures.ThreadPoolExecutor(max_workers=MAX_THREADS) as executor:
executor.map(download_url, story_urls)
Примерно так это должно выглядеть, и все. Это какое-то очень мощное ускорение
Раньше, когда мне надо было спарсить много ссылок, я писал свой кастомный класс, наследуемый от threading.thread, и в нем прописывал все что мне нужно (либо можно было использовать map, но там свои тонкости). Но даже это не работало так быстро... Сейчас у меня 200 веб-страниц спарсилось за секунду. Рассказываю магию:
import concurrent.futures
MAX_THREADS = 30
with concurrent.futures.ThreadPoolExecutor(max_workers=MAX_THREADS) as executor:
executor.map(download_url, story_urls)
Примерно так это должно выглядеть, и все. Это какое-то очень мощное ускорение
👍7👎4
Кстати, интерактивчик: что вы думаете про кадетские классы в школах? Типо что это, зачем и почему
👎12👍2🤬1
Почему SURF + удобная розетка это такая редкая комбинация в Сочи :( Я заходил в 4, и вот в одном была розетка но не удобная, в другом удобная но неудобный для ноута низкий стол. Чо за фигня
👎3👍1
Вообще в Сочи очень хорошо. Я сейчас в ветровке + футболке (не хотелось толстовку/рубашку надевать), и мне стало жарковато.. Не имей я универа и имей удалённую работу, я бы тут жил. Второе не очень проблема, а вот первое.. Некоторые моменты - полный кринж для Долгопрудного взгляда, например, почти отсутствие круглосуток (и около Сириуса, и в Адлере, но в последнем получше). И большая часть ресторанов, даже дорогих, не московского уровня. Но есть и годные (та же сыроварня от Новикова). Ну и относительно дешёвая жизнь в несезон (а в сезон можно на очные стажки/в Сириус/в Европу гонять). Давайте создадим IT-комунну?
👍5👎4
Кстати спасибо всем кто рассказывает об этом канале друзьям. Он не особо полезный, немного всратый, но вы это читаете и я радуюсь :) Недавно мне мой прекрасный товарищ Алексей рассказывал, что видел на паре, как его друг читает мой канал. И это не единичная история, мне очень приятно от такого. В будущем (когда аудитория будет чуть больше) надо будет проводить много нетворкинга и прочих мероприятий, потому что нетворкинг это круто и полезно. И на 500 подписчиков (если этот момент настанет) я планирую провести сходку, нормальную такую, арендовав коворкинг/что-то такое, пообщаемся, поедим питсы и вот это все
👍12👎3
#поисковыйдвижок
Парсер сайта с морфемами готов, но я пока что не пропарсил, так как нужен час стабильного интернета (надо бы что-то оптимизировать, и будет лучше) + кажется, где-то утечка памяти, надо будет пофиксить.
Про ассоциации/синонимы: предполагалось, что я буду их использовать для обогащения запроса полнотекстового поиска, и это действительно хорошая идея. Но! Видимо, придётся пожертвовать нечеткостью поиска по синонимам, сделав просто словарь, и стать более зависимым от качества лемматизации. Я думаю, что методы классического NLP/матричные разложения/методы векторизации вершин в графах могут помочь вытащить неплохие эмбеддинги из матрицы ассоциаций, но это все в будущем.
Планы:
1) заменить дерево синонимов на мапу, добавить в основной поисковик обогащение запроса таким образом
2) попробовать следующую идею: взять граф ассоциаций, отсортировать ребра по убыванию веса, взять top-k. После этого, есть гипотеза, данные граф разобьется на компоненты одной доменной области. Соответственно, в каждом графе можно будет провести pagerank и определить наиболее значимые вершины, получится эдакое тематическое моделирование. И либо использовать как эмбеддинги, либо обогащать запрос этими важными словами из кластера
Парсер сайта с морфемами готов, но я пока что не пропарсил, так как нужен час стабильного интернета (надо бы что-то оптимизировать, и будет лучше) + кажется, где-то утечка памяти, надо будет пофиксить.
Про ассоциации/синонимы: предполагалось, что я буду их использовать для обогащения запроса полнотекстового поиска, и это действительно хорошая идея. Но! Видимо, придётся пожертвовать нечеткостью поиска по синонимам, сделав просто словарь, и стать более зависимым от качества лемматизации. Я думаю, что методы классического NLP/матричные разложения/методы векторизации вершин в графах могут помочь вытащить неплохие эмбеддинги из матрицы ассоциаций, но это все в будущем.
Планы:
1) заменить дерево синонимов на мапу, добавить в основной поисковик обогащение запроса таким образом
2) попробовать следующую идею: взять граф ассоциаций, отсортировать ребра по убыванию веса, взять top-k. После этого, есть гипотеза, данные граф разобьется на компоненты одной доменной области. Соответственно, в каждом графе можно будет провести pagerank и определить наиболее значимые вершины, получится эдакое тематическое моделирование. И либо использовать как эмбеддинги, либо обогащать запрос этими важными словами из кластера
👍3👎1
ML-легушька
Ура, я смог вывести очень тупую, но хотя бы какую-то оценку сходимости метода в рамках больших отклонений (т.е. Что сходится не матожидание с такой оценкой, а сам результат, но с некоторой вероятностью)
Что-то поднадоело мне тут. Продвижений никаких особо нет, каждый день приходишь и делаешь +- одно и то же. Вчера будто бы был прогресс, но найденные леммы не обобщаются на случай бандитов из-за специфики их стохградиента :(
😢7👎2
Решил вспомнить славные времена карантина 10ого класса, когда все, что я делал - учил нейронки, ботал алгосы(две недели, зато непрерывно по 10 часов в день) и играл в Starbound. Собственно, есть ли тут ценители старбаунда? Можем поиграть как-нибудь. Игра очень похожа на террарию, только лучше, прям сильно лучше :)
👍5👎2
Итак. Сегодня последний день смены в Сириусе. Если я нигде не ошибся (а я все перепроверил, и плюс это сходится с теорией для этого), то я смог вывести оценку матожидания потерь для клипированного зеркального спуска в многоруких бандита. В какой-то момент я почти сдался, но буквально вчера смог доказать одну лемму, и сейчас довёл до конца. Я считаю, это хороший результат для второкурсника. Более того, из этого будет намного легче выйти на оценку в случае больших отклонений, что уже будет действительно хорошим научным результатом и потянет на статью
👍13🔥2👎1🤩1