Data is data – Telegram
Data is data
3.13K subscribers
2.94K photos
49 videos
36 files
799 links
Канал о данных, фактах, визуализации. Немного математики, историй с лёгкими оттенками machine и deep learning. Для связи пишите https://news.1rj.ru/str/blackskif
Download Telegram
Пишут нам HR, про 3 цифры дня:

100 приглашений на интервью / откликов получает iOs разработчик (3 года опыта в коммерческой разработке) за 1 неделю публикации резюме на job портале.

129 приглашений на интервью / откликов получает JS разработчик (3 года опыта в коммерческой разработке) за 1 неделю публикации резюме на job портале.

И.... тадададам..... Его Величество JAVA

163 приглашений на интервью / откликов получает JAVA разработчик (3 года опыта в коммерческой разработке) за 1 неделю публикации резюме на job портале.
интересную и достаточно большую книжку нашёл. человек это всё знать не может.
Эти животные и ещё 1500 видов демонстрируют same sex behavior, или в простонародье однополые отношения. На эту тему вышла целая статья в Nature. Кроме установления самого факта, конкретики в статье мало. Сову примеряют к глобусу со всех сторон, а он со всех сторон круглый. Выдвинута теория, что у видов, которые недифференцируют самок, это просто выброс False positive. Однако она никак не подкрепляется данными. В целом хорошая статья, журналистам можно отсюда много кликов накопать бесплатно без смс при правильной подаче материала.
Минобр придумало хитрый способ бороться с сливами вариантов ЕГЭ. Они их сливают сами через подставные аккаунты. Двести-триста ненастоящих, но правдоподобных вариантов. Можно конечно решать всё подряд, но это ведь ничем не будет отличаться от реальной подготовки, так ?
Посылки iherbs в пункте доставки, Москва. Онлайн торговля лекарствами навряд ли будет лучше организована. Последняя миля может запросто обнулить все усилия по GxP и качеству.
Очевидные и очевидные данные ООН по вовлечённости в экономику мужчин и женщин по странам. Везде, кроме Бурунди и Руанды (обе страны в Африке) % работающих мужчин больше, чем женщин. В России это 70.5% и 55% соответственно. В арабских странах только пятая часть женщин работает, к ним ожидаемо примыкает Иран и не совсем ожидаемо Пакистан и Индия. Хотя, если учесть, что Индия - главная мусульманская страна в мире, то всё достаточно логично сходится к угнетению по религиозному признаку. Что ещё ? Европа работает меньше остального мира в среднем, сказывается тяжкое бремя колонизаторов. Всем кстати советую русско-прибалтийский Infogram, если вам нужно что-то на коленке отличное от Excel и matplotlib. Ссылка на интерактивный дашборд
Программа ВШЭ "продай почку - стань датасаентистом". https://cs.hse.ru/dpo/datascientist
Наглядная разница между embedding Word2Vec и FastText на одном моём проекте. Первый выстраивает контекст, даже почтовый индекс какой-то нашёл в Хамовниках и успешен там, где забыли пробел. Второй пытается подобрать похожее по написанию слово, надеясь, что они используются похожим образом. В каком-то смысле оба они правы.
из детского школьного проекта данные соцопроса той же школы. героев великой отечественной не знают, даже того, именем кого улица названа рядом. в целом безразличное отношение.
карта топовых новостей Эстонии вразбивку по регионам, держат в напряжении от первой до последней буквы
Что если бы я предложил вам с вероятностью 0.7 (70%) увеличить ваш капитал 100$ на 50%, и с шасом 0.3 (30%) потерять 90%. При этом, как организатор, я в любом случае беру себе 1.5$. Стали бы играть ? Сколько раз? Давайте посмотрим с двух сторон. Матожидание капитала после одного испытания 106.5, это так называемое ожидание по ансамблю, когда есть много игроков и выводится среднее после броска монетки. Прибыльно, на уровне ОФЗ российских. Однако же игра ведёт себя коварно со временем. Более 90% игроков разоряются на периоде 60 игр, хотя отдельные игроки достигают сумасшедших высот. Почему так ? Если вам не повезло сразу, то вернуться выше 100$ вы сможете за 8 успешных бросков подряд. Шансы примерно 5.8%, как-то грустно. Что если вы три раза выиграли (всего 34% случаев), а потом проиграли ? Шансы на возвращение по-выше, но тоже ой: 24%. Получается раз сыграть вроде выгодно, несколько раз - провал почти гарантирован. Хотя можно сорвать банк. Вывод: надо лимитировать потери капитала, если играете много.
Соглашение по газу с украиной в одном графике
У противников теории эволюции, есть такое доказательство: предположим, что каждая мутация полезна или вредна с вероятностью одна вторая. Cтатистическая теория показывает, что вероятность двухсот последовательных полезных мутаций – одна вторая в двухсотой степени или один шанс на десять в шестидесятой.

Однако математически это не так работает. При естественном отборе полезные мутации закрепляются. Это эквивалентно тому, что если мы выкинием 200 монеток, то в среднем 100 из них будут полезными и закрепятся. Потом мы выкидываем 100, и закрепляются ещё 50. Всего за 8 итераций мы угадываем все позиции.

Есть статья, которая доказывает теорему и формулу, сколько нужно угадываний примерно для определенной длинны слова и определённого алфавита. Их количество пропрорционально логарифму от длины последовательности, который растёт очень медленно.

Возьмём кишечную палочку. Размер её генома 5132068 нуклеотидов (L). Нуклеотиды бывают четырех типов: A, T, G и C (K = 4). Чтобы угадать геном потребовалось бы ~54 раунда.
Один неаккуратно поставленный пакет вчера в ночи обрушил мне питон с Tensorflow. Починил методом полной замены всего. По случаю поставил себе TF 2.0 По ощущениям стало быстрее всё. Однако сам процесс установки по-прежнему адовый. TF из коробки собран под версию CuDNN 7.6.0, у CuDNN 7.6.0 есть несколько билдов под разные CuDA (9-10-10.1) и разные Windows, тем нужны версии драйверов не ниже ХХХ, а главное сама CuDNN dll-ка называется безхитростно cudnn64_7.dll для всех версий. Поди догадайся подо что она там собрана. В конце концов чувствуешь радость преодоления, что чему-то новому научился, но чем и зачем не очень понятно, через месяц-другой всё поменяется.