Forwarded from Data is data
Попросили прокомментировать вот эту статью про 29 млн заболевших по ID из лживого латышского листка.
Слабые места статьи:
1. совершенно непонятно почему авторы решили, что нумерация начинается с 0
2. непонятно, почему авторы решили, что пропусков в номерах нет. Я в своё время парсил инстаграм. Там у всех пользователей тоже номера подряд. Но. Так как пользователи в разных регионах обслуживаются разными кластерами, то Инста нарезает региональным серверам какие-то диапазоны ID, чтобы они глобально ненароком не пересеклись из-за latency в сети. Пропуски там есть. Более того порядок тоже нарушается в зависимости от скорости наполнения. Задача имхо аналогичная.
3. самое слабое место: Пациентов, у которых диагноз не подтвердился, из регистра удаляют, отмечает источник — а порядковый номер освобождается и потом присваивается новому заболевшему. Никто и никогда не будет переиспользовать ID. Это дико неудобно в реализации, а новых номеров завались и тележка. Авторам это очевидно нужно для обоснования отсутствия пробелов.
4. всего на графике у них 51 точка, по которым проводится сплайн. Я сам считал. Понятно, что у них мало сторонников, но даткой они разжились жиденько, что совершенно не соответствует заявленным 29 млн. Поддержка уличная у них 0.5%, значит переболевших сторонников около 195 000 должно быть, +/- 90 000. 2% конверсии дадут минимум 2000 в датасете. Их очевидно нет.
в реальности скорей всего там ETL не раз сбоил между регионами, что-то добавлялось, что-то удалялось. Частично номера идут подряд и коррелируют с датами, но вот экстраполировать, как они сделали может только лживый латышский листок, он же иностранный агент.
Слабые места статьи:
1. совершенно непонятно почему авторы решили, что нумерация начинается с 0
2. непонятно, почему авторы решили, что пропусков в номерах нет. Я в своё время парсил инстаграм. Там у всех пользователей тоже номера подряд. Но. Так как пользователи в разных регионах обслуживаются разными кластерами, то Инста нарезает региональным серверам какие-то диапазоны ID, чтобы они глобально ненароком не пересеклись из-за latency в сети. Пропуски там есть. Более того порядок тоже нарушается в зависимости от скорости наполнения. Задача имхо аналогичная.
3. самое слабое место: Пациентов, у которых диагноз не подтвердился, из регистра удаляют, отмечает источник — а порядковый номер освобождается и потом присваивается новому заболевшему. Никто и никогда не будет переиспользовать ID. Это дико неудобно в реализации, а новых номеров завались и тележка. Авторам это очевидно нужно для обоснования отсутствия пробелов.
4. всего на графике у них 51 точка, по которым проводится сплайн. Я сам считал. Понятно, что у них мало сторонников, но даткой они разжились жиденько, что совершенно не соответствует заявленным 29 млн. Поддержка уличная у них 0.5%, значит переболевших сторонников около 195 000 должно быть, +/- 90 000. 2% конверсии дадут минимум 2000 в датасете. Их очевидно нет.
в реальности скорей всего там ETL не раз сбоил между регионами, что-то добавлялось, что-то удалялось. Частично номера идут подряд и коррелируют с датами, но вот экстраполировать, как они сделали может только лживый латышский листок, он же иностранный агент.
Журнал «Холод»
29 миллионов
В закрытом COVID-реестре Минздрава оказалось в пять раз больше записей, чем официально заболевших в России
Мемы про эйчаров, джаву и джаваскрипт продолжаются
Forwarded from Механіко-математичний факультет. ( Офіційний канал ) (Polina Aleksandrova)
#рекомендація
Пройди стажування з організаторами найбільшого європейсього ІТ змагання — DEV Challenge.
Протягом програми ти зможеш:
✔️ вивчити та покращити свої технічні навички, працюючи з сучасним технологічним стеком
✔️ вивчиш найкращі практики та підходи до розробки, тестування
✔️ отримаєш досвід роботи з великим проєктом та будеш працювати над його покращенням.
Програма стажування має два напрямки:
✅ Back-end (React, JS, HTML, CSS, git)
✅ Front-end (Python, Django, Postgresql, git)
👉 Зареєструйся вже сьогодні, адже форма закривається 30 липня!
👉 Старт програми: 02 серпня та 16 серпня.
👉 Формат на вибір: онлайн & офлайн у Львові чи Києві. Чи повний онлайн.
Пройди стажування з організаторами найбільшого європейсього ІТ змагання — DEV Challenge.
Протягом програми ти зможеш:
✔️ вивчити та покращити свої технічні навички, працюючи з сучасним технологічним стеком
✔️ вивчиш найкращі практики та підходи до розробки, тестування
✔️ отримаєш досвід роботи з великим проєктом та будеш працювати над його покращенням.
Програма стажування має два напрямки:
✅ Back-end (React, JS, HTML, CSS, git)
✅ Front-end (Python, Django, Postgresql, git)
👉 Зареєструйся вже сьогодні, адже форма закривається 30 липня!
👉 Старт програми: 02 серпня та 16 серпня.
👉 Формат на вибір: онлайн & офлайн у Львові чи Києві. Чи повний онлайн.
Forwarded from Olha
Telegram
Механіко-математичний факультет. ( Офіційний канал )
#рекомендація
Пройди стажування з організаторами найбільшого європейсього ІТ змагання — DEV Challenge.
Протягом програми ти зможеш:
✔️ вивчити та покращити свої технічні навички, працюючи з сучасним технологічним стеком
✔️ вивчиш найкращі практики та підходи…
Пройди стажування з організаторами найбільшого європейсього ІТ змагання — DEV Challenge.
Протягом програми ти зможеш:
✔️ вивчити та покращити свої технічні навички, працюючи з сучасним технологічним стеком
✔️ вивчиш найкращі практики та підходи…
Forwarded from Механіко-математичний бот
Доброго дня! Інформацію брали з сайту😉
Forwarded from Механіко-математичний бот
Привет сайту
Я б после такого не регалась
Я б после такого не регалась
Срочно распостраните, чипирование на лбу 🤣
Forwarded from 🦖 Айти Тудэй 🦥
This media is not supported in your browser
VIEW IN TELEGRAM
Момент коннекта к чипу привитого по ssh, чип на процессоре Эльбрус, конечно.
https://twitter.com/think_not_think/status/1417932909428846597
https://twitter.com/think_not_think/status/1417932909428846597
Forwarded from Data is data
интересная попытка Intel сделать ускоритель для NN. не для трейна понятно, но всё же. такую штуку можно и в сервак воткнуть. есть конвертер моделей с Keras
Forwarded from Data is data
Forwarded from Data is data
только в курсе комплексного анализа, только на мехмате, только сегодня и только сейчас - шоу "подорви мозг читающему гуманитарию"
https://math.stackexchange.com/questions/1176733/fast-method-to-find-the-tangent-line-to-a-conic-section-why-does-it-work
сегодня рубрика внезапных удобных формул
сегодня рубрика внезапных удобных формул
Профессиональный тролль