Forwarded from Python Learning
Скачиваем HTML-код страницы с помощью Python
С помощью следующего фрагмента кода мы можем с легкостью получить HTML-код страницы в интеренете.
С помощью следующего фрагмента кода мы можем с легкостью получить HTML-код страницы в интеренете.
Forwarded from data будни (Саша Михайлов)
Английский в вакууме не котируется
Когда искал первую работу, думал что могу просить больше просто за тот факт, что знаю английский. Типа как при покупке техники в магазине: набираешь разных опций и за каждую общая цена увеличивается на сколько-то.
Поработав какое-то время, понял, что за всё время никто меня так и не попросил поговорить по английски или прочитать что-то. Так это не работает.
Просто так складывается, что всё самое новое и интересное в отрасли сначала публикуется на английском. Если интересна отрасль, то идешь и изучаешь.
То есть я думал, что связь прямая:
английский → больше зарплата
А на самом деле она косвенная:
английский → изучаешь новое в первоисточниках → применяешь на практике → прокачиваешь навыки → больше зарплата
Тут важен именно последняя связка: больше навык → больше зп. Наверное, можно и без английского, но кажется это будет сложнее.
Когда искал первую работу, думал что могу просить больше просто за тот факт, что знаю английский. Типа как при покупке техники в магазине: набираешь разных опций и за каждую общая цена увеличивается на сколько-то.
Поработав какое-то время, понял, что за всё время никто меня так и не попросил поговорить по английски или прочитать что-то. Так это не работает.
Просто так складывается, что всё самое новое и интересное в отрасли сначала публикуется на английском. Если интересна отрасль, то идешь и изучаешь.
То есть я думал, что связь прямая:
английский → больше зарплата
А на самом деле она косвенная:
английский → изучаешь новое в первоисточниках → применяешь на практике → прокачиваешь навыки → больше зарплата
Тут важен именно последняя связка: больше навык → больше зп. Наверное, можно и без английского, но кажется это будет сложнее.
Forwarded from Machine learning Interview
Объясните дилемму смещения-дисперсии (bias-variance tradeoff) и приведите примеры алгоритмов с высоким и низким смещением. (Тема: Алгоритмы)
Ответ
Смещение (bias) – это ошибка, внесенная в вашу модель из-за чрезмерного упрощения алгоритма машинного обучения, которое может привести к недообучению. В процессе обучения модели делаются упрощенные предположения, чтобы сделать целевую функцию более простой для понимания. Алгоритмы машинного обучения с низким смещением включают деревья решений, KNN и SVM. Высоким смещением, в частности, отличаются линейная и логистическая регрессия.
Дисперсия (variance) – это ошибка, внесенная в вашу модель сложным алгоритмом машинного обучения, при котором модель усваивает также и шум из тренировочного набора данных, что приводит к плохой точности на тестовом наборе данных. Это может привести к высокой чувствительности и переобучению.
Обычно, по мере усложения модели вы увидите снижение ошибки вследствие уменьшения смещения модели. Однако, это происходит только до определенной точки – и если вы будете усложнять свою модель дальше, в конце концов вы ее переобучите.
@machinelearning_interview
Ответ
Смещение (bias) – это ошибка, внесенная в вашу модель из-за чрезмерного упрощения алгоритма машинного обучения, которое может привести к недообучению. В процессе обучения модели делаются упрощенные предположения, чтобы сделать целевую функцию более простой для понимания. Алгоритмы машинного обучения с низким смещением включают деревья решений, KNN и SVM. Высоким смещением, в частности, отличаются линейная и логистическая регрессия.
Дисперсия (variance) – это ошибка, внесенная в вашу модель сложным алгоритмом машинного обучения, при котором модель усваивает также и шум из тренировочного набора данных, что приводит к плохой точности на тестовом наборе данных. Это может привести к высокой чувствительности и переобучению.
Обычно, по мере усложения модели вы увидите снижение ошибки вследствие уменьшения смещения модели. Однако, это происходит только до определенной точки – и если вы будете усложнять свою модель дальше, в конце концов вы ее переобучите.
@machinelearning_interview
Forwarded from Machine learning Interview
Ответ
P-значение используется для проверки значимости результатов после статистического теста гипотезы. P-значения помогают анализирующему делать выводы и всегда находятся в диапазоне между 0 и 1.
- P-значение, превышающее 0.05, обозначает недостаточные доказательства против нулевой гипотезы – а это значит, что нулевая гипотеза не может быть отвергнута.
- P-значение, меньшее 0.05, обозначает сильные доказательства против нулевой гипотезы – это значит, что нулевая гипотеза может быть отвергнута.
- P-значение, равное 0.05, находится на границе, то есть мы не можем сделать уверенного вывода о том, можно ли отвергнуть нулевую гипотезу.
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machine learning Interview
Как бы вы справились с разными формами сезонности
Ответ
В реальных данных временных рядов (например, количества плюшевых мишек, закупаемых на фабрике игрушек) часто встречаются различные виды сезонности, которые могут пересекаться друг с другом. Годичная сезонность, вроде пика перед Рождеством и летнего спада, может сочетаться с месячной, недельной или даже дневной сезонностью. Это делает временной ряд нестационарным, поскольку среднее значение переменной различно для разных периодов времени.
Лучший способ удаления сезонности из данных – это дифференцирование временного ряда. Это процесс получения разности между датой x и x минус период сезонности, которым может быть год, месяц, или что-нибудь другое. При этом первый период сырых данных теряется, поскольку из них нечего вычитать.
@machinelearning_interview
Ответ
В реальных данных временных рядов (например, количества плюшевых мишек, закупаемых на фабрике игрушек) часто встречаются различные виды сезонности, которые могут пересекаться друг с другом. Годичная сезонность, вроде пика перед Рождеством и летнего спада, может сочетаться с месячной, недельной или даже дневной сезонностью. Это делает временной ряд нестационарным, поскольку среднее значение переменной различно для разных периодов времени.
Лучший способ удаления сезонности из данных – это дифференцирование временного ряда. Это процесс получения разности между датой x и x минус период сезонности, которым может быть год, месяц, или что-нибудь другое. При этом первый период сырых данных теряется, поскольку из них нечего вычитать.
@machinelearning_interview
Forwarded from GitHub Community
typesense – опенсорсный аналог elasticsearch и подобных search-движков, с годным колличеством функционала
Другими словами это быстрая поисковая система с более продуманной системой поиска
⤷ Ссылка на проект
GitHub | #Interesting #Cpp
Другими словами это быстрая поисковая система с более продуманной системой поиска
⤷ Ссылка на проект
GitHub | #Interesting #Cpp
== Анализ данных на языке SQL ч.4. Хранилища и витрины данных
https://youtu.be/wtm82_IY1sY
- OLTP
- DataMart
- datawarehouse
- звезда
- снежинка
- работа с календарем
- сурогатные ключи
- мусорные справочники
- несколько таблиц фактов
- быстроменяющаяся размерность
- горизонтальное разделение фактов
- горизонтальное секционирование фактов
- аддитивность фактов
- тип факт таблицы:
- - транзакционнная
- - периодическая
- - историческая (аккумулирующая)
https://youtu.be/wtm82_IY1sY
- OLTP
- DataMart
- datawarehouse
- звезда
- снежинка
- работа с календарем
- сурогатные ключи
- мусорные справочники
- несколько таблиц фактов
- быстроменяющаяся размерность
- горизонтальное разделение фактов
- горизонтальное секционирование фактов
- аддитивность фактов
- тип факт таблицы:
- - транзакционнная
- - периодическая
- - историческая (аккумулирующая)
YouTube
Анализ данных на языке SQL ч.4. Хранилища и витрины данных
Поддержать 💲
💲🍬 https://yoomoney.ru/fundraise/14BL392476A.240801 - 100 руб.
💲🍬 https://yoomoney.ru/fundraise/14DLOUGTAKF.240804 - 500 руб.
💲🍬 https://yoomoney.ru/fundraise/14DLQ836RA7.240804 - 1000 руб.
Задать вопрос преподавателю из этого видео: Fedor@Samorodov.ru…
💲🍬 https://yoomoney.ru/fundraise/14BL392476A.240801 - 100 руб.
💲🍬 https://yoomoney.ru/fundraise/14DLOUGTAKF.240804 - 500 руб.
💲🍬 https://yoomoney.ru/fundraise/14DLQ836RA7.240804 - 1000 руб.
Задать вопрос преподавателю из этого видео: Fedor@Samorodov.ru…
хм.... симпотно
https://www.cnx-software.com/2022/10/10/pine64-ox64-sbc-bl808-risc-v-multi-protocol-wisoc-64mb-ram/
= $6-$8
- Alibaba T-head C906 64-bit RISC-V core @ 480MHz
- Alibaba T-head E907 32-bit RISC-V core @ 320MHz
- Memory – 64MB embedded DRAM
- Wireless 2.4 GHz 802.11 b/g/n Wi-Fi 4
https://www.cnx-software.com/2022/10/10/pine64-ox64-sbc-bl808-risc-v-multi-protocol-wisoc-64mb-ram/
= $6-$8
- Alibaba T-head C906 64-bit RISC-V core @ 480MHz
- Alibaba T-head E907 32-bit RISC-V core @ 320MHz
- Memory – 64MB embedded DRAM
- Wireless 2.4 GHz 802.11 b/g/n Wi-Fi 4
для себя локально такое можно сделать. а вот для сервера или на работе - нет
зачем надо ?
- ускорить свой комп на пустом месте до 30% если у тебя процессор интел. много СОФТОВЫХ (а значит медленных) заплаток в ядре изза прощелков интела в организации работы изоляции процессов в защищенном и не защищенном режиме
== How to disable mitigations for CPU vulnerabilities
https://sleeplessbeastie.eu/2020/03/27/how-to-disable-mitigations-for-cpu-vulnerabilities/
спойлер
зачем надо ?
- ускорить свой комп на пустом месте до 30% если у тебя процессор интел. много СОФТОВЫХ (а значит медленных) заплаток в ядре изза прощелков интела в организации работы изоляции процессов в защищенном и не защищенном режиме
== How to disable mitigations for CPU vulnerabilities
https://sleeplessbeastie.eu/2020/03/27/how-to-disable-mitigations-for-cpu-vulnerabilities/
спойлер
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash mitigations=off"
sleeplessbeastie's notes
How to disable mitigations for CPU vulnerabilities
Disable mitigations for CPU vulnerabilities.
== микро тред про отличия б-дерева от лсм-дерева
https://twitter.com/alexxubyte/status/1583119489318518786?s=46&t=B6PPYKCLmwRWKJFjRFuKNQ
https://twitter.com/alexxubyte/status/1583119489318518786?s=46&t=B6PPYKCLmwRWKJFjRFuKNQ
Twitter
/1 What are the differences between B-Tree and LSM-Tree?
== Измерительный инструмент и как им пользоваться.
https://youtu.be/mO0B5I7g_M0
https://youtu.be/mO0B5I7g_M0
YouTube
Измерительный инструмент и как им пользоваться
Приветствую на канале "Лёха Технарь" В этом видео, я покажу как пользоваться различным измерительным инструментом.
Поддержать на Бусти: https://boosty.to/leha_tehnar
Угломер: https://aliclick.shop/r/c/1s5z8196p2fnlfy0?erid=2SDnjcczZ7n
Нутромер: https:…
Поддержать на Бусти: https://boosty.to/leha_tehnar
Угломер: https://aliclick.shop/r/c/1s5z8196p2fnlfy0?erid=2SDnjcczZ7n
Нутромер: https:…
Оч хорошая мысль
- Удобство это не то к чему нужно по умолчанию стремиться. Неудобство не то от чего по умолчанию нужно бежать
== Почему не стоит стремиться к удобству?
https://youtu.be/wJGE8IcOF-U
- Удобство это не то к чему нужно по умолчанию стремиться. Неудобство не то от чего по умолчанию нужно бежать
== Почему не стоит стремиться к удобству?
https://youtu.be/wJGE8IcOF-U
YouTube
Почему не стоит стремиться к удобству?
В своих материалах я отмечаю те инструменты, которыми сам пользуюсь, и некоторые люди мне аппелируют, говоря — нууу этоооо же неудобно! Неудобно!
Это хорошая тема для разговора. Давайте обсудим. Нужно ли стремиться к удобству? Удобство — это вообще хорошо?…
Это хорошая тема для разговора. Давайте обсудим. Нужно ли стремиться к удобству? Удобство — это вообще хорошо?…
Forwarded from НеЛамер
Не только для игр: восемь GeForce RTX 4090 вскрывают 8-значный пароль за 48 минут
GeForce RTX 4090 – стойка из восьми видеокарт, которая позволяет взломать восьмизначный пароль менее чем за час. О новинке рассказал ИБ-специалист Сэма Кроули, который выложил в своем Twitter результаты тестов по взлому паролей, проведенных на стойке.
Видеокарта отлично справляется даже с протоколом аутентификации Microsoft New Technology LAN Manager (NTLM) и Bcrypt. Все взломанные с помощью RTX 4090 пароли соответствовали актуальным методам безопасности и состояли из букв в случайном регистре, символов и цифр.
Для проведения тестов использовали HashCat V.6.2.6. Во всех типах атак, предусмотренных HashCat, видеокарта оказалась почти вдвое эффективнее RTX 3090.
#интересно
GeForce RTX 4090 – стойка из восьми видеокарт, которая позволяет взломать восьмизначный пароль менее чем за час. О новинке рассказал ИБ-специалист Сэма Кроули, который выложил в своем Twitter результаты тестов по взлому паролей, проведенных на стойке.
Видеокарта отлично справляется даже с протоколом аутентификации Microsoft New Technology LAN Manager (NTLM) и Bcrypt. Все взломанные с помощью RTX 4090 пароли соответствовали актуальным методам безопасности и состояли из букв в случайном регистре, символов и цифр.
Для проведения тестов использовали HashCat V.6.2.6. Во всех типах атак, предусмотренных HashCat, видеокарта оказалась почти вдвое эффективнее RTX 3090.
#интересно