BufWriter<Master<'_>> – Telegram
BufWriter<Master<'_>>
105 subscribers
451 photos
28 videos
34 files
1.7K links
https://www.patreon.com/alxe_master

Видео/статьи. Конспект и мои вольные комментарии по инженерии. тут только то, что считаю полезным для себя или других =)

#os, #cloud, #rust, #golang, #python, #javaScript, #cpp, etc
Download Telegram
Forwarded from Python Learning
Скачиваем HTML-код страницы с помощью Python

С помощью следующего фрагмента кода мы можем с легкостью получить HTML-код страницы в интеренете.
потрясающе. половина интернету не знает правильный ответ на ну очень простой вопрос
Forwarded from data будни (Саша Михайлов)
Английский в вакууме не котируется

Когда искал первую работу, думал что могу просить больше просто за тот факт, что знаю английский. Типа как при покупке техники в магазине: набираешь разных опций и за каждую общая цена увеличивается на сколько-то.

Поработав какое-то время, понял, что за всё время никто меня так и не попросил поговорить по английски или прочитать что-то. Так это не работает.

Просто так складывается, что всё самое новое и интересное в отрасли сначала публикуется на английском. Если интересна отрасль, то идешь и изучаешь.

То есть я думал, что связь прямая:
английскийбольше зарплата

А на самом деле она косвенная:
английский → изучаешь новое в первоисточниках → применяешь на практике → прокачиваешь навыки → больше зарплата

Тут важен именно последняя связка: больше навык → больше зп. Наверное, можно и без английского, но кажется это будет сложнее.
Объясните дилемму смещения-дисперсии (bias-variance tradeoff) и приведите примеры алгоритмов с высоким и низким смещением. (Тема: Алгоритмы)

Ответ

Смещение (bias) – это ошибка, внесенная в вашу модель из-за чрезмерного упрощения алгоритма машинного обучения, которое может привести к недообучению. В процессе обучения модели делаются упрощенные предположения, чтобы сделать целевую функцию более простой для понимания. Алгоритмы машинного обучения с низким смещением включают деревья решений, KNN и SVM. Высоким смещением, в частности, отличаются линейная и логистическая регрессия.

Дисперсия (variance) – это ошибка, внесенная в вашу модель сложным алгоритмом машинного обучения, при котором модель усваивает также и шум из тренировочного набора данных, что приводит к плохой точности на тестовом наборе данных. Это может привести к высокой чувствительности и переобучению.

Обычно, по мере усложения модели вы увидите снижение ошибки вследствие уменьшения смещения модели. Однако, это происходит только до определенной точки – и если вы будете усложнять свою модель дальше, в конце концов вы ее переобучите.

@machinelearning_interview
↪️ Что показывает P-значение о данных? (Тема: Статистика)

Ответ

P-значение используется для проверки значимости результатов после статистического теста гипотезы. P-значения помогают анализирующему делать выводы и всегда находятся в диапазоне между 0 и 1.

- P-значение, превышающее 0.05, обозначает недостаточные доказательства против нулевой гипотезы – а это значит, что нулевая гипотеза не может быть отвергнута.

- P-значение, меньшее 0.05, обозначает сильные доказательства против нулевой гипотезы – это значит, что нулевая гипотеза может быть отвергнута.

- P-значение, равное 0.05, находится на границе, то есть мы не можем сделать уверенного вывода о том, можно ли отвергнуть нулевую гипотезу.

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Как бы вы справились с разными формами сезонности

Ответ

В реальных данных временных рядов (например, количества плюшевых мишек, закупаемых на фабрике игрушек) часто встречаются различные виды сезонности, которые могут пересекаться друг с другом. Годичная сезонность, вроде пика перед Рождеством и летнего спада, может сочетаться с месячной, недельной или даже дневной сезонностью. Это делает временной ряд нестационарным, поскольку среднее значение переменной различно для разных периодов времени.

Лучший способ удаления сезонности из данных – это дифференцирование временного ряда. Это процесс получения разности между датой x и x минус период сезонности, которым может быть год, месяц, или что-нибудь другое. При этом первый период сырых данных теряется, поскольку из них нечего вычитать.

@machinelearning_interview
DDL, DML, DCL, TCL, DQL
Forwarded from GitHub Community
typesenseопенсорсный аналог elasticsearch и подобных search-движков, с годным колличеством функционала

Другими словами это быстрая поисковая система с более продуманной системой поиска

Ссылка на проект

GitHub | #Interesting #Cpp
== Анализ данных на языке SQL ч.4. Хранилища и витрины данных
https://youtu.be/wtm82_IY1sY

- OLTP
- DataMart
- datawarehouse
- звезда
- снежинка
- работа с календарем
- сурогатные ключи
- мусорные справочники
- несколько таблиц фактов
- быстроменяющаяся размерность
- горизонтальное разделение фактов
- горизонтальное секционирование фактов
- аддитивность фактов
- тип факт таблицы:
- - транзакционнная
- - периодическая
- - историческая (аккумулирующая)
хм.... симпотно
https://www.cnx-software.com/2022/10/10/pine64-ox64-sbc-bl808-risc-v-multi-protocol-wisoc-64mb-ram/
= $6-$8
- Alibaba T-head C906 64-bit RISC-V core @ 480MHz
- Alibaba T-head E907 32-bit RISC-V core @ 320MHz
- Memory – 64MB embedded DRAM
- Wireless 2.4 GHz 802.11 b/g/n Wi-Fi 4
для себя локально такое можно сделать. а вот для сервера или на работе - нет

зачем надо ?
- ускорить свой комп на пустом месте до 30% если у тебя процессор интел. много СОФТОВЫХ (а значит медленных) заплаток в ядре изза прощелков интела в организации работы изоляции процессов в защищенном и не защищенном режиме

== How to disable mitigations for CPU vulnerabilities
https://sleeplessbeastie.eu/2020/03/27/how-to-disable-mitigations-for-cpu-vulnerabilities/

спойлер
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash mitigations=off"
первый день Monjaro в кедах. полет нормальный. нормально. нравится