BIG BAD DATA – Telegram
BIG BAD DATA
140 subscribers
69 photos
1 video
9 files
31 links
Сложно о простом и просто о сложном 😎🥸
👀Меня можно найти тут: @Areson251
Download Telegram
Channel created
Начало положено)
👍2
Короче, не знаю даже с чего начать… Наверное, с самого важного:

ВНИМАНИЕ!!! ПИШУ НЕ ГРАМОТНО!!!

Такое себе начало, конечно😅 Но я считаю, что это важно уточнять, чтобы снять с себя ответственность за допускаемые ошибки😂


В общем, давно была идея создать подобный канал, дабы делиться своими мыслями, найденными интересными статьями, вырезками из лекций в институте и просто подготовкой к магистратуре.
Уже не секрет, что я хочу связать свою жизнь с наукой, развитием ии, преподаванием и прочей пургой. Так что я считаю полезным хотя бы попробовать вести подобный канал, научиться доходчиво излагать свои мысли и потянуть людей за собой в эту бездну познания мира😈

Не исключено, что где-то я могу ошибаться (не только в употреблении русского языка). Поэтому прошу Вас не стесняться и поправлять меня, выражать своё мнение и тоже делиться опытом или идеями) Будет интересно подискутировать на различные темы и даже попытаться найти между ними связь.


С наилучшими приветствиями, добро пожаловать!❤️

#info
3
А теперь самая сложная часть в создании канала: нужно найти подходящую авку😪
Channel photo updated
Лиза настояла на этой картинке
Как и на названии канала
Для начала, давайте расскажу Вам как я решила готовиться к магистратуре)

За основу взяла вопросы для поступления в ШАД (школа анализа данных от Яндекса).
В принципе, всю свою подготовку я оборачиваю вокруг шада, потому что мне кажется, что на данный момент это сильнейшая школа в области data science. Ну и сравнив со вступительными вопросами в МФТИ, здесь их немного больше. Поэтому будем считать их исчерпывающими😂 Так же, в источниках литературы приводится очень много ресурсов из курсов МФТИ и ВШЭ.
Распечатала значит и развесила к себе над рабочим столом, чтобы не забывать о моих великих делах😅 (картиночку прикреплю ниже). Всего 6 дисциплин для подготовки: алгебра, матанализ, комбинаторика, теория вероятностей, программирование и анализ данных. Вопросов я насчитала 57 штук. На первый взгляд кажется, что это немного, учитывая, что все вопросы из программы института. Но как только я села за учебники…
Ну ничего страшного, ведь главное - это дикое желание!!!))))

#dvizh
🔥3
🔥3
👆Вот так выглядят мои инженерные разработки (чтобы не портить скотчем обои)
Мама оценила
господи, как же сложно было настроить комментарии
BIG BAD DATA pinned «Короче, не знаю даже с чего начать… Наверное, с самого важного: ВНИМАНИЕ!!! ПИШУ НЕ ГРАМОТНО!!! Такое себе начало, конечно😅 Но я считаю, что это важно уточнять, чтобы снять с себя ответственность за допускаемые ошибки😂 В общем, давно была идея создать…»
Всем доброе утро!☀️
В продолжение вчерашней темы о подготовке


Не рассказала самое главное - каким образом я готовлюсь😂

На каждую тему я выделила по одному дню в рабочей неделе. С учетом того, что дисциплин 6, а не 5, вчера мне пришлось сделать 2 вопроса по относительно не сложным дисциплинам. Все сделанные вопросы я распечатываю и прикрепляю в специальную папочку (чуть позже продемонстрирую сие творение). Пока что я на этапе воспоминания и доизучения теории. Однако, это было не мое решение, а решение моего расписания и нехватки времени😂 Я не считаю правильным сначала изучить всю теорию, а потом начать решение задач, хотя другого выхода у меня сейчас нет. С учетом того, что по некоторым дисциплинам всего 4 - 6 вопросов, после их завершения у меня освободится время для решения задач по этим же и другим предметам. Так что, думаю, в январе я начну полноценно подтягивать себя по математике путём практики)
Кстати, в папку с вопросами я записываю только основную инфу типа определений, теорем, важных примеров и свойств, и т. д. Для доказательств, примеров решённых задач и т. п. я завела специальную общую тетрадочку с пометками, так сказать)
Ну и конечно же, как без общей папки на компе, где есть все вопросы, учебники и просто полезные источники😄

#dvizh
🔥2👍1
Вы знали, что есть аналог языка python чисто для научных вычислений?
Называется R

#about_ml
👏1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Разбирала вопрос по анализу данных на основные задачи машинного обучения.

Одной из таких задач является регрессия. Это способ обучения с учителем, тк у нас есть какое-то количество данных и «правильные ответы» к ним. Примером такого обучение может быть уже всеми излюбленный поиск каких-то объектов на изображении.

Недавно Влад отправил видос (ссылочку прикреплю ниже), где среди множества людей нейронка не могла определить человека, одетого в свитер с размытой фотографией базара😂
Честно говоря, не понимаю как такое могло произойти, потому что меня yolo v5 определяла как person по кусочку большого пальца ноги на фото😅😅😅
Но тем не менее, первое решение этой проблемы, которое мне приходит в голову - просто добавить в обучающий датасет картинки с человеком в этом свитере. Опять же, это решение максимально тривиальное, потому что где гарантия, что кто-то другой не догадается сделать кофту с другим подобным рисунком? Тогда уже это решение работать не будет.
Есть другой вариант - сделать синтетический датасет, где на кофты людей прикреплять уже существующие картинки😂 Сейчас поясню подробнее: мы берём уже существующую нейронку; прогоняем через неё все картинки, на которых она обучалась или другие; она определяет на них людей; в центр выделенного person вставляет рандомную размытую картинку из этого же датасета; обучить другую нейронку на новом датасете. Как Вам такой ход?🤣

Ссылка на видос: https://youtube.com/shorts/YIDfssT6lPY?feature=share

#phil_thoughts
👍2