BIG BAD DATA – Telegram
BIG BAD DATA
140 subscribers
69 photos
1 video
9 files
31 links
Сложно о простом и просто о сложном 😎🥸
👀Меня можно найти тут: @Areson251
Download Telegram
Я уверена, что все когда-нибудь слышали о таких методах мышления как ДЕДУКЦИЯ и ИНДУКЦИЯ💭
Захотелось немного поговорить об этом.

Дедукция - рассуждение от общего к частному (вспоминаем круги Эйлера, в большой круг полностью входит маленький круг). Пример:
1 ссылка. Все люди смертны
2 ссылка. Сократ - человек
Вывод. Сократ - смертен
На этом методе основана вся математика, потому что дедукция - абсолютно истинное рассуждение, которое ни в коем случае не допускает ошибок.
Раз этот способ так хорош, зачем тогда существует индукция? Затем, что первый метод имеет большой недостаток - отсутствие новой информации. Все умозаключения являются следствием из уже имеющихся.
К примеру, фермер каждый день на рассвете кормил цыпленка в течение нескольких месяцев. В один день цыпленок просыпается и делает вывод по дедукции (раз фермер кормил его каждый рассвет на протяжении всех прошлых дней => покормит сегодня). К его сожалению, в этот день фермер решил поесть суп на завтрак.

Индукция - рассуждение от частного к общему. Пример:
1 ссылка. Таня и Петя сдают экзамены
2 ссылка. Таня и Петя студенты
Вывод. Все студенты сдают экзамены
Кажется, что метод индукции делает поспешные выводы. В этом и заключается его недостаток - теории могут быть недостоверными, их нужно проверять. Один из интересных философских примеров такой: все люди до нас были смертны => мы и люди в будущем смертны. Но! Это индукционное высказывание, которое может быть ложным.
Однако, у этого метода есть преимущество перед первым - можно найти новую информацию. Я сразу вспомнила мутацию, необходимый генетический процесс для появления новых полезных признаков организмов.

Очередной раз убедились - чтобы добиться хороших результатов, нужно пользоваться не одним инструментом, а комбинировать разные

#phil_thoughts
👏1
Ну и конечно же старый анекдот про воздушный шар и математика

Два человека летели на воздушном шаре и потерялись. Видят, по земле идёт человек. Они к нему подлетели и спросили:
- Здравствуйте! Скажите, пожалуйста, где мы сейчас находимся?
Человек посмотрел на них, посмотрел по сторонам и ответил:
- Вы сейчас в корзине воздушного шара.
Люди взлетели на высоту и один другому говорит:
- Знаешь, я на 100% уверен, что этот человек математик.
- Почему ты так думаешь?
- Ну во- первых, он сначала подумал. Во-вторых, он сказал абсолютную правду. В-третьих, эта информация была бесполезна)))

К какой метод был применен здесь?😂
😁1
Решала сегодня задачку по проге, где нужно было перевести римские числа в арабские.
Сначала, традиционно решала через кучу условий (на удивление, такое решение прошло), но код показался мне совсем не эстетичным, поэтому я полезла в разбор задачи🤪

Открыла для себя инсайт (для кого-то он может быть очевидным):
Как вы все знаете, при увеличении счета римские цифры дописываются справа от предыдущих, но числа 4, 9, 40, 90, 400, 900 дописываются слева текущим порядком от следующего. Пример: VIII - 8, но IX - 9.
Встает вопрос, как красиво расшифровать большое римское число? Инсайт заключается в том, что любое такое число можно получить за счет его вычитания из текущего результата.
Возьмем к примеру тест из задачки: MCMXCIV - 1994. Парсим слева направо и на каждой итерации проверяем больше или меньше текущая цифра относительно следующей: цифру M прибавляем к результату как 1000, затем вычитаем цифру С (100-100=900) и прибавляем следующую цифру М (900+1000=1900) и так далее. Voilà! Мы получили правильный ответ!)
Так же работает, если число сразу начинается с 4 или 9. Например, для числа IX сначала из результата 0 нужно вычесть 1 (получаем -1) и далее прибавить 10 (получаем 9)

#phil_thoughts
👍2
Внезапно осознала, что мой метод подготовки (сначала теория, потом практика) в моем случае неверный😬

Так что в следующий раз приступлю к разбору теории только перед собеседованием, а сейчас делаю упор на задачи!

В одной беседе по подготовке встретила такую задачу (кто расскажет мой любимый анекдот про математиков, тому + балл):

Заходят как-то 322 математика в бар, нумеруются от 1 до 322, каждый выбирает наугад кого-то кроме себя и записывает его номер на бумажку. Бармен вызывает первого математика, он заказывает пиво тому кто написан у него на листке, после чего к бармену подходит следующий по очереди математик кому еще не заказали пиво, заказывает тому кто написан у него на листке и так далее. Сколько математиков останется без пива в матожидании. (Матожидание можно понимать как среднее значение)

Правильный ответ выложу завтра (если я его найду😅)

#info
👍1
Вот я тут рассказываю про методы искусственного интеллекта, про решаемые задачи и траектории его развития...
А собственно, с чего все началось??? Как люди пришли к идее и уже частичной реализации себе подобных?

На самом деле, все началось еще с Аристотеля, который впервые задумался о формализации человеческого мышления. Его идеи обрели ценность только спустя многие столетия и были интегрированы в автоматизированные устройства.
В конце 1950-х годов люди сфокусировались на создании алгоритмов, способных принимать решения в различных играх и головоломках (шашки, шахматы). В следующем десятилетии появились задачи на умение "мыслить" не в искусственно созданных условиях, а в реальных. Были разработаны первые роботы, а также всеми любимый язык* Lisp😍 Тогда же появились первые генетические алгоритмы, понятия нечеткой логики и нечетких множеств (Лотфи Заде).
Спустя некоторое время появляется другой всеми любимый язык Prolog😏 Формулируется задача о представлении знаний и общении с машиной на естественном языке. На текущее время, существует два основных направления развития ИИ:
- восприятия человеческой деятельности, анализ и попытка повторить результат;
- изучение психологических, анатомических, химических механизмов деятельности человека и их воспроизведение.

* под всеми любимыми понимается студенты ИжГТУ

#about_ml
👍1
мотивационное письмо.pdf
153 KB
🎉 У меня радостные новости!!! 🎉

с 24 по 28 апреля пройдет образовательный форум в МФТИ по искусственному интеллекту, математике и физике. "Образовательный форум в МФТИ — это встречи с учеными на лекциях и общение с ними «без галстуков», хакатоны по искусственному интеллекту и физике, экскурсии в лаборатории знаменитых институтов и центров передовых знаний и компетенций. Участников форума ждет разнообразие исследовательской тематики: от биофизики до физики нейтрино, от алгебры логики до методов трехмерного компьютерного зрения."

Участники данного мероприятия отбирались по их мотивационным письмам. Так вот.
Мою заявку одобрили!!!🥳🥳🥳

Так что в конце апреля еду покорять Москву🥸

Приложу свое мотивационное письмо для тех, кому интересно почитать)

#dvizh
👏5
Есть два основных подхода построения систем искусственного интеллекта: информационный и нейробионический.

Информационный подход (также его называют нисходящим или "сверху-вниз") основывается на объяснении полученных результатов и принятых решениях Такие экспертные системы подразумевают собой отсутствие каких-либо знаний и навыков логического вывода, но при этом они умеют имитировать психическое поведение человека: речь, эмоции, творчество и рассуждения. На сегодняшний день этот метод считается наиболее проработанным, хотя его результаты все так же далеки от результатов работы человеческого мышления.

Нейробионический подход (по аналогии восходящий или "снизу-вверх") занимается воспроизведением биологических структур мозга и его механизмов. Сюда же входит создание соответствующих систем: нейрокомпьютеров и биокомпьютеров. Этот подход чаще всего продвигают писатели и режиссеры: машина начинает чувствовать и ощущать себя. Однако сразу же назревает вопрос: в какой момент можно определить машину как осознанную? Есть много предположительных решений. Например, всем знаменитый тест британского математика Алана Тьюринга, суть которого заключается в диалоге машины и человека, в ходе которого человек не поймет, что общается с искусственным интеллектом (есть шутка про доп. баллы за то, что система заставит думать человека, что он сам является машиной😳).

В любом случае, создание действительно разумного интеллекта еще далеко, так что можно не волноваться, что он отнимет у нас работу😅

#about_ml
Полтора часа ушло на то, чтобы разобраться какой подход за что отвечает🫠
Почему-то во многих русскоязычных источниках противоречат эти два понятия, хотя пишут +- одно и то же. К тому же, нашла информацию, что сторонники первого подхода считают, что возможно создать полностью самостоятельный и мыслящий ии, а сторонники второго подхода - нет.
Лично мне непонятно почему так🤷‍♀️
Вроде казалось бы, создание машины, полностью повторяющее строение человеческого мозга, должно вести за собой и повторение его процессов, то бишь повторение мышления человека.
Так и не поняла, почему нейробионический подход считает иначе.

#about_ml
Так, что-то я совсем выпала из реальности с этой учебой…

Из новостей:
1. Финал «Я - профи» по математике уже завтра. Я совсем не подготовилась к нему, поэтому залечу туда чисто ради интереса. Очень смущает дистанционный формат довольно серьезного мероприятия - жесткие требования для участников: наличие микрофона и камеры, направленной на тебя, твои руки и твой стол; хорошая скорость инета и куча всего другого. Первый раз с таким сталкиваюсь, поэтому немного не по себе😬
2. Начала читать книжку «Наука о данных», которую скидывала в одном из постов. Очень сильно зацепило, потому что написано лёгким и простым языком, даже с юмором))) Затрагиваются обширные темы максимально поверхностно, но очень эффективно, чего достаточно на первоначальном этапе изучения data science.
3. Готовлюсь к поездке на день открытых дверей в МФТИ. Планирую осмотреться в студ. городке, т.к. раньше никогда не была в Долгопрудном. Ну и естественно, максимум узнать про магу, экзы, научруков и общаги. (Хотя скорее всего, я больше узнаю на форуме)
4. Начинаю со следующей недели усиленно заниматься дипломом. К сожалению, по стечению обстоятельств моя крутая идея с распознанием превратилась в обычную визуальную обертку 😢 Ладно, если честно, всегда считаю, что никто и ничто не причастны к событиям, кроме меня самой ахахахах. Так что будем стараться выкручиваться из ситуации и вывозить на ‘’междустрочных’’ темах.

Как всегда, не теряю духа и мотивации, смотрю только вперёд😎 Как сказал мой учитель физики: «Беги в направлении своей мечты. Если не можешь бежать, то иди. Если не можешь идти, тогда ползи. Ну а если и ползти не можешь, тогда лежи в ее направлении!»

#dvizh
🔥4
Ну вот, начало форума МФТИ по искусственному интеллекту уже завтра😊
Сижу, жду самолет. Немного волнуюсь…
Но ничего страшного, ведь уже сегодня меня ждет знакомство с интересными людьми, а завтра куча увлекательных лекций☺️
Буду стараться писать конспекты в этот паблик. Наверное, многим будет интересно, что это вообще за тусовка?)

#dvizh
👍6
Прошел первый день форума
У меня взорвался мозг от количества новой информации🤯 К слову, новым было абсолютно все)))

Начну с самого начала. Как я поняла, главным спонсором является medtech Moscow (за рекламу мне не платят). В этой компании есть стажировка. И как они пообещали, у них больше денег на зп, чем в яндексе. Еще одна крутая плюшка, это то, что они могут предоставить проживание иногородним.
Компания занимается кучей стартапов в области медицины, основные из них:
1. По по разработке протезов.
2. Моделирование взаимодействия препаратов фармацевтики.
3. Реабилитационная технология временной нейровизуальной стимуляции.
4. Генетика. Секвенирование и другие умные слова.
5. Компьютерное зрение по оценке анализов. У них есть размеченные данные анализов 13,5 млн человек!!!
6. Медицинское оборудование. Мониторинг глюкозы.

О лекциях напишу чуть позже, как появится свободное время :)

#dvizh
👍4
Итак, первая лекция была от директора Физтех-школы прикладной математики и информатики (ФПМИ) Андрея Михайловича Райгородского по сложным сетям и графам 🔀

Простым языком сложные сети имеют очень много вершин, и при этом у них постоянно меняются ребра. Ярким примером служат социальные сети, которыми мы все так активно пользуемся))
Поясняю:
Человек в соц. сети создает аккаунт - так появляется вершинка графа;
Затем, человек отправляет запросы в друзья другим людям. Некоторые из них принимают заявку и образуется связь между двумя вершинками, то бишь ребро;
Затем кому-то из них (или обоим ахах) может захотеться разорвать эту связь и они удаляют человека из друзей => ребро исчезает;
Итак постоянно повторяются пункты с 1 по 3 не останавливаясь 24/7. Поэтому, существует огромное количество акаунтов и их ребра постоянно пропадают и исчезают.

На лекции было много много математики, которую я сама-то толком не поняла 🫤 По словам Райгородского, меня «КОКНУЛИ» еще в начале лекции😂
Ну ладно, лекцию обещали выложить в общий доступ, так что будем нагонять…
Тем более, графы - ваще кайфовая тема (я считаю).

#about_ml
👍2🔥1
Как мне кажется, на текущий момент самая интересная часть форума - хакатон (от него у меня больше всего эмоций 🥹). Коротко расскажу об этом мероприятии.
Мы группировались в команды по 1-4 человека и выбирали одну из 3-х предложенных задачек: позиционирование на территории кампуса МФТИ; распознавание магнитограмм; повышение разрешения аэродинамических полей. Наша команда четырех супер-девочек решила выбрать первую задачу😎

Суть задачи в чем. Есть робот, который прокатился зимой и весной в разное время суток по территории института и «зафиксировал» свои треки. В каждый такой трек (было всего 3) входят изображения с передней и задней камеры (моменты снимков с двух камер соответствуют друг другу), семантические данные с лидара, какие-то бортовые данные и текстовое описание каждой картинки. Интересно, что это описание формировалось путем прогона всех картинок через miniGPT-4. В итоге, положение робота определялось таким образом: берутся все картинки из первого трека, сравниваются со всеми картинками из второго трека и находятся пары наиболее схожих картинок. Ответ формируется из всех сочетаний трех треков (С из 3 по 2: всего 6 сочетаний). Также, организаторы предложили нам базовое решение, которое нужно было улучшать любыми способами😂
К сожалению, мы не додумались тюнить исходную модельку, поэтому мы работали только с ее выходными данными. Идея была в токенизации текста картинок и составлении таблицы сходств двух картинок. После чего, проверяем сходства из модельки с нашим решением и с вероятностью 0.8 в пользу модельки выбираем правильный ответ (только при условии, что ответы модельки и наши отличаются).
Опять же, у нас ушло много времени на запуск базового решения из-за технических особенностей сред. Поэтому, мы не успели реализовать до конца нашу идею и остались просто участниками, а не призерами😢
Но! Я не расстраиваюсь. Я получила огромный опыт в участии в подобных мероприятиях и дико горю желанием заниматься подобными вещами дальше!!! Думаю, в следующем году тоже поеду сюда с конкретной целью побеждать в хакатоне😁

#dvizh
👍5
Немного подробнее с нашим решением можно ознакомиться в нашей презентации для защиты 👇
👍3
Кстати, вот так выглядит этот робот)
👍3
Ну вот, форум закончился 😢
Я бесконечно рада, что посетила это мероприятие и планирую дальше искать и кататься по подобным штукам. Получила для себя множество знаний, навыков, знакомств и океаны эмоций

#dvizh
👍5
Меня до сих пор не отпускают впечатления от форума😭
Особенно от лекций)) Большинство из них было, конечно, про RL - обучение с подкреплением. Но об этом расскажу позже.

Сейчас мне хочется поделиться темой, которая произвела на меня наиболее сильное впечатление - импульсные нейронные сети (ИНС). Их структура копирует принципы функционирования биологических нейронов. Это означает, что информация внутри них передается только за счет сигналов нейронов, называемых спайками. Функционирование разных нейронов никак явно между собой не синхронизировано. Если информация имеет числовой характер, то ее можно закодировать популяционно-частотным кодированием (повышение частоты порождения спайков определенной группой нейронов) и позиционным кодированием (задается порядок получения спайков на выходах сети). Если же информация имеет характер символов, то используется так же позиционное кодирование и пространственно-временное (информация задается не только определенной последовательностью импульсов во времени, но они еще и должны исходить от определенной группы нейронов).
Обучение ИНС происходит так же, как и у традиционных сетей - с помощью изменения синоптических весов. Однако из-за дискретности сети не получается применять градиентные методы обучения (метод распространения обратной ошибки). Хотя говорят, что существуют проекции традиционных методов обучения)
Основной подход в обучении - выявление корреляции в потоках импульсов. Первый этап: обучение без учителя - поиск корреляций во входном сигнале. Второй этап: обучение с учителем - поиск корреляций между входным импульсом и импульсом, кодирующим целевую переменную. Третий этап: обучение с подкреплением - поиск корреляций между входным сигналом, выходным сигналом и оценочным сигналом (возможно – с временной задержкой).

Автор лекции Михаил Киселев АО «лаборатория Касперского».

#about_ml
2
Кстати, хочу уточнить у Вас, товарищи, всем ли понятны термины обучения с подкреплением, учителем и без? Или все же стоит подробнее разобрать эту тему и расставить все точки над i?