Aspiring Data Science – Telegram
Aspiring Data Science
385 subscribers
465 photos
12 videos
12 files
2.15K links
Заметки экономиста о программировании, прогнозировании и принятии решений, научном методе познания.
Контакт: @fingoldo

I call myself a data scientist because I know just enough math, economics & programming to be dangerous.
Download Telegram
А вообще, конечно, интересно. Даже сериальчик есть на эту тему, John Doe.

https://ru.wikipedia.org/wiki/%D0%9E%D0%BA%D0%BE%D0%BB%D0%BE%D1%81%D0%BC%D0%B5%D1%80%D1%82%D0%BD%D1%8B%D0%B5_%D0%BF%D0%B5%D1%80%D0%B5%D0%B6%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F
#openings #johndoe #neardeath

"In the opening scene of the series' pilot episode, a mysterious man awakens on an island off the coast of Seattle, Washington, naked, with absolutely no memory of who he is or how he got there. However, apart from the details of his own past, "John Doe", as he comes to call himself, seems to have access to the sum total of all human knowledge: he knows how many dimples are on a golf ball, the population of Morocco, and other such obscure (and not-so-obscure) facts."

https://www.youtube.com/watch?v=P4SOxu2XbKM&ab_channel=zumanji
"Сканирование мозга практикующих осознанные сновидения подтверждает достоверность существования данного состояния психики. В фазе быстрого движения глаз у этих людей активен дорсолатеральный участок префронтальной коры головного мозга, отвечающий за сознание, который бездействует во время обычного сновидения. Красочность и осознанность сновидения прямо пропорциональна зафиксированной мозговой активности дорсолатерального участка.

В 2011 году Обществом Макса Планка в Мюнхене были впервые применены аппараты магнитно-резонансной томографии и электроэнцефалографии для изучения содержания сновидения и коммуникации со сновидцем. Были отобраны несколько человек, заявлявших о своей способности видеть осознанные сновидения. Перед началом испытания учёные дали им задание — после того, как они осознают себя во сне, они должны будут поочерёдно сжимать кулаки, сначала правый, затем левый. На головах испытуемых были установлены датчики ЭЭГ, дабы с точностью установить время начала БДГ-фазы, а далее добровольцев поместили в аппарат МРТ. Сканирование мозга показало, что после начала осознанного сновидения у подопытных активизировалась чувственно-моторная кора головного мозга, регулирующая сжатие кулаков, более того, МРТ показала, что кулаки сжимаются, и учёным даже удалось установить последовательность сжимания кулаков разных рук. С помощью ближнего инфракрасного диапазона было также установлено, что во время эксперимента у испытуемых наблюдалось повышение активности области мозга, отвечающей за планирование движений."

https://ru.wikipedia.org/wiki/%D0%9E%D1%81%D0%BE%D0%B7%D0%BD%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D1%81%D0%BD%D0%BE%D0%B2%D0%B8%D0%B4%D0%B5%D0%BD%D0%B8%D1%8F
#sun

"Выброс коронарной массы Солнца — частиц солнечного вещества в виде облака плазмы — крайне тяжело наблюдать, особенно если он направлен в сторону Земли. На фоне Солнца его банально не видно, особенно если выброс КВМ происходит без вспышек на Солнце. Учёные ожидали чего-то подобного поле появления на нашей звезде огромного тёмного пятна размерами с 20–30 диаметров Земли, но не смогли оценить масштаб последствий этого явления."

https://3dnews.ru/1084019/gigantskoe-pyatno-na-solntse-stalo-prichinoy-silneyshey-za-poslednie-shest-let-geomagnitnoy-buri-na-zemle
"Гордон Мур (Gordon Moore), стоявший у истоков корпорации Intel, называл себя «случайным предпринимателем», но окружающие считали его талантливым инженером, позволившим создать одну из крупнейших компаний в полупроводниковой отрасли. Ещё в шестидесятых годах прошлого века ему удалось предсказать принципы развития всей индустрии. В минувшую пятницу Гордон Мур ушёл из жизни в возрасте 94 лет.

Сооснователь Intel давно находился на пенсии, и свои последние дни провёл в доме на Гавайях в окружении семьи и близких. В браке с женой Бетти он состоял с 1950 года, у них родилось двое детей. После выхода на заслуженный отдых Гордон Мур много времени уделял путешествиям и рыбалке, а последнее из увлечений подтолкнуло его основать благотворительный фонд, который занимался сохранением водной фауны в различных регионах планеты. Личное благосостояние Гордона Мура журнал Forbes на начало текущего года оценивал в $7,2 млрд."

https://3dnews.ru/1084010/ne-stalo-gordona-mura-odnogo-iz-osnovateley-intel-i-avtora-zakona-opredelivshego-razvitie-poluprovodnikovoy-otrasli
#gpt #ai #inventions

Помнится, последним учёным, который ещё мог быть универсалом во всех науках, называли Ломоносова. С тех пор знания настолько углубились, и продолжают накапливаться, что человек не просто не может освоить новую область, ему нужно ежедневно читать хотя бы несколько публикаций, чтобы просто оставаться профессионалом в своей области (при том, что выходят сотни). Вместе с тем, для расширения кругозора советуют изучать, хотя бы неглубоко, и другие дисциплины, и пытаться заимствовать интересные идеи и способы решения проблем оттуда. О том же, по сути, и метод Цеттелькастен. Мне кажется, сейчас золотое время для реальных научных открытий, сделанных с помощью ИИ. GPT-4 не превосходит среднего специалиста-человека в глубине познания, но точно превосходит любого человека в широте познаний. Думается, если правильно сформулировать к ней запросы, делая упор именно на мультидисциплинарность, она сможет применить старые концепции в новых областях, получив поразительные результаты. Возможно, правда, для этого ей потребуется особое дообучение. Никогда у нас не было доступа к собеседнику, не просто знающему всё обо всём, но и способному связать понятия из разных областей и дать внятный ответ. Никто не желает потестировать её на задачах ТРИЗ?
👍1🔥1🤯1
Forwarded from R&DL (Николай Стрекопытов)
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на новость о сервисе whimsical.com, он предназначен для построения mind-карт. И в него добавили фичу добавления Ai-сгенерированных вершин. Проверил и это действительно круто работает. То, о чем я брейнштормил с другом несколько часов выдалось за пару кликов.

Мы живем во время, в котором все большую ценность приобретают навыки правильно задать вопрос и проверить ответ, а вот поиск ответа за последние десятилетия все более и более автоматизируется.

Думаю может добавить к тематикам блога реалистичный AI-оптимизм. Будет небольшой уголок спокойного предвкушения светлого будущего, а то утомила эта тревога сменяющаяся восторгом и наоборот. Что скажете?

#ai_инструменты
🔥1
Forwarded from partially unsupervised
Предсказание: в ближайшие пару лет Rust наконец-то пойдет в массы.

Rust уже давно был в странной позиции самого любимого языка, на котором пишут в основном пет-проекты и редкие системы с повышенными требованиями к безопасности (читай веб3 и криптографию). Порог входа относительно высокий, разработчиков на рынке мало - нужно быть довольно рисковым, чтобы стартовать новый проект на нем. Но кажется, что для него есть еще две созревшие ниши:
1) очевидная - язык для dev-инструментов,
2) неочевидная - быть вторым языком в проекте.

Эти две ниши хорошо сочетаются.

Rust хорошо интегрируется с двумя самыми популярными языками современности: c Python через maturin, с JS через WebAssembly. Я не знаком с миром JS, видел краем глаза пару примеров дев-тулов на расте. В Python тусовке знаю больше: набирающий популярность линтер, два популярных токенайзера
(второй используют OpenAI!), новая версия валидатора pydantic. Уверен, что в течение пары лет появится популярный Python веб-фреймворк типа FastAPI/Starlite с ядром, написанным на расте.

И тут я наконец вверну кусок про LLM. У нас на работе Rust уже давно использовался именно как второй язык бэкенда, для ускорения узких мест, и за день перед отпуском (не начинать же Большую Задачу) в обучающих целях я решил слегка ускорить кусок препроцессинга. Нашел профайлером пару относительно медленных функций, скормил их в GPT-4, получил аналог на расте, поправил пару мест, повозился с интеграцией, получил комментарий на ревью от человека, который, в отличие от меня, на расте писать умеет, починил, смержил. Короче, оно уже в проде (люблю запах деплоя пятничными вечерами!), экономит 1 ms на запрос (в масштабах тысяч RPS имеет некоторый смысл), а ведь я даже учебник по расту не дочитал.

В мире JS уже есть даже специальные курсы типа Rust for JS devs. Думаю, автор учебника Rust for Python developers будет крайне успешен. Если кто-то из читателей хочет этим заняться, но не знает, как начать, пишите - поделюсь опытом работы с издательством.
🔥1
#ml #geometry #informationtheory

Любопытный пакет infotopo для расчёта и визуализации всяких энтропий, взаимных информаций и прочего на решётках (почти на гриле). От французских учёных.

https://infotopo.readthedocs.io/en/latest/basic_methods.html
👍1
Asymmetric Dependence Measurement and Testing
H. D. Vinod, December 1, 2022

https://arxiv.org/pdf/2211.16645.pdf
#statistics #fitter

Как компактно описать 1d массив данных неизвестной природы в разумное время? Авторы fitter-а упоминают 80+ распределений из scipy (а по факту фиттятся уже 109). Это занимает даже на скромном массиве длины 1_000 уже 2.5 минуты. При этом многие распределения ну явно близняшки. На добрую половину наверняка не стоило тратить время. Как бы соптимайзить? Найти что-то вроде "опорных распределений"... Best bang for your buck.

get_common_distributions() даёт [ "cauchy", "chi2", "expon", "exponpow", "gamma", "lognorm", "norm", "powerlaw", "rayleigh", "uniform"], но по какому принципу они выбраны?

Хотелось бы получить о данных наиболее полную картину, используя как можно меньше распределений. К примеру, что, если входные данные - это микс 3 распределений?

https://github.com/cokelaer/fitter/issues/81
🔥1
#chatgpt #ml

Эх, ребята, расходимся пока, на вопросах чуть сложнее среднего ИИ пока буксует (
#fitter #highperf #parallel #codereview

Ну начинается. Хоть не смотри никуда. В fitter-e заявлен параллельный подгон распределений. Думаю, чо это оно не грузит процессор? Лезу в код. Ааааа, вот оно как. Какой смысл параллелить CPU-intensive задачи питоновским тредингом? Меняю бэкенд на loky, рестарт ядра, время расчёта падает с 4 минут до 40 секунд, загрузка CPU на 4/8 ядрах потоках уже полная. Правда, с графика пропадают результаты, т.к. текущий класс сохраняет расчёты в свой внутренний словарик, который, видимо, копируется между процессами и в итоге никуда не попадает.
👍1
#fitter #highperf #parallel #codereview

В общем, интересный подход к решению. Вместо того, чтобы сделать расчёт параллельным (как вообще-то написано в доке), он сделан однопоточным, но при этом каждое распределение выполняется в ОТДЕЛЬНОМ потоке, который убивается, если расчет не успевает завершиться через N=30 секунд. Оригинально!
#fitter #highperf #parallel #codereview

Это что, сборник антипаттернов?
"Компания ещё в 2019 году для обучаемого проектирования СБИС представила ускоряемый GPU фреймворк DREAMPlace на базе нейронных сетей, от которого ожидала 40-кратного ускорения размещения транзисторов в СБИС. В новой работе на примере оптимизации дизайна чипа с 2,7 млн ячеек и 320 макросами было показано, что система на базе одной системы NVIDIA DGX Station A100 справилась с работой всего за 3 часа."


https://3dnews.ru/1084116/nvidia-dokazala-znachitelnuyu-polzu-iskusstvennogo-intellekta-pri-proektirovanii-sbis
🆒1