[Другая]стратегия – Telegram
[Другая]стратегия
1.04K subscribers
92 photos
3 files
189 links
Data-driven винегрет: науч-тех политика, бодрая аналитика & примкнувший к ним нарративный дизайн

Чата нет, но со мной [почти всегда] можно поговорить: @natallia_andreeva
Download Telegram
#воскресное_чтиво

Ознакомилась с тремя книгами про deep tech; взгрустнула.

Вкратце:

1️⃣ "Present Future: Deep Tech Revolution" (2021; Guy Perelmuter): добротная обзорная публицистика про технологии. С точки зрения набора технологий - ничего особенного: ИИ, IoT, кванты, крипта, кибербез, AR / VR, биотех и пр., - но можно почитать чисто ради расширения тоннеля реальности. Видно, что автор из венчура – и что он разбирается в вопросе.

2️⃣ "Deep Tech: Demystifying the Breakthrough Technologies That Will Revolutionize Everything" (2021; Eric Redmond): тоже публицистика, но уже оч странная, с попыткой в рыночный прогноз, который выглядит откровенным надувательством - и зайдёт разве что людям, вообще ничего не понимающим в том, как работает технологический бизнес. Книга явно писалась как инструмент самопромоушена; получилось так себе.

3️⃣ "Deep Tech and The Amplified Organization" (2021; Simon Robinson, Igor Couto и др.): годится только для ознакомления с тем, что консалтеры нонче продают deep tech'у – 4P-планирование (platforms, purpose, people, planet); [эко]системный подход; дизайн, отталкивающийся от Великой Миссии, - стандартный набор заклинаний, короче. Очень заметно, что консалтеры писали. Причём из тех, кто понимает в предмете чуть менее чем ничего, но зато знает много красивых слов.

Но, несмотря на общую бессодержательность, все три книги невольно подсвечивают два забавных момента:

1️⃣ Мало кто реально разбирается, как устроен бизнес в биг теке, как в него инвестировать - и, главное, как и когда эти инвестиции должны отбиться. Причина очевидна: далеко не по всем big tech направлениям уже сложились понятные продуктовые линейки, и потому проще и безопаснее говорить про технологии, а не про деятельность и деньги.

2️⃣ Brace yourselves, big tech заметили глобальные консалтеры: все три книги вышли в 2021 году, ровненько попав в [первую] волну профильных консалтерских продуктов на тему deep tech'а (например, от BCG: что такое биг тек, как и зачем компании должны в него инвестировать, вот это вот всё).
🔥5👍2
#про_технологическое_развитие

Если вы вдруг пропустили: 20 мая правительство утвердило концепцию технологического развития РФ до 2030 года.

Что, на мой вкус, хорошо:

1️⃣ Презумпция права венчура на риск (если, конечно, удастся реально трансформировать историю с "как бы нас не посадили") - и на то, чтобы закрывать не взлетевшие проекты, а не тащить их годами, прикрываясь фиговым листочком отчётности.

2️⃣ Механизмы, которые позволят в рамках одного проекта "вести" технологию по всем TRL; хотя это потребует радикальных изменений в требованиях к получателям денег (как это, например, сделали США).

Что не оч:

1️⃣ Ставка на "объединения" как на двигатель прогресса. Кто делал руками, скажем, науч-тех консорциумы (я вот делала, хех), тот знает, что это задача в духе "а если он зять Рокфеллера". Невозможно заставить сотрудничать людей, у которых нет наработанного десятилетиями ресурса взаимного доверия. Фантастика у нас в другом отделе, ну.

2️⃣ Новые оргуправленческие сущности (опять). Проекты-маяки, индустриальные мега-проекты, очередные центры компетенций, чёрта в ступе. Понятно, что по-другому сложно перераспределить деньги, но опять, опять всех затянет в колесо сансары гос. хайпа.

3️⃣ По-прежнему грустный перечень сквозных технологий, не связанный с реальными проблемами реальных людей.

И пара заметок на полях:

1️⃣ "Стратегия" как формат федерального госпланирования из управления НТР исчезла [за ненадобностью]. И это окей: в условиях турбулентности остаются два горизонта - 5+ лет (и его в наших текущих госуправленческих реалиях логично оформлять "концепциями") и короткий ("план": что делаем в ближайший год).

2️⃣ Предпринята попытка привнести смысл в деятельность РАНовских советов по приоритетным направлениям - за счёт включения туда людей из реального мира (технологи, конструктора и пр.). Я, блин, готова заплатить денег, чтобы на это посмотреть. 🍿

И да: как бы меня ни радовало наличие в концепции внятных и логичных предложений, я понимаю, что всё в любом случае упрётся в реализацию этого дела.
🔥10
#диалоги_в_танке

А: Коллега, а вот у вас есть "сильные идеи для нового времени"?

У: Да. Сделать российский аналог прозака - и раздавать его бесплатно.

(sorry not sorry, просто не могу молчать)
🤣10🔥3
#про_цифровую_трансформацию #продуктовый_подход

Удобнее всего отслеживать актуальные проблемы компаний по продуктам / услугам, которые предлагают глобальные консультанты. Вот, например, забавное происходит с цифровой трансформацией.

Внешне нонешние консалтерские заклинания предложения по ЦТ выглядят уныло: движение от vision к дорожным картам; важность данных; цифровая трансформация - основа для ESG и resilience; важность талантов; будущее - за "human + digital". В общем, ничего нового.

Но есть нюанс: уныние вызвано тем, что "стратегия цифровой трансформации" (как продукт) - это уходящая натура. Потому что консалтеры начинают предлагать своим клиентам не "стратегии ЦТ", а создание продуктов / сервисов / бизнесов под ключ - ИЧХС, и цифровых, и не цифровых:

1️⃣ BCG в конце 2022 года создало спец подразделение - BCG X, которое занимается разработкой продуктов / сервисов по заказу, внедрением ИИ-решений и, заодно, созданием бизнесов с ноля - со специализацией в deep tech'е и зелёных технологиях. 3000+ сотрудников (дизайнеры, инженеры, ITшники, венчуристы, далее везде); филиалы в 80 городах.

2️⃣ В Bain уже пару лет работает подразделение Vector - 1000+ человек, пилящих продукты для заказчиков (UI / UX дизайнеры, дата-инженеры и пр.) и, заодно, сопровождающих ЦТ (в т.ч. на позиции CIO) .

3️⃣ McKinsey продаёт трансформацию customer journey (которая, естественно, означает пересборку бизнес-процессов end-to-end) и полноценный UX.

4️⃣ А вот из большой четверки, как ни странно, приличные продуктовые истории продаёт только Deloitte (CX, полная пересборка customer journey и пр.); у E&Y есть разрозненные куски product development (digital business building и CX); KPMG обещает всем UX, но продукта у них, кажется, ещё нет; а PwC вообще игнорирует продукты - по-прежнему занимается продажей цифровых решений от third parties.

Ну то есть все осознали, что ЦТ без понимания потребителей и продуктов - аналог пива без водки. Это хорошо.

А плохо - то, что шутки про инфантилизацию заказчиков уже не кажутся шутками. 😅
👍4🔥4🤣1
#про_цифровую_трансформацию

Читаю тут кое-какую аналитикуТМ про российский IT-сектор и разную цифру; ловлю себя на том, что громко и с выражением разговариваю с монитором.

▪️"В 2022 году 63% крупных и средних предприятий сохранили тенденцию роста инвестиционной активности в цифровое и технологическое развитие"

Я прямо даже не знаю, что тут сказать цензурного. Ну вот представьте: у вас обокрали квартиру, вынесли холодильник, стиральную машину, три ноутбука и ещё кое-чего по мелочи. Считается ли покупка новой техники "тенденцией роста инвестиционной активности"? Или это вынужденная мера и незапланированные расходы?

▪️"По данным СПАРК, в российском IT-секторе в 2022 году появилось много новых малых и средних предприятий, это - наглядный маркер того, что всё хорошо"

Ребята, в 2022 году все мало-мальски соображающие компании просто вывели своих ITшников в отдельные юрлица, чтобы на налогах сэкономить.

▪️"Спрос на российские облачные решения был обусловлен ростом доверия бизнеса к отечественным IT-решениям"

Во-первых, как уже было сказано: многие компании, проинвестировавшие в свою IT-инфраструктуру с упором на зарубежные решения, остались у разбитого корыта. И предпочли обойтись малой кровью: проще (и, в краткосрочной перспективе, дешевле) заплатить условному Яндексу, чем покупать недоделки или делать что-то своё, рискуя обрушить все бизнес-процессы.

Во-вторых, всем окологосударственным компаниям тупо запретили пользоваться зарубежными облаками (запретили, во многом, резонно, но тем не менее). У нас все леса секретные (с), ну.

... В общем, испытываю жгучий испанский стыд. Отчасти потому, что лет двенадцать назад я тоже была "чистым" аналитиком - и тоже, наверное, могла сморозить что-то в этом роде. Но not anymore, слава труду. 😅
🔥9👍2
#воскресное_чтиво #про_цифровую_трансформацию

Пролистала тут на досуге "Rewired" (2023) - свежую книгу от McKinsey про цифровую трансформацию компаний.

Сама по себе книга - стандартный мануал: роад-маппинг и приоритезация доменов ЦТ (North Star, серьёзно?.. вы ещё "инновационный метод "мозгового штурма" предложите); HR и таланты; операционные модели; организация разработки собственных проприетарных решений (DevSecOps, MLOps, далее везде); датизация всего и вся. Любой, кто сделал хоть одну стратегию ЦТ, знает всё это не хуже досточтимых авторов.

Но в "Rewired", тем не менее, есть несколько забавных моментов, которые красиво нюансируют и ситуацию в ЦТ, и ситуацию в консалтинге:

1️⃣ Коллеги из McKinsey говорят не только о "цифровой трансформации", но и об "ИИ-трансформации", выделяя её в отдельную категорию. И это, кмк, означает две вещи: а) никто, на самом-то деле, не знает, что такое ИИ-трансформация (и ровно поэтому она идёт отдельно от цифры), б) по ходу, на очереди у нас "квантовая трансформация", "трансформация периферийных вычислений" и прочий, извините, фронтир.

2️⃣ Консалтеры позиционируют ЦТ не как просто "трансформацию", а как "постоянную трансформацию". Ну то есть закончить её невозможно: хошь не хошь, а придётся раскошеливаться и внедрять все новые технологические решения, которые будет выкатить big tech, и снова и снова платить консалтерам. Потому что всё это - гонка вооружений, и менее вооружённый подохнет без прощения проиграет.

(правда, каким образом на фоне постоянного трансформационного клинча компании должны ещё и продукты / сервисы продавать, история умалчивает)

3️⃣ Коллеги из McKinsey очень смешно пытаются продать потенциальным клиентам взаимоисключающие параграфы: с одной стороны, долго рассуждают про HR, таланты и про то, что "цифровую и бизнес-трансформацию невозможно отдать на аутсорсинг"; с другой - продают компаниям свои услуги по new product development и CX. Awww.

4️⃣ И ещё из смешного: авторы подошли к книге как к типичному цифровому продукту - обещают выкатывать обновления каждые полтора года. И это было бы очень красиво и даже концептуально, если бы их пафосный epub не устраивал BSOD чуть менее чем всем электронным читалкам. 🤪
🔥8👍3🤣2
#про_цифровую_трансформацию

Кто о чём думает на отдыхе, а я - о продуктовом переходе. Потому что благословенная эпоха цифровой трансформации по принципу "давайте просто купим всё, что есть на рынке" закончилась.

(цифровым трансформаторам нынче нездоровится: 80% СЕО зарубежных компаний планируют пересмотреть стратегии ЦТ уже в 2023 году, причем 70% хотят забрать деньги у неэффективных цифровых проектов и проинвестировать во что-нибудь приличное)

Так что продуктовая трансформация начинает, выигрывает - и означает вот что:

1️⃣ Основная бизнес-конструкция 2020-х - дизайн-подразделения, которые могут в дизайн "от пользователя" (с глубоким пониманием потребительских проблем / запросов, рыночных перспектив, бизнес-моделей и пр.).

2️⃣ Компании, хлебнувшие дизайна, вкладываются в новые продукты и в серийное бизнесостроение - классические стартап-студии (Telefonica Wayra Builder); корпоративный венчур (SAP, Daimler Mercedes-Benz); или вот "фабрики ускоренного масштабирования" (scale-up factories).

3️⃣ Именно дизайн "от пользователя" и серийное бизнесостроение создают запрос на дата-интенсивные цифровые решения. Потому что 95% руководителей компаний считают, что потребители меняются так быстро, что компании просто не успевают трансформировать продукты / бизнес. Отсюда - вложения в платформы пользовательских данных, проприетарные дата-сеты и в платформы Value Stream Management (VSM, "управление потоками ценности", который из IT уже просочился в авто- и авиапром). \

(большинство руководителей не случайно считают ChatGPT платформой для аналитики данных и рекомендательных систем (под индивидуализацию CX), а не инструментом для автоматизации труда или, тем паче, управленческих решений)

Так что если кто-то придёт и начнёт вам рассказывать про "ИИ-трансформацию" и ChatGPT, бороздящий просторы Большого Театра, - смело отправляйте этого человека учить матчасть.

(если что, полный текст лежит в ВК и в запрещенной соцсети; это только выжимка)
🔥7👍6
#воскресное_чтиво #продуктовый_подход

Читаю "Эффективность и креативность в продуктовых разработках" (2023) by Фумихико Икуине (профессор департамента инжиниринга, университет Цукуба, Япония).

Так-то книга эта - ровно про то, что заявлено в названии: про конфликт между эффективностью (КПЭ, воспроизводимостью и пр.) и креативностью (ТТХ разрабов) в продакт девелопменте на примере японского геймдева.

Но автор, излагая суть конфликта, хорошо проходится по продуктовой логике развития компаний и, заодно, цифровизации:

1️⃣ Продукты - и в геймдеве, и вне его - это тот же венчур: low risk low return / high risk high return; то, что делают все - или то, чего не делает никто.

2️⃣ Компании, которые ставят на типовые low risk продукты, вынуждены молиться [да, тут было другое слово, но иногда самоцензура уместна] на эффективность, чтобы повысить этот самый low return. И вот тут-то и начинается кольцо депрессии: а) из-за требований по "повышению эффективности" проекты и команды, которые пытаются в новое, идут под нож; б) отсутствие нового снижает прибыльность; в) повторить n раз.

3️⃣ Поэтому цифровизация в духе "внедрить то, что есть у соседа" = гомогенизация корп. процессов = гомогенизация продуктов = падение прибылей не только у отдельных контор, но и по индустрии в целом. А [временное] конкурентное преимущество в эффективности достигается только за счёт корп.ноухау в процессах разработки продуктов - хоть новых, хоть типовых в духе "повторить былой успех".

Кмк, всё это оч красиво рифмуется с нынешней ситуацией с цифровой трансформацией: многие корпорации уже дошли до мысли о том, что им придётся разрабатывать своё собственное ПО и собирать проприетарные базы данных о пользователях, т.к. это может стать реальным конкурентным преимуществом / ноухау - в отличие, скажем, от условного коробочного SAPа.

(понятно, что цикл "новый продукт -> взлёт -> оптимизация -> смерть" неизбежен бизнес-модели зависят от тучи факторов, начиная со зрелости рынка и заканчивая инфляцией; но, прости господи, пайплайн нового всё-таки должен быть, пусть и ценой управленческой шизофрении)
🔥13👍4
#воскресное_чтиво #про_цифровую_трансформацию

Взгляд на цифровые технологии от историка и теоретика архитектуры Марио Карпо, профессора в Университетском колледже Лондона и в Венском университете прикладного искусства: книга "За пределами цифрового: дизайн и автоматизация в конце эпохи модерна" ("Beyond Digital: Design and Automation at the End of Modernity", 2023, MIT Press).

Сразу, с ходу: easily лучшая книга про цифровизацию и цифровые технологии этого года. Автор использует совершенно непривычные концепты и метафоры для рассуждения о предмете (философия и теория искусства, методы и подходы художников / скульпторов / архитекторов, etc), и оторваться от текста просто невозможно.

В книге масса всего, но мне больше всего понравилась цепочка рассуждений, связанная с цифрой и постмодерном:

1️⃣ Большинство фронтирных цифровых технологий - это квинтэссенция технологий / инструментов постмодерна: а) деконструкция (больших нарративов, личности, классических форм, нужное вписать); б) вавилонская библиотека форм и цитат; в) коллаж / пересборка с использованием параметризации (привет объектилям Делёза и Лекаша). На базе этих подходов работает всё, начиная с CAD/CAE и заканчивая глубокой кастомизацией, LLM, генеративным дизайном и прочими чатжтп.

2️⃣ При этом цифровые технологии и системы, как и технологии постмодерна, не помогают [ни архитекторам, ни всем остальным] с тремя фундаментальными проблемами:

▫️ С приоритезацией параметров проектируемого объекта (что выбрать: эко-фрэндли, маржинальное, уникальное, красное, тёплое?..) и синтезом.

▫️ С чисто человеческим процессом принятия решений, буквально - в залоге "как протащить решение через инвестиционный комитет / общественные слушания / комиссию".

▫️С проблемой производства. Боль не в дизайне / проектировании; боль в том, чтобы произвести напроектированное (глубокой кастомизации / адаптивности производственных линий).

3️⃣ Т.е. нынешняя "цифровая" ситуация, во многом, иронична. Проблема параметризации приводит к росту важности автора (сборщика, главного конструктора, etc), которого посмодерн считал и лишним, и мёртвым. Во всяком случае, до эпохи "новой искренности", бггг. Проблема производства выливается в банальный вывод о том, что физические ограничения важнее цифровых - и что нам нужны не дизайн / геометрия невозможного, а производство невозможного. А проблема убеждения ведёт к поиску слишком человеческого.

Удивительное и красивое. 😌

(на всяк случ: я выплыла из летнего рабочего заплыва и постепенно прихожу в себя, так что тут снова начнёт появляться разное)
🔥17👍5
#про_науку

Красивое: коллеги из Национального научного фонда США (NSF) запускают эксперимент по тестированию новых форматов финансирования науки.

Вкратце, сюжет таков: в 2022 году перед NSF встала проблема финансирования критических технологий (в т.ч. технологий для микроэлектроники по CHIPS and Science Act), и не в смысле "нет денег", а в плане формата - для быстрых результатов и высоких рисков научные гранты в вакууме просто не подходят.

Вообще в 2022-м NSF уже запустил линейки финансирования двух новых типов R&D: фундаментальных исследований, ориентированных на конечных пользователей (user-inspired research), и конвергентных исследований (продуктовые разработки с вкладом из разных фундаментальных областей). Но, судя по всему, этого оказалось недостаточно.

Так что NSF планирует:

1️⃣ Провести аудит существующих механизмов принятия решений о финансировании (какие заявки поддержать + как оценивать их результативность); по итогам - попробовать оптимизировать орг механику принятия решений;

2️⃣ Разработать и протестировать разные возможные механизмы финансирования "венчурной науки" - исследовательских проектов класса "high-risk, high-reward"; по итогам запустить новые линейки финансирования и, в идеале, карьерные траектории для исследователей, которые в такое готовы;

3️⃣ Попробовать разработать и внедрить механизмы, которые позволяли бы учёным менять направления исследований прямо посередине выполнения гранта, т.е. предусматривали бы возможность пивота исследования, по аналогии со стартапами (зум ин, зум аут, всё по Эрику Рису и идеологии lean startups), а не тащить чемодан без ручки, если становится понятно, что чемодан этот не ок.

Не факт, что всё это получится (эксперимент всё-таки), но офигенное же, ну.
🔥14👍1
#про_ИИ #про_науку

Внезапно кул стори про разницу между ИИ-хайпом и суровой реальностью. Помните, пару лет назад был страшный кипеш по поводу гугловского AlphaFold'a, который [предположительно] решил эпохальную проблему свёртывания белков?

Собственно, это была первая заметная (читай - запущенная вендорами) волна хайпа по поводу генеративного ИИ: хоронили всех структурных биологов чохом; пророчили революцию в медицине - в общем, было всё то же, что нынче с ChatGPT.

А когда информационная пена осела, оказалось, что:

1️⃣ Реальная проблема фолдинга белков - не в предсказании формы, как рассказывает всем Google (и прочие товарищи в полосатых купальниках, продающие генеративный ИИ); реальная проблема - в предсказании функции получившегося белка. Ну потому что если вы не знаете, что этот белок делает, то зачем козе этот баян, кроме как на побаловаться.

2️⃣ Сомнительная польза AlphaFold в этой части связана с тем, что ИИ не обучен анализировать связывание лигандов; проще говоря - не работает с межмолекулярными взаимодействиями белок / рецептор, которые, собственно, и определяют производимые эффекты (физиологические, биохим и пр.). Можно ли его вообще этому обучить, вопрос открытый; вероятно, можно, но пока этого не произошло.

3️⃣ Результаты работы AlphaFold невозможно толком проверить - моделей слишком много; а до тех пор, пока статистически значимое количество моделей не будет проверено в пробирке, ничего утверждать нельзя - и лучше бы ничего из этого не продавать медикам и фармацевтам (кстати, по итогам того, что успели проверить, высокоточными оказались примерно 35% полученных моделей; не говоря уже о том, что IRL существует больше типов белков, чем те, на которых его обучили: в модели, например, не учтены микробные белки, - и как с этим жить, тоже пока не понятно).

4️⃣ И вишенка на торте: все эти прекрасные результаты (тм) были получены только потому, что Google DeepMind тупо использовал открытую базу данных по белковым последовательностям UniProt, которую международный консорциум биотех-институтов кропотливо собирал несколько десятилетий. Так что не удивительно, что бедный Google вынужден был сделать AlphaFold общедоступным; попробуй он его продать, его бы с потрохами сожрали.

Учёные - люди очень вежливые, и никто, если я правильно помню, публично и нецензурно на эту тему не высказался. Но на конференциях и прочих проф обсуждениях биологи периодически делают 🤦🏻‍♀️🤦🏻‍♀️🤦🏻‍♀️. Правда, тут же добавляя, что AlphaFold - это хорошо, это первый шаг ТМ и прочее в том же духе.

Люблю такое.
🔥14👍5
#про_науку #про_ИИ

В последние полтора года то тут, то там мелькает идея создания чисто российских ИИ/ML-фреймворков - то в целом, то для российских науки и образования. Под тем лозунгом, что отечественные-то фреймворки, конечно, всех нас спасут. Уж один - так точно (шестикрылый, если вы понимаете, о чём я).

Я вежливый кролик, поэтому обычно говорю, что да, ИИ/ML-фреймворки, особенно для науки, - дело богоугодное. Но если хотеть в полную импортонезависимость и цифровое огораживание, то сразу же возникают интересные нюансы:

1️⃣ Нет никаких висящих в вакууме фреймворков, ни научных, ни универсальных, а есть - экосистемы под ИИ/ML. И в мало-мальски приличной экосистеме должны быть готовые модели, IR и компиляторы, библиотеки и ещё масса всего. Бюджет х10, да.

2️⃣ Фреймворки и даже экосистемы без данных - деньги на ветер. AlphaFold учили на базе UniProt (размеченные данные о последовательностях аминокислот); астрофизики учат модели на данных CANDLES, размеченных самими учеными или краудсорсингом (GalaxyZoo); список можно продолжать. А дальше появляются проблемы междисциплинарных метаданных, проприетарных форматов (привет вендорам, производящим научное оборудование каждый со своим стандартом). И денег, которых стоит разметка. Есть, конечно, робкая надежда на глубокое обучение, позволяющее работать с неразмеченными данными, но оно уместно далеко не везде, увы.

3️⃣ И моё самое любимое. ИИ/ML в целом и глубокое обучение в частности дают науке очень, очень много. Но реальный переворот случится только тогда, когда исследователи получат в своё распоряжение каузальный ИИ, способный выявлять причинно-следственные связи и, извините за громкие слова, выводить законы природы из массивов данных (например, управляющие уравнения в физике).

Такие дела.
🔥10👍3
#про_цифровую_трансформацию #про_науку

И снова к вопросу о проблеме данных, ИИ и реальной ЦТ науки: судя по опыту китайских коллег, нас спасут только централизация и адекватная data-политика в науке, начиная со стандартов и заканчивая инфраструктурой / сервисами.

Вот, например, в Китае с 2019 года работает единый банк научных данных - платформа SciDB. Сейчас её использует каждый шестой исследователь КНР; на ней лежат (и активно используются) 7+ млн. научных дата-сетов.

Если судить по опыту SciBD, то для успешного успеха нужны:

1️⃣ Техническая адекватность, особенно - иерархическое хранение данных, а не любимые облачными провайдерами объектные хранилища, которые мало приспособлены для нормальной работы с данными.

2️⃣ Удобство: репозиторий должен а) поддерживать стандарты открытых научных данных - Schema, Dublin Core, DataCite и пр. - под принципы FAIR и TRUST; б) поддерживать протокол OAI-PMH или аналоги (metadata harvesting; совместимость метаданных); в) присваивать дата-сетам ID (DOI, CSTR, UNF); г) обеспечивать прослеживаемость жизненного цикла данных (data provenance, data lineage).

3️⃣ Глобальность: индексирование дата-сетов в Scopus, WoS Data Citation Index, Mendeley Data и пр. (и, кстати, хорошо бы сделать адресную SEO аннотаций дата-сетов под разные платформы).

4️⃣ Открытость: автоматическое лицензирование дата-сетов по CC0 / CC BY; возможность свободной загрузки данных (при условии соблюдения стандартов оформления и тематических требований) и их скачивания без регистрации и смс.

5️⃣ В идеале - система вознаграждений: метрики востребованности научных данных и плюшки для тех исследователей, чьи данные кто-то использует (правда, китайские коллеги, с шансами, загоняют своих учёных в открытые данные палкой; а англо-саксыТМ всё ещё не придумали, как оценивать дата-сеты - и откуда взять ресурсы на бонусы для их создателей).

Всё остальное (openAPI, партнёрства и пр.) жизнь украшает, но всё-таки проходит по категории "рюшечки".

... А, и да: хорошо бы ещё заиметь 2+ млн. исследователей и $450-500 млрд. вложений в R&D в год. 😁
🔥12👍3
#воскресное_чтиво #про_ИИ

Давеча задалась вопросом про перспективы каузального ИИ, сразу же решила припасть к источникам - к книге Джуды Перла "The Book of Why: The New Science of Cause and Effect" (2018).

То, как принципиально устроены каузальные [мета]модели, понятно (лестница причинности даже в википедии есть); лично меня больше всего заинтересовали чисто практические выводы, которые делает Перл:

1️⃣ "Данные" сами по себе мало полезны с т.з. поиска причинности. Поэтому в каузальной модели (по версии Перла) первой идёт, собственно, модель; данные под неё собираются строго после того, как а) сформулирована [и математически задана] гипотеза о причинности, б) сформулирован вопрос, в) задана метрика, в которой будет сформулирован вывод (estimand).

2️⃣ Гипотезы о причинности должны строить строго команды "предметник + дата-сайентист". Любой, кто рыдал от смеха над результатами работы некоторых российских "систем анализа больших данных" (нет, я не буду показывать пальцем), это подтвердит.

3️⃣ А беда в том, что доминирующий (по мнению Перла) подход в дата-сайенс - это забить на предметное знание и надеяться на то, что для счастья хватит только данных и корреляций. Последствия у такого подхода не оч приятные:

▫️Без исходной гипотезы не может быть нормального ТЗ на данные, то есть - в дата-сет могут тупо не попасть данные, которые связаны с причинами / эффектами;

▫️Модели, построенные "от данных", без гипотезы, не позволяют работать с запросами класса "что было бы, если бы" (контрфактуалами);

▫️Модели «от данных» не адаптивны; а каузальные модели, грубо говоря, переварят любые данные, имеющие отношение к [исследовательскому] вопросу, т.к. метрика вывода уже предзадана; это же делает менее острой проблему внешней валидности.

Я, если честно, даже как-то загрустила от этого. Но, с другой стороны, не всё же ИИ-компаниям масленица краденого контента.

(по-хорошему, надо было бы ещё припасть к Перловской же "Probabilistic Reasoning in Intelligent Systems" 1988-го года, но у меня не так хорошо с математикой, как мне хотелось бы)
🔥13🤣1
#диалоги_в_танке

А: Полутёмный закуток в неизученной системе. Вечно делаю не то, не тогда, не там, не с теми.

У: Простите, а какие-то ещё впечатления от работы с инновационной экосистемой нашего вуза у вас остались?..

(для тех, кто недавно меня читает: если периодически не смеяться над происходящим, то можно сразу идти вешаться; поэтому тут иногда появляется эта рубрика, извините)
🤣10👍5
#про_науку #про_экспертов_и_людей

Внезапно свежая кул стори про реальный уровень пользы от цифровых технологий анализ научных данных: 246 биологов проанализировали одни и те же дата-сеты (поведение птенцов лазоревок и развитие сеянцев эвкалипта) - и получили разные результаты.

Общие выводы, как правило, совпадали (как именно один фактор влияет на другой: конкуренция между птенцами - на динамику их роста; густота травы - на прорастание и развитие сеянцев), но уровень важности факторов у каждого исследователя получился какой-то свой.

Дальше - ещё веселее: когда исследователей попросили сделать peer review аналитических результатов коллег, там тоже получился оч сильный разброс. Например, исследования / модели с "экстремальными" утверждениями (переоценёнными факторами) получили отрицательные отзывы только в случае с дата-сетами по эвкалипту; а не менее "экстремальные" результаты по лазоревкам всем почему-то были норм.

Мораль:

1️⃣ Судя по всему, единственный способ достичь [аналитического] консенсуса - это мета-анализ результатов работы многих исследователей / экспертов, который учитывает их бэкграунд (начиная с образования и заканчивая методическими предпочтениями). Но фантастика у нас в каузальном ИИ другом отделе.

2️⃣ Было бы классно, если бы аналитики / эксперты / ученые регулярно задавались вопросами класса "а не порю ли я чушь петровну", "почему мне кажется, что...", "а не попробовать ли мне заложить в модель другие веса" и пр. То есть - проводили бы работу по вскрытию чёрного ящика собственной головы. Потому что прозрачность алгоритмов, которой нынче все требуют от ИИ, по идее, должна работать в обе стороны. 😁
🔥12👍3
#воскресное_чтиво #про_контекст

Читаю книгу "Идентичность и цифровая коммуникация" ("Identity and Digital Communication", 2023) Роба Кавера, профессора цифровых коммуникаций Мельбурнского технологического университета.

В книге много умных слов (перформативность, симулякры – короче, на любителя). Но поверх всего этого лично я вычитала вот что:

1️⃣ Мозаичная онлайн-идентичность, характерная для эпохи Web 1.0 и разделения между онлайном и оффлайном, переходит в фазу сборки - за счёт рекомендательных алгоритмов, дающих эффект пустой гулкой комнаты уже не на уровне каких-то условно политических общностей (как это делали соцсети в целом), а на уровне каждого отдельного человека.

2️⃣ Сообщества, подложкой под которые стали соцсети, в 2020-х держатся на двух взаимоисключающих параграфах вещах:

▫️Креативной инклюзивности: в Web 3.0 выживают только невоображаемые сообщества, объединённые общей деятельностью (в противовес сообществам сугубо воображаемым - "нациям", "гражданам", "населению" и прочим абстракциям). То есть - сообщества практики всех родов и видов, фандомы с их культурой партисипаторной креативности (соавторство, коллабы, ивенты, косплей и пр.), краудфандингом и профильными сабреддитами - ну, и далее везде.

▫️Принудительной нормативности на спидах: культура отмены (вплоть до отмены субъективности, кмк); кибербуллинг и травля; радикальная ре-национализация интернетов - и за счёт цифрового политического огораживания, и из-за того, что слухи о смерти национального государства оказались сильно преувеличенными. Ну, и на жёсткой самоцензуре.

3️⃣ На фоне всего этого прорастают новые форматы субъективности, в первую очередь - в ТикТоке, который, в отличие большинства остальных платформ, живёт на аутентичности, нефильтрованном контенте и оригинальности. Или, проще говоря, не вынуждает пользователей строго цензурировать способы и форматы самовыражения. Где-то тут должен быть прогон про демографию и поколенческое лицемерие соцсеточек, но все всё и без того понимают.

Так что теперь думаю, не подсесть ли наконец на ТикТок. 😏
🔥6👍1
#про_цифровую_трансформацию #про_науку

И чтобы [временно] закрыть тему с ИИ / ML в науке - ещё немного про наших китайских коллег: как показывает практика Китая, для нормальной цифровой трансформации науки мало ИИ / ML фреймворков и научных данных.

Для ИИ-счастья в исследованиях и разработках нужны, как минимум:

1️⃣ Синхронизация развития "научного" ИИ с национальной стратегией ИИ / ML - чтобы не плодить лишние сущности, проекты и строки в бюджете. В Китае нацстратегия ИИ реализуется ещё с 2017 года, и всё, что происходит в ИИ / ML для науки, увязано с общим управленческим и технологическим контекстом: R&D в ИИ и смежных технологиях (кванты, нейроморфные вычисления и пр.), поддержка трансфера и создания продуктов / компаний, внедренческие проекты, инфраструктура и пр.

2️⃣ Приоритеты, понятные и забюджетированные (извините). Например, в 2023 году - а) высокоточные методы анализа изображений (научных, obviously) и результатов спектрометрии + создание моделей (спектр-структура-функция), объединяющих экспериментальные данные и результаты имитационного моделирования; б) ИИ для высокоточного дизайна макромолекул.

3️⃣ Организационное приземление работ (до этого наши китайские коллеги, кстати, дошли не сразу, а через пять лет мучений с разрозненными исполнителями по ИИ / ML): с 2023 года за "научный" ИИ / ML в Китае отвечает Институт автоматизации Академии наук КНР, который выступает головным заказчиком и координатором всех работ в этой сфере. И слава труду, наверное, т.к. министерства с этой задачей не справлялись - предмет слишком сложный, команд слишком много.

4️⃣ Опережающее развитие ИИ / ML экосистемы, без которой никакие приоритеты и стратегии никого не спасут. Дата-центры, платформы управления научными данными (с нормальным иерархическим хранением, обработкой под принципы FAIR и TRUST, автоматическим лицензированием и пр.), репозитории открытого ПО для ИИ и ML - и прочее в том же духе.

Такие дела.
🔥11👍1
#воскресное_чтиво #продуктовый_подход

Отличная книга про трансформацию Huawei [с оч характерным для наших китайских друзей названием] – «Huawei Wisdom» (2022). Автор, Лан Тао, проработал в Huawei 17 лет, так что читается книга, как хороший детектив.

Вообще Тао говорит про три трансформации: продукты, глобальный рынок и бизнес-модель. Но меня, как обычно, интересует продуктовая история.

Если вкратце, то при продуктовом переходе компания столкнулась с двумя вызовами:

1️⃣ Управление данными про требования потребителей. Прямой фидбэк, данные техподдержки, дистрибуторов, анализ конкурентов и пр. – у компании была гора «входных» данных о потребителях. Которые ещё в надо было донести до R&D, производственников и пр. в какой-то релевантной форме.

2️⃣ Приоритезация. Оказалось, что нельзя просто так взять и войти в Мордор запилить продукт по самым частотным требованиям: нужен анализ с т.з. их реальной важности для потребителей, добавленной стоимости для компании, сложности разработки, возврата инвестиций, срока жизни продукта / фичи как конкурентного преимущества, места продукта / фичи в общем портфеле и пр.

Что в итоге сделали:

1️⃣ Внедрили подход IBM – Integrated Product Development (IPD), – адаптированный к потребностям Huawei: «рыночный анализ продуктового портфеля + управление требованиями + итерационная разработка».

2️⃣ Управление требованиями сделали трёхступенчатым: дизайн / интерфейс (market pull); технические решения / возможности (tech push); фулфиллмент (экономика & customer management).

3️⃣ Перестроили оргпроцессы – а) упразднили general office, который сидел под главным инженером и принимал все продуктовые решения, б) создали функцию pre-research (сбор потреб. требований, разведка), на который теперь уходит 10% всего R&D-бюджета; в) отдали продуктовые решения кросс-функциональным командам; г) после ряда фейлов таки начали включать в продуктовые review points внешних людей.

И на полях: начали они продуктовый переход в 1998-м, а более-менее закончили в 2012-м. Но потом с Huawei случился глобальный рынок, и всё снова заверте…
🔥10
#про_науку #про_policy

К вопросу о том, как определять приоритеты в фундаментальной науке: вот, скажем, у Национальной академии наук США есть прекрасный формат - "консенсус-доклад [про следующие 10 лет]" (на примере астрономии).

Если коротко, то раз в n лет несколько сотен ученых из какой-то научной области садятся и обсуждают, что будет самым важным для этой области в следующем десятилетии:

1️⃣ Ключевые научные проблемы по каждому направлению внутри научной области (в астрономии, например, - космология, изучение галактик, экзопланеты / астробиология и пр.); проблемы и вопросы формулируют специальные тематические панели по 8-12 человек в каждой.

2️⃣ Вызовы и задачи, связанные с развитием научного оборудования - установок класса mega-science и вообще научных инфраструктур (в астрономии это наблюдения из космоса; наземные наблюдения разных типов; физика астрочастиц и гравитация и т.д.); по оборудованию работают специальные "инфраструктурые" панели, 10-15 человек.

3️⃣ Состояние профессии и влияние научного направления на общество в целом.

Отдельно мне нравится то, как организована коммуникация внутри каждого такого проекта:

1️⃣ Коммуникация внутри сообщества. В обсуждении будущего астрономии, например, участвовали 200+ исследователей, из которых хорошо если 20 являются членами Академии; пир-ревью делали ещё 60+ человек. Потому что - какая неожиданность - не в академиках счастье. А в том, чтобы у сообщества было хоть какое-то общее понимание целей. И чтобы само это сообщество, блин, было.

2️⃣ Коммуникация с внешним миром в целом. Консенсус-доклад - это официальная, публичная, понятная и прозрачная позиция Академии по поводу того, в чём будущее науки и что эта наука дать обществу.

3️⃣ Коммуникация (опять же, публичная) с ЛПРами, в формате "проблема - предлагаемое решение". Вплоть до детальных рекомендаций по поводу того, как оптимизировать процесс выдачи грантов, управление крупными научными установками, подготовку исследователей и пр.

(тут должна быть шутка про чёрный ящик РАН и, заодно, про российские форсайты науки, но я эту шутку так и не придумала, мне слишком грустно)
🔥8👍3
#про_policy #продуктовый_подход

И снова о продуктовом подходе в госполитике: довелось тут поговорить с предпринимателями в малых городах – про то, что они думают о господдержке предпринимательства.

Вкратце:

1️⃣ Вообще-то "просто" предпринимательство не то что бы сильно отличается от "технологических" стартапов: на старте всем нужны деньги на проверку бизнес-гипотез и MVP.

2️⃣ При этом поддержка "обычных" компаний заточена под масштабирование (кредиты, займы и пр.) - и не работает с зоной создания продукта / услуги ("идея - MVP - первые продажи").

3️⃣ В результате консультации разных рег. центров оказываются полезнее, чем половина "финансовых инструментов", которые [как бы] должны помогать МСП развиваться.

Жаловаться "обычным" предпринимателям некому. А, между тем, по мотивам их высказываний возникают неудобные [философские] вопросы:

1️⃣ Как вышло, что "технологическое" предпринимательство в России обеспечено инструментами развития на порядки лучше, чем "обычное"?

Понятно, как на этот вопрос отвечать с т.з. "большой стратегии": нац. конкурентоспособность, критические технологии и другие хорошие слова (с которыми я, тащемта, согласна). Ну, и активное технократическое лобби, спасибо ему за это. Но с т.з. common sense ответ вообще не очевиден.

2️⃣ Куда податься предпринимателям, которые не интересуются "актуальными" задачами от государства?

Например, если они хотят голубику выращивать, а не тех. суверенитет ковать? Никто ради "национальных целей развития" не будет закладывать квартиры. Нет таких психов в природе.

Можно ничего не делать, конечно. Но в России и без соц-эк дарвинизма с предпринимательством швах (на порядки хуже, чем у США и прочих наших западных коллег и конкурентов); давайте ещё и неестественный отбор устроим.

Такое себе, короче.

(в предыдущих сериях "о продуктовом подходе в госполитиках": сколько стоят [продуктовые] ошибки в госполитиках; почему акселераторы не результативны; почему в компаниях буксует цифровая трансформация; что важнее всего для успеха ЦТТ)
🔥9👍4