Dolboeb-driven Development – Telegram
Dolboeb-driven Development
705 subscribers
743 photos
107 videos
6 files
556 links
Мое личное ebanoe.it. Истории из первых (чаще всего кривых) рук.

Ваши примеры имплементации DDD => кидайте в чат

*все тексты в данном канале являются художественным вымыслом и не связаны с реальными людьми и компаниями, если не указано иное 😉
Download Telegram
Как Microsoft Excel влияет на названия человеческих генов

Люблю истории, когда современные технологии самым непредсказуемым образом влияют на науку. Оказалось, что за последний год около 27 человеческих генов были переименованы, потому, что Microsoft Excel их автоматически форматировал и ученых это просто достало :).

Комитет по номенклатуре генов HGNC опубликовал новые рекомендации по именованию генов, в том числе для «символов, которые влияют на обработку и поиск данных». Отныне, по их словам, человеческие гены и экспрессируемые ими белки будут именоваться с учетом автоматического форматирования Excel. Это означает, что имя гена MARCH1 теперь обозначается как MARCHF1, а гена SEPT1 – SEPTIN1, и так далее.

Примеры выше были такие, где название гена Excel правил в даты. Вторая проблема, решенная HGNC – чтобы обозначения не читались как простые слова: имя гена CARS было изменено на CARS1, WARS – на WARS1, а MARS стал MARS1.

Но была и более неочевидная третья проблема – ген «sonic hedgehog», названный в честь приставочного Соника и «Indy» от «I'm not dead yet» как отсылка на функцию гена, которая при мутации может удвоить продолжительность жизни плодовых мушек. Эти названия тоже пришлось изменить: INDY стал MINDY, или SLC13A5, а Sonic Hedgehog – просто SHH.

Словом, в прошлом генетики над названиями генов не парились. Это и стало этаким «выстрелом в ногу» всей науке: исследование Мельбурнского академического института Baker IDI в 2016 году изучило 3597 опубликованных статей по генетике человека и в примерно 20% из них нашла ошибки Excel.

Решение

После обнаружения проблемы требования HGNC стали гораздо жестче: символы генов должны быть уникальными, а названия – краткими и конкретными. Нельзя использовать подстрочный или надстрочный индекс, название гена может содержать только латинские буквы и арабские цифры. И, в идеале, не выглядеть оскорбительно на любом языке. Тут мне интересно, как ученые должны знать все оскорбления на всех языках :)?

О современном мире

Почему бы всем известной программе не учесть названия генов? Это было бы логично. Но ответ кроется в самом вопросе: пользователей программы на несколько миллиардов больше, чем кучки ученых-генетиков. Надстройка на код Excel таким бедолагам не светит.

Да, можно хитрить с форматом ячеек, выставлять загодя правильные атрибуты, но обычно проблема встает перед генетиком уже постфактум: когда работа уже набрана на компе и засунута на флешку. И проблемы – чаще всего – возникают как раз при передаче табличных файлов на другие системы, в которых программы автоматом проставляют даты вместо того же MARCH1. Особенно в формате CSV. Кто перегонял курсач на старые флешки и открывал у товарища «просто распечатать» – тоже помнит и скорбит.

- - -

Просто задумайтесь – целая наука прогнулась под требования табличной программы. Хвост машет собакой и большинство опять указывает меньшинству.

Ну а пока – Microsoft Excel VS Human Genetics: 1-0.

@artemborodatiuk
Это кек конечно. PyCharm почему-то принимает мой питон 3.10 за 3.1 (система чистая, других питонов тоже нет)

Орну если там кто-то как версию взял первые 3 символа или по 1 символу секции между точками)

//Да, я на винде, и шо вы мне сделаете?)
На всякий случай сообщаю - вы можете оставлять коменты к посту через встроенные коменты телеги, если просто зайдете в чат канала
Бля) теперь оно определяет 9 питон как 8)
>Recently it was discovered that a bug in the time rollback (aka "GPS Week Rollover") sanity checking code scheduled for November 2038 will instead trigger this Sunday, and cause 1,024 to be subtracted from the October 24, 2021 week number. In other words, a lot of computers are in for a quick, sharp visit to March 2002.

https://www.zdnet.com/article/thanks-to-a-nasty-gpsd-bug-real-life-time-travel-trouble-arrives-this-weekend/
Снилось что я наблюдаю за собесом джуниор тестировщика, где тимлид с хитрым взглядом дает ему задачку:
"Представь что тебе надо доказать, что наша реальность это симуляция. Предполагается, что она сделана хуево и полюбому где-то есть баги, и если ты найдешь баг, то докажешь что это симуляция. С чего бы ты начал тестирование?"
Взломали популярную библиотеку UAParser.js, которая используется для чтения информации в user-agent строках— в неё встроили код, который закачивает криптомайнер на тех системах, где она установлена. 6-7 млн закачек в неделю, по данным npm

https://github.com/advisories/GHSA-pjwm-rvh2-c87w
Dolboeb-driven Development pinned «Чат для обсуждений»
За 1мм от необходимости менять несколько дверей. Архитектор конечно рисковый парень)