OdanChem research – Telegram
OdanChem research
416 subscribers
26 photos
16 links
О платформе OdanChem:
https://odanchem.org/
По всем вопросам: @ole_afan
Download Telegram
Пример поиска по протонному спектру

#spectrum_search
Выше было три поста с общим описанием поиска по спектру. Но чаще всего мы все пользуемся протонниками, а поиск по ним, как следует из вышесказанного, дает слишком много результатов без применения дополнительных фильтров. Подробно про фильтры — следующий пост. А сейчас просто пример для иллюстрации.

Допустим, вы ставили реакцию как на схеме (первая картинка). 
После реакции получился вот такой спектр (вторая картинка).
Что же мы получили? Можно глазами расшифровать. Но давайте попробуем в OdanChem:

1) Разметили все мультиплеты в Mnova, скопировали строку спектра (здесь важно отметить все пики, интенсивность и мультиплетность в данном случае вторичны: для такого поиска нет разницы отметить триплет как триплет или как три синглета):
1H NMR (400 MHz, CDCl3) δ 7.75 – 7.60 (m, 1H), 7.60 (d, J = 1.9 Hz, 1H), 7.58 (d, J = 2.3 Hz, 1H), 7.43 (q, J = 7.6 Hz, 4H), 7.41 – 7.28 (m, 1H), 6.24 (t, J = 6.2 Hz, 1H), 6.20 (t, J = 6.2 Hz, 1H), 6.06 – 5.97 (m, 1H), 2.26 (q, J = 6.9 Hz, 2H), 1.48 (d, J = 14.6 Hz, 1H), 1.43 – 1.34 (m, 2H), 1.35 (s, 5H), 1.31 (s, 4H), 1.32 – 1.16 (m, 1H), 0.98 – 0.79 (m, 6H). 

2) Выполнили поиск по строке спектра в OdanChem — получили 1786 страниц результатов (третья картинка). Слишком много.  

3) Поняли, что надо уточнять результаты. Предполагаем, что замещение в бензольное кольцо не пошло. Также алифатическая алкановая часть явно не будет затронута. Применяем substructure filter : рисуем там оба этих фрагмента и в явном виде прорисовываем атомы водорода, чтобы запретить замещения в этих положениях (четвертая картинка).

4) Получили всего 8 молекул (пятая картинка). Profit! Произошло гидросилилирование и гидролиз Si—H связи.
🔥8👍53
Основные проблемы при работе (и как их решать)
#odanchem

Коллеги, еще один внеплановый пост. Опишу основные проблемы, с которыми вы можете сталкиваться при работе с системой, и что с ними делать, если столкнулись.
Если вы сталкивались с чем-то еще, пожалуйста, напишите в комментариях.

Проблема: Открыли сайт, пытаетесь открыть кетчер для рисования молекулы, и он не прогружается.
Решение: Закройте модальное окно, подождите несколько секунд, откройте заново. Скорее всего, все будет работать.
Причина: Скорее всего, у вас медленный интернет. Рисовалка большая. Она при первом открытии сайта после открытия браузера должна загрузиться. Могла не успеть.

Проблема: Нарисовали молекулу с обобщенными обозначениями атомов/групп (G*, R, A, ...), а оно не ищет по ним.
Решение: Не использовать обобщенные обозначения атомов. Такая опция у нас до сих пор не реализована. Рекомендуем использовать обычный substructure search.

Проблема: Зашли на сайт, а там только одна кнопка. Где все функции, о которых вы тут пишете?
Решение: Нужно залогиниться/зарегистрироваться. Все сложные поиски и существенная часть базы у нас доступна только после регистрации.

Проблема: Грузилась какая-то страница (например, с результатами exact search), прогрузилось часть данных, а потом, внезапно, белый экран, либо странное сообщение об ошибке.
Решение: Обновите страницу.
Причина: Прервалась связь в процессе загрузки или еще что-то такое. Обычное обновление страницы помогает.

Проблема: Кажется, что поиск завис. Викинг продолжает смеяться, но кажется, что ничего не происходит.
Решение: Скорее всего все ок, и просто поиск долгий. Он может занимать 2-3-5 минут. Можно подождать на данной странице, или закрыть вкладку, а позже открыть историю поиска, и посмотреть там. Если напротив данного поиска показывается ненулевое количество найденных молекул — нажмите на него, он откроется заново, и все прогрузится.

Проблема: Не читается файл спектра.
Решение: Проверьте, что файл соответствует требованиям. То есть это zip-архив, который содержит стандартную папку с прибора (для ЯМР). Папка должна включать все нужные файлы и иметь стандартную структуру. Если все равно не читается — напишите нам, разберемся.
5👍2🔥2🥰2
Фильтры в поиске по спектру. 
#spectrum_search

Итак, поговорим про фильтры в поиске по спектру. Напомню ключевой принцип поиска данных в odanchem: сначала выполняется некоторый общий запрос, а далее результаты можно уточнять. В прошлом посте был продемонстрирован именно такой путь.

Имеющиеся в поиске по спектру фильтры можно разбить на два типа: структурные и спектральные.

Если у вас есть какие-то данные о том, что входит или может входить в состав реакционной системы, то это можно использовать в структурных фильтрах. Самый мощный вариант — фильтр по фрагменту структуры (substructure filter). Если вы ожидаете конкретный структурный блок в искомом веществе, то можно этот блок нарисовать, и среди результатов останутся только молекулы, содержащие данный фрагмент структуры. Помните о возможности задания атомов водорода в явном виде. Если вы где-то его не прорисовали, то там может быть любой заместитель. А если прорисовали — там заместителя точно не будет. Это полезно при условии понимания, какие исходные молекулы у вас были, и какие фрагменты молекулы точно не будут реагировать. 

Второй структурный фильтр — по молекулярной массе. Тут можно использовать результаты, например, ГХ-МС или ВЭЖХ-МС. Если по масс-спектру вы видите, что молекулярная масса вашего вещества, условно, 156 Да, то можно задать фильтр по массе от 155.5 до 156.5. Если у вас есть HRMS, то можно еще сузить диапазон. Система фильтрует по моноизотопной массе, так как заточена именно под комбинацию ЯМР + МС. 

Спектральный фильтр — это, в первую очередь, фиксация обязательных пиков (Mandatory peaks filter). Если вы видите, что какой-то из сигналов особенно интенсивен, или вы понимаете, что именно он вам нужен, можно его зафиксировать. Тогда у вас в результатах выдачи останутся только те спектры, которые содержат данный сигнал. Может быть полезно для последовательного разбора состава смеси. 
Наконец, важная опция — установить допустимое число потерянных сигналов (can be missed). Как обсуждалось в предыдущих постах, наш поиск чувствителен к тому, чтобы все пики были хорошо видны. Если какой-то пик не прокопился, то соответствующая ему молекула не найдется. Добавление возможности потери одного пика решает данную проблему. Но важно учитывать, что при этом количество результатов возрастет на порядок.

В заключение к данному посту напомню: чем шире шкала, тем лучше идет поиск по пикам (пост с описанием причины). Поэтому, с высокой вероятностью, при поиске по ¹³С ЯМР фильтры вообще не понадобятся. А вот при поиске по протонному спектру использование фильтров, по сути, обязательно.
Кроме того напомню, что некоторые поиски у нас могут занимать несколько минут. Это нормально. Можно вкладку с таким поиском закрыть, а потом вернуться к ней из истории поиска.
🔥7👍4❤‍🔥1
Экзистенциальный пост: иллюстрация, зачем нужен поиск по спектру и вообще OdanChem
#odanchem
#spectrum_search

Мы на протяжении нескольких постов рассказывали про то, как работает поиск по спектру, а также проиллюстрировали это примером работы чисто с ¹Н ЯМР.
По сути, мы создали инструмент, позволяющий в полуавтоматическом режиме разгадывать состав реакционных смесей. И это можно использовать много где, в том числе для поиска новых реакций!

Как, вообще говоря, мы находим новые реакции?
Классический часто декларируемый вариант: подумали и предположили, что из молекулы А в условиях Х можно получить молекулу В. Проверили — работает. Порадовались, оптимизировали — готова новая реакция. Проблема этого подхода — на практике он редко реализуется. Да, есть случаи, но чаще всего происходит второй вариант.

Частый практический вариант: Хотели получить молекулу В из вещества А, но внезапно получили что-то другое. Разобрались, что это, поняли, почему так произошло, и вот готова новая реакция. Ключевое тут — понять, что произошло, расшифровать структуру того вещества, которое получилось вместо ожидаемого. Это получается не у всех. И вот здесь поможет OdanChem.

Наша платформа позволяет работать с самым рутинным из существующих методов определения структуры органических молекул. Без ЯМР органики — как без рук. Кроме того, данный метод является бесконтактным, то есть можно зарегистрировать спектр с реакционной смеси, не изменяя ее состав (как мы все понимаем, при выделении часть компонентов смеси может разложиться/превратиться еще во что-то). Именно поэтому концепция "Зарегистрировать ЯМР с реакционной смеси" → "полуавтоматически расшифровать ее состав" выглядит крайне заманчиво.

Именно это было нами реализовано и подтверждено на двух примерах ранее не описанных реакциях: попроще и посложнее.
Подробнее читайте в нашем свежем препринте. В последующих постах подробнее опишем, что там было сделано и как.
👍15🔥31💋1
Продолжение о нашем препринте.

Представьте себе, у вас был ТГФ, ацетат кобальта, синтез-газ (смесь угарного газа с водородом), автоклав и масляная баня. Не то, что бы это все было прямо нужно в лаборатории, но, если работаете с газами, то нужно идти до конца.

В общем, вы это все смешали и погрели (первая картинка). Из общих соображений, особо ничего произойти не должно (ТГФ — он растворитель, в нем Гриньяра делают, ну что может пойти не так?). Но на практике получается сложная смесь алифатических продуктов. Протонный спектр выглядит как-то так (вторая картинка).
Ясно, что с ТГФ что-то случилось. Но что? Можно предположить те или иные структуры, но выглядит откровенно мутно.

Пробуем разобраться. Взяли довольно большую загрузку реакционной смеси, удалили на роторе легколетучие растворители (остатки ТГФ), зарегистрировали с этого ¹³С ЯМР. Получилось так (третья картинка):
13C NMR (101 MHz, CDCl3) δ 102.92, 98.78, 78.03, 77.48, 76.84, 70.77, 68.45, 67.99, 67.70, 67.57, 67.35, 65.78, 65.13, 64.32, 62.47, 62.25, 38.59, 37.74, 35.56, 33.94, 32.38, 31.97, 31.81, 30.73, 29.52, 27.68, 26.20, 26.01, 25.48, 25.11, 23.10, 22.91, 22.02, 21.19, 19.61, 19.42, 19.12, 18.09, 13.95, 13.89, 1.00.


Запускаем поиск по спектру .
Получилось 12 страниц результатов, что много, но не ужасно. Далее надо проглядеть их на предмет соответствия здравому смыслу и принципиальной возможности образования таких молекул из ТГФ. В топе много алифатических спиртов и эфиров. В том числе циклических. В том числе тетрагидропирановые, а также ацетальные.
С этим уже можно работать, разбираться что там и как. Но принципиально уже отсюда можно понять, что образуются молекулы, родственные показанному на четвертой картинке.

Далее смесь разделили, выделили вот такие вот молекулы (пятая картинка). И это даже уточняющие фильтры не применяли. А с их помощью можно еще сильнее сузить выдачу данных.
9
Скорость поиска, или зачем нужна регистрация в OdanChem?
#odanchem

Я думаю, почти все, кто пытался найти те или иные данные в OdanChem, сталкивались с тем, что поиск идет долго. Иногда это секунд 5, а иногда он может длиться пару минут и возникает ощущение зависания системы. Почему так долго и что с этим можно сделать?
 
Причин тут несколько: 
1) База данных у нас реально большая. Соответственно, поиск по ней тоже не моментальный. 
2) Вообще говоря, все зависит от запроса в поиске. Если вы нарисуете бензольное кольцо, и в режиме substructure search попросите выдать вам все соединения, которые его содержат, то система найдет миллионы молекул и попробует их вам показать. Это, очевидно, займет много времени. Если же в запросе будет хотя бы дизамещенная ароматика (условный м-хлортолуол), то результаты вы получите гораздо быстрее. Эта же логика применима ко всем поискам: чем более узкий запрос (чем меньше результатов вы ожидаете), тем быстрее он выполнится. 
3) Аналогично про поиск по спектру. Как правило, поиск по ¹³С ЯМР выполняется секунд 20-30, а по ¹Н ЯМР - почти всегда больше минуты. Причина та же: количество результатов поиска по протоннику и по углероднику отличается на порядок и более. Поэтому и работает оно дольше. 
4) Скорость интернета. Данные надо не только найти, но и загрузить вам в браузер. Это может занять несколько секунд. К сожалению, во многих наших институтах встречаются проблемы с интернет-соединением.

Понятно, ждать никто не любит. Чтобы как-то упросить всем жизнь, мы создали такой инструмент, как история поиска, которая возникает у каждого зарегистрированного пользователя.  Скорее всего, все или почти все подписчики данного канала уже и так зарегистрированы на платформе. Если нет - зарегистрируйтесь, без этого вы упускаете много полезных возможностей. Как минимум, все упоминавшиеся опции вроде поиска по спектру и по реакциям у нас доступны только после регистрации. Она доступна как напрямую, так и через платформу Colab @colaboratory.

Чтобы открыть свою историю поиска, надо нажать на свое имя в правом верхнем углу, и после этого нажать на синюю кнопку Search History в середине внизу экрана. Либо вот прямая ссылка. В ней сохраняются ваши поиски в хронологическом порядке. Они хранятся 2 недели.

Оттуда вы можете открыть начатый ранее поиск и быстро получить результаты, закэшированные в системе. Там же отображается статус поиска. Если он еще не закончился, то будет пометка in progress. Соответственно, если у вас возникает ощущение, что что-то зависло, то можно смело закрыть данную вкладку, перейти в историю поиска и открыть результаты оттуда.

А еще в истории поиска у нас доступен очень мощный инструмент - пересечение поисков. Про него расскажем в другом посте.
👍85🔥4
Пересечение поисков

В прошлый раз мы рассказали про то, что в OdanChem существует история поисков, и она удобна тем, что там можно отслеживать статус поиска, открыть ранее начатую работу, увидеть статистику сколько молекул/спектров/публикаций удалось найти в каждом из ваших поисков. И также напомним, что чтобы попасть в свою историю поиска, надо нажать на своё имя в правом верхнем углу, после этого — синяя кнопка Search History внизу экрана посередине. Либо вот прямая ссылка.    

В этот раз мы хотим показать один очень важный инструмент — пересечение поисков. Он позволяет заметно снизить количество результатов в выдаче, оставив только те, которые соответствуют нескольким запросам. Покажем на примере разбора реальной реакционной смеси.

Как-то в лаборатории мы хотели получить бета-нитростирол из п-фторбензальдегида и нитрометана (картинка 1). Запустили реакцию, зарегистрировали спектр с реакционной смеси. Скриншот со спектра — рисунок 2. Видно, что это какая-то именно что смесь. Нужного нитростирола там явно нет: не видно характерных дублетов с большой константой. Понятно, что есть оставшийся альдегид, но что там еще? Конечно, опытный синтетик, глядя на этот спектр, может его разгадать. Но в случае, если опыта еще недостаточно, или нет времени глубоко вникать в данную реакцию (а это синтез исходников: что тут думать, тут варить надо:)), может прийти на помощь анализ в OdanChem. В данном случае синтез выполняла студентка, которая не так давно на тот момент присоединилась к лаборатории, и большого опыта самостоятельного расшифровывания состава смесей у неё ещё не было.

Для разгадки мы взяли порядка сотни миллиграмм смеси, зарегистрировали ¹Н ЯМР, ¹⁹F ЯМР и ¹³С ЯМР с неё. Углеродный спектр выглядит как-то так (рисунок 3). Человек такое вряд ли разгадает. Далее разметили эти спектры в MestReNova (отметили все сигналы).

Следующий этап — выполнить поиск по спектру. Просто открываем три вкладки в браузере, идем на страницу поиска, копируем строку каждого спектра, сгенерированную MestReNova (интенсивности в случае протонных спектров можно игнорировать — важно отметить все пики). Выполняем три независимых поиска по спектру. После чего открываем историю поиска и смотрим, что там нашлось. 

Результаты показаны на рисунке 4. Видно, что углеродный спектр лучше всего подходит для автоматизированного поиска — всего 202 молекулы, которые могут входить в состав данной смеси. При этом поиск по фторному и протонному спектрам дал тысячи или десятки тысяч результатов. Почему так, описывал ранее. А теперь выбираем галочками фторный и углеродный поиски и нажимаем на Intersection by Compound (Рисунок 5). Результат — на рисунке 6. 
Всего 4 молекулы соответствуют и фторному, и углеродному спектрам. Одна из них явно не соответствует нашему результату, так как фосфора в реакционной системе не было. А три оставшихся явно присутствуют в нашей реакционной смеси. Вот так в несколько кликов можно разобрать состав не самой тривиальной реакционки. Кстати, данный результат пересечения тоже появится в вашей истории поиска. Его при желании можно пересечь ещё с чем-то. 

Пересечения доступны для всех типов поисков, появляющихся в истории. Например, можно пересекать поиск по фрагменту структуры с поиском по спектру. Или результат пересечения с чем-то ещё. В общем, инструмент очень гибкий, мощный, и позволяет ощутимо сузить количество результатов относительно исходного запроса. 

В комментариях приглашаем поделиться вашим опытом работы с этим или другими инструментами)
👍10❤‍🔥2🤩2🔥1
Коллеги, вопрос:
А кто где ведет записи своих экспериментов? В комментариях приглашаю обсудить плюсы и минусы каждой из опций, перечисленных в следующем посте ⬇️
OdanLab — электронный лабораторный журнал на базе OdanChem

Коллеги, у нас важный релиз, о котором давно пора рассказать.

OdanChem постепенно расширяется, в нем появляются новые подсистемы, и сегодня мы всем представляем электронный лабораторный журнал

Чуть меньше года назад мы совместно с Иркутским Политехническим Университетом (ИРНИТУ) и Институтом Фаворского (ФИЦ ИрИХ СО РАН) начали работу над созданием платформы, где было бы удобно:
— вести совместную работу над исследовательскими проектами,
— анализировать и хранить данные,
— работать со складом реактивов,
— автоматически подтягивать сведения о молекулах.

Результатом стал электронный лабжурнал (он же ELN, или LIMS), который плотно интегрирован с основными базами данных OdanChem — https://lab.odanchem.org/.  

Ключевые фишки, которые делают его удобным: 
1) Легкое создание склада реактивов. Вы вводите CAS-номер или структуру и указываете, где лежит банка реактива. Система автоматически подгружает все данные по безопасности, физические свойства, и даже ЯМР спектры данной молекулы. 
2) Совместная работа над проектами. Все ваши эксперименты хранятся в унифицированном формате, можно без проблем найти записи о том, что делал ваш коллега 3 года назад, даже если он уже уволился. Можно гибко настраивать уровни доступа к проекту, приглашать туда сотрудников. 
3) Автоподтягивание свойств веществ. При создании реакции все доступные сведения о молекулах также автоматически подгрузятся и будут учтены в расчетах (например, плотность).
4) Автоматический контроль соответствия ЯМР спектров структуре. Когда вы выделили какую-то молекулу, зарегистрировали для неё спектры, их можно внести в соответствующее поле в журнале. Система проверит его на наличие ошибок, соответствие предполагаемой структуре и сравнит его с литературными данными (если они есть). Если соответствие найдено, будет приведена ссылка на литературный источник. 
При совпадении будет приведена ссылка на источник. Если обнаружена ошибка — вы получите комментарий с её описанием.
5) и многое другое. Всё в один пост точно не поместится, будем постепенно публиковать описание возможностей данного журнала.
И заодно приветствуем предложения, чего ещё вам хотелось бы в нём увидеть.  

Бесплатная версия системы доступна онлайн:
👉 https://lab.odanchem.org/

Можно начинать работать уже сейчас. Данные регулярно бэкапятся и шифруются, вероятность их потери минимальна. К примеру, почему бы преподавателям практикумов по органике не попробовать вести свой практикум здесь? Студентам удобно вести записи, а потом их легко проверять. Автосверка ЯМР со структурой будет бонусом, но автовыдачу люлей за плохое описание спектра пока не прикрутили. 

Если у вас что-то работает неидеально, то скажите нам — ваши замечания и идеи реально учитываются и внедряются.
Все вопросы, баги и предложения — в чат техподдержки или на support@odanchem.org.

Если же вы хотите оффлайн версию — она тоже доступна, но это всё обговаривается индивидуально, т.к. у каждого свои особенности локальной сети в организации. Пишите нам, если заинтересованы.
🔥3515👍11🎉7👀3