Акелла промахнулся.
Часть 1.
Мы вернулись (будто бы мы уходили😀 )! А значит, пора наконец поднять вопрос, который приличные интерпретаторы обычно аккуратно заметают под коврик.
В этот раз речь пойдёт не про про то, какие мы крутые и как лихо справляемся с трудностями😎 . Сегодня мы частично ответим на вопрос уважаемых зрителей нашей телепередачи про ошибки и миссдиагностику.
Но сначала о том, какие ошибки вообще бывают в интерпретации:
🤩 Неточности и ограничения пайплайнов и аннотаций.
Инструменты меняются, версии обновляются. Например, потеря экзонов как low impact у VEP. Или один и тот же ген может фигурировать под разными названиями в OMIM и в аннотации, а при фильтрации он загадочным образом пропадает.
🤩 Ошибка новичка.
Болезненно, неприятно, но неизбежно.
🤩 Невнимательность.
Поток образцов, дедлайны, рутина. «Потом пересмотрю» – как невыполненное обещание.
🤩 Недостаточная профессиональная компетентность.
Формальное знание ACMG и спецификаций, работа по шорт-листу аннотированных вариантов, вера в автоматическую аннотацию и игнорирование факта существования BAM-файла.
🤩 Технические и лабораторные ошибки, которые интерпретатору сложно или невозможно отследить: перепутанные пробирки, контаминация плода материнским материалом на 80+%, отсутствие критически важной клинической информации в направлении и ещё много-много другого.
Ошибаются все. Вопрос лишь в том, какие выводы вы делаете и как потом с этим работаете. Но об этом позже, а пока – кейс.
Ребёнок с поражением нескольких органов и специфической клиникой, очень похожей на конкретный синдром. Назначение эффективной терапии напрямую зависит от «генетики»:
есть синдром – есть терапия, нет синдрома – нет терапии. Пациенту выполняется WES.
По результатам – находок нет, диагноза нет.
Через год пациенту делают ХМА. Обнаруживается небольшая CNV с вовлечением нескольких экзонов того самого специфичного гена.
При пересмотре данных WES руками и глазами как минимум в пределах искомого гена CNV вполне себе видно.
Никто не умер. Диагноз поставлен. Но время потеряно.
Простые истины (задним числом), как этого можно было избежать:
🤩 Посмотреть литературу. Если для гена описаны CNV – это уже повод целенаправленно поискать их.
🤩 Ходить «пешком» по BAM и сравнивать покрытие с другими образцами (в идеале – из того же запуска).
🤩 Иметь под рукой CNV-пайплайн для WES. Во многих лабораториях он формально есть. Очень хочется верить, что не только «для галочки».
Это не единственный факап, который может случиться. В следующем посте поговорим о другой легендарной и популярной категории ошибок: варианты с низким качеством💩 , в которые очень хотелось поверить, но в итоге на Сэнгере не подтвердились.
А пока приглашаем в комментарии покаяться🥰 .
Рассказывайте:
🤩 про свои ошибки,
🤩 про чужие ошибки,
🤩 про кейсы, которые до сих пор преследуют в кошмарах.
Мы слушаем и мы не осуждаем! Осуждать будут в закрытых чатах😀
Думайте. Подписаться.
Скука интерпретатора
Часть 1.
Мы вернулись (будто бы мы уходили
В этот раз речь пойдёт не про про то, какие мы крутые и как лихо справляемся с трудностями
Но сначала о том, какие ошибки вообще бывают в интерпретации:
Инструменты меняются, версии обновляются. Например, потеря экзонов как low impact у VEP. Или один и тот же ген может фигурировать под разными названиями в OMIM и в аннотации, а при фильтрации он загадочным образом пропадает.
Болезненно, неприятно, но неизбежно.
Поток образцов, дедлайны, рутина. «Потом пересмотрю» – как невыполненное обещание.
Формальное знание ACMG и спецификаций, работа по шорт-листу аннотированных вариантов, вера в автоматическую аннотацию и игнорирование факта существования BAM-файла.
Ошибаются все. Вопрос лишь в том, какие выводы вы делаете и как потом с этим работаете. Но об этом позже, а пока – кейс.
Ребёнок с поражением нескольких органов и специфической клиникой, очень похожей на конкретный синдром. Назначение эффективной терапии напрямую зависит от «генетики»:
есть синдром – есть терапия, нет синдрома – нет терапии. Пациенту выполняется WES.
По результатам – находок нет, диагноза нет.
Через год пациенту делают ХМА. Обнаруживается небольшая CNV с вовлечением нескольких экзонов того самого специфичного гена.
При пересмотре данных WES руками и глазами как минимум в пределах искомого гена CNV вполне себе видно.
Никто не умер. Диагноз поставлен. Но время потеряно.
Простые истины (задним числом), как этого можно было избежать:
Это не единственный факап, который может случиться. В следующем посте поговорим о другой легендарной и популярной категории ошибок: варианты с низким качеством
А пока приглашаем в комментарии покаяться
Рассказывайте:
Мы слушаем и мы не осуждаем! Осуждать будут в закрытых чатах
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20🔥13💅7🤔4 1
Носительства. Часть 3.
В предыдущих сериях (раз, два) мы обсуждали кому не стоит выдавать носительства. Теперь про исследование, где вынесение ГГЗ и есть цель: скрининг носительства (он же преконцепционный).
Идея такая: каждый тестируемый несёт от нуля до десятка вариантов, может встретить партнёра с вариантом в том же гене и получить ненулевой риск рождения ребёнка с заболеванием.
Главное - дать паре репродуктивный выбор.
Казалось бы, но тут-то какие сложности? Неси все, что не приколочено, и дело сделано!
По-хорошему, тут можно писать гайд, а не пост.
Но сегодня мы пробежимся по верхам.
На что вообще делать скрининг
Используются два подхода:
⭕ по частоте (этнический [но сначала придется сделать тест в генотеке 😀 ] или панэтнический скрининг);
⭕ по тяжести - независимо от распространённости.
И вот тут ключевой момент, который часто упускают:
💡 Тяжесть заболевания должна быть такой, что на него в принципе имело бы смысл делать ПГТ-М.
Подходит ли сюда носительство вариантов генах нарушения репродуктивной функции?
Кому и когда
⭕ в первую очередь парам, планирующим беременность, и донорам (привет Паше Дурову!)
⭕ оптимально - до беременности, но и во время беременности допустимо (ACMG не возражает).
Современный консенсус:
клиническое значение имеет не одиночное носительство, а совпадение у пары в одном гене.
Возраст
Возраст должен быть «репродуктивным», а пациент - способным дать информированное согласие (есть даже упоминание подростков, планирующих беременность). Но те же гайды рекомендуют откладывать тестирование несовершеннолетних, пока результат не принесёт практической пользы здесь и сейчас.
Что дальше?
Если мы делаем скрининг, должны существовать опции:
⭕ ПГТ-М;
⭕ прерывание беременности;
⭕ или осознанное «ничего не делать» (да, это тоже репродуктивный выбор).
А что выдавать?
⭕ Парам без отягощённого семейного анамнеза стоит выносить только патогенные и вероятно патогенные варианты.
⭕ Парам с отягощённым семейным анамнезом допустимо обсуждать VUS, а иногда и GUS, потому что здесь скрининг фактически смещается в сторону поиска причины.
🔲 Отдельная скользкая зона - гипоморфные варианты. Такие варианты частично сохраняют функцию гена, а их вклад в фенотип зависит от второго аллеля и контекста. В результате сложно предсказать тяжесть заболевания и решить, является ли состояние достаточной целью для ПГТ-М, что делает такие варианты особенно проблемными в скрининге носительства.
По-хорошему, нужен не просто список-табличка, а качественное описание вариантов в заключении с указанием патогенности, фенотипов, пенетрантности и других нюансов. Это становится задачей со звездочкой, когда таких вариантов 10+.
Кроме того, если скрининг проводится посредством NGS (WES или WGS), мы получаем больше данных, и что тогда делать с доминантными заболеваниями и CNV в этих рамках? Предполагается, что ничего, ведь пресимптоматическое тестирование не рекомендуется, но все ли так однозначно?..
А что думаете Вы? Давайтепоругаемся обсудим в комментариях 😎 .
Думайте. Подписаться.
Скука интерпретатора
В предыдущих сериях (раз, два) мы обсуждали кому не стоит выдавать носительства. Теперь про исследование, где вынесение ГГЗ и есть цель: скрининг носительства (он же преконцепционный).
Идея такая: каждый тестируемый несёт от нуля до десятка вариантов, может встретить партнёра с вариантом в том же гене и получить ненулевой риск рождения ребёнка с заболеванием.
Главное - дать паре репродуктивный выбор.
Казалось бы, но тут-то какие сложности? Неси все, что не приколочено, и дело сделано!
По-хорошему, тут можно писать гайд, а не пост.
Но сегодня мы пробежимся по верхам.
На что вообще делать скрининг
Используются два подхода:
И вот тут ключевой момент, который часто упускают:
Подходит ли сюда носительство вариантов генах нарушения репродуктивной функции?
Кому и когда
Современный консенсус:
клиническое значение имеет не одиночное носительство, а совпадение у пары в одном гене.
Возраст
Возраст должен быть «репродуктивным», а пациент - способным дать информированное согласие (есть даже упоминание подростков, планирующих беременность). Но те же гайды рекомендуют откладывать тестирование несовершеннолетних, пока результат не принесёт практической пользы здесь и сейчас.
Что дальше?
Если мы делаем скрининг, должны существовать опции:
А что выдавать?
По-хорошему, нужен не просто список-табличка, а качественное описание вариантов в заключении с указанием патогенности, фенотипов, пенетрантности и других нюансов. Это становится задачей со звездочкой, когда таких вариантов 10+.
Кроме того, если скрининг проводится посредством NGS (WES или WGS), мы получаем больше данных, и что тогда делать с доминантными заболеваниями и CNV в этих рамках? Предполагается, что ничего, ведь пресимптоматическое тестирование не рекомендуется, но все ли так однозначно?..
А что думаете Вы? Давайте
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15 12❤7😁3💅1 1 1 1
This media is not supported in your browser
VIEW IN TELEGRAM
Да не было такого никогда
Скука интерпретатора
Скука интерпретатора
😁24 11 4 1 1
Акела промахнулся (еще раз)
Один маленький, но очень самоуверенный анонимный интерпретатор увидел вариант, идеально подходящий по фенотипу и к тому же🟠 . Интерпретатор настолько поверил в себя, что закрыл глаза на то, что у варианта всего два прочтения (пусть и разнонаправленных). Долго томить не будем: вариант не подтвердился на Сэнгере😓 .
И вот тут самое время растечься мыслью по древу и начать душный философский разговор про «хороший, плохой, злой» вариант, а заодно - про качество, насмотренность и самоуверенность.
🥰 «Хороший вариант»
Качественный вариант - это не «многа ридаф», а совокупность признаков:
💛 поддержка с обеих цепей без strand bias,
💛 адекватные метрики качества и нормальное выравнивание,
💛 отсутствие систематических/технических ограничений и ошибок в регионе,
💛 поведение на BAM воспроизводимо и понятно,
💛 он согласуется с клиникой и типом наследования.
🤬 «Плохой» вариант
Когда вариант низкокачественный? Загибаем пальцы:
💛 1-2 прочтения,
💛 VAF на грани чувствительности,
💛 шумный или сложный регион (повторы, псевдогены, GC-безумие),
💛 strand bias,
💛 грязный BAM и слабые метрики.
Такой вариант:
💛 держится только на честном слове интерпретатора,
💛 «как будто похож» по фенотипу», но фенотип не специфичный,
💛 выносится по принципу «ну мало ли? мы ж всей клиники не видим!!!»,
💛 иногда просто проигнорирован на BAM,
💛 еще хуже, если это слабый VUS.
😡 «Злой» вариант
Не тот, за кого себя выдает! Это вариант, который:
💛 выглядит как мусор,
💛 имеет низкий VAF,
💛 может не подтверждаться Сэнгером,
💛 сидит в плохо покрытом и/или сложном регионе,
...но при этом реально существует и является причиной заболевания.
Чаще всего это:
💛 мозаицизм <10%,
💛 технические ограничения (например, WGS и его ~30х),
💛 «не та» ткань.
И если в лаборатории нет способа это проверить, многие предпочитают такие варианты просто не выносить.
🧷 Когда можно рискнуть?
Если есть биологический смысл, клиническая гипотеза и способ обойти ограничения метода (глубокий таргетный NGS, другая ткань). Но нужно быть готовым отстаивать его место под солнцем перед лабораторией и врачом-генетиком. Правда заключается в том, что большинство таких вариантов - это просто шум.
🔖 Вместо выводов
1-2 прочтения - чаще всего «мусорный» вариант💩 . Если в каждом одиноком нуклеотиде видеть потенциал, можно быстро сойти с ума. После истории с неподтвердившимся «идеальным» вариантом и подзатыльника от лаборатории обычно долго не хочется выносить ничего подобного.
Но иногда… можно прислушаться к шепоту голосов в голове, обсудить идею с клиническим генетиком и всё-таки разгадать загадку.
Дружеское напоминание: такие случаи редки. Но это не значит, что их не бывает😎
Думайте. Подписаться.
Скука интерпретатора
Один маленький, но очень самоуверенный анонимный интерпретатор увидел вариант, идеально подходящий по фенотипу и к тому же
И вот тут самое время растечься мыслью по древу и начать душный философский разговор про «хороший, плохой, злой» вариант, а заодно - про качество, насмотренность и самоуверенность.
Качественный вариант - это не «многа ридаф», а совокупность признаков:
Когда вариант низкокачественный? Загибаем пальцы:
Такой вариант:
Не тот, за кого себя выдает! Это вариант, который:
...но при этом реально существует и является причиной заболевания.
Чаще всего это:
И если в лаборатории нет способа это проверить, многие предпочитают такие варианты просто не выносить.
Если есть биологический смысл, клиническая гипотеза и способ обойти ограничения метода (глубокий таргетный NGS, другая ткань). Но нужно быть готовым отстаивать его место под солнцем перед лабораторией и врачом-генетиком. Правда заключается в том, что большинство таких вариантов - это просто шум.
1-2 прочтения - чаще всего «мусорный» вариант
Но иногда… можно прислушаться к шепоту голосов в голове, обсудить идею с клиническим генетиком и всё-таки разгадать загадку.
Дружеское напоминание: такие случаи редки. Но это не значит, что их не бывает
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25 11 6🔥3🤯2 2 1
Бро, LOH, ROH, AOH и тд...
LOH (loss of heterozygosity) участки потери гетерозиготности или они же ROH (large regions of homozygosity) «длинные» участки гомозиготности - это протяженные области, где нет гетерозиготных вариантов, сплошные гомозиготы😎
Сразу дисклеймер: LOH в данном посте мы будем рассматривать только в контексте диагностики орфанных заболеваний. Онкологию затрагивать не будем (не наша поляна).
LOH могут быть как копийно-нейтральными (LOH-CN), так и свидетельствовать о наличии делеции в области LOH. Мы поговорим о первых (далее LOH-CN) в контексте интерпретации.
О чем наличие LOH-CN может нам говорить:
🔘 Ни о чем - иногда это просто «нормальный фон». LOH малого размера распространены в геноме;
🔘 Однородительская дисомия (UPD) - в зависимости от размера и локализации, может быть как изодисомия, так и гетеродисомия;
🔘 Близкородственный брак - оставим без комментариев, ибо можно неосторожно влезть в область, которая не касается интерпретации 💩 . Но отметим, что в этом контексте искать UPD на WES или WGS - задача почти неподъемная.
Важно: LOH ≠ UPD. Это алгоритмический результат пайплайна и лишь гипотеза, требующая интерпретации и дальнейшего подтверждения.
Какие LOH ACMG и другие предлагают сообщать:
🔘 интерстициальные >10 МБ;
🔘 терминальные >5 МБ;
🔘 суммарную долю LOH по всему геному >3%.
Зачем их искать и как интерпретировать?
В первую очередь, следует искать LOH в областях, где локализованы известные импринтинговые синдромы, особенно если это подходит под фенотип (или был запрос на поиск от направившего врача). Без клиники и подтверждения LOHне мамонт - это не диагноз.
Ключевые регионы, на которые стоит обращать внимание:
🔘 15q11–q13 синдром Прадера-Вилли/синдром Ангельмана;
🔘 11p15 синдром Беквита-Видемана/синдром Сильвера-Рассела;
🔘 7q32 синдром Сильвера-Рассела;
🔘 14q32 синдром Тэмпл/синдром Кагами-Огата;
🔘 6q24 транзиторный неонатальный диабет;
🔘 20q13 GNAS-ассоциированные заболевания.
Кроме того, в протяженных LOH могут находиться гомозиготные рецессивные варианты известных или ещё не описанных синдромов.
Остались вопросы..? Приходите на Genetico.FBI 12 февраля (не реклама конференции! она ещё и платная👎 ), где Дима подробнее разберет эту тему.
Думайте. Подписаться.
Скука интерпретатора
LOH (loss of heterozygosity) участки потери гетерозиготности или они же ROH (large regions of homozygosity) «длинные» участки гомозиготности - это протяженные области, где нет гетерозиготных вариантов, сплошные гомозиготы
Сразу дисклеймер: LOH в данном посте мы будем рассматривать только в контексте диагностики орфанных заболеваний. Онкологию затрагивать не будем (не наша поляна).
LOH могут быть как копийно-нейтральными (LOH-CN), так и свидетельствовать о наличии делеции в области LOH. Мы поговорим о первых (далее LOH-CN) в контексте интерпретации.
О чем наличие LOH-CN может нам говорить:
Важно: LOH ≠ UPD. Это алгоритмический результат пайплайна и лишь гипотеза, требующая интерпретации и дальнейшего подтверждения.
Какие LOH ACMG и другие предлагают сообщать:
Зачем их искать и как интерпретировать?
В первую очередь, следует искать LOH в областях, где локализованы известные импринтинговые синдромы, особенно если это подходит под фенотип (или был запрос на поиск от направившего врача). Без клиники и подтверждения LOH
Ключевые регионы, на которые стоит обращать внимание:
Кроме того, в протяженных LOH могут находиться гомозиготные рецессивные варианты известных или ещё не описанных синдромов.
Остались вопросы..? Приходите на Genetico.FBI 12 февраля (не реклама конференции! она ещё и платная
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20 9🤯4💅3❤2😁2 1 1 1
Внеплановое подключение. Рекомендуем поучаствовать, если еще не зарегистрировались 😎 .
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Nikolay
Приглашаем на Хакатон «ГеномIQ» в Томске!
У вас есть опыт в интерпретации генетических вариантов?
Тогда присоединяйтесь к нашему Хакатону! В течение трёх насыщенных дней в Томске вы поработаете над реальными кейсами, обменяетесь опытом и расширите свой профессиональный круг общения.
Что Вас ждёт:
· Разбор реальных клинических кейсов на основе данных полногеномного секвенирования;
· Интенсивная командная работа;
· Комфортная площадка с кофе-брейками;
· Живое общение и обмен опытом с единомышленниками;
· Призовой фонд – 500 000 рублей!
Формат мероприятия:
· Офлайн в г.Томске;
· Команды по 5 человек формируются в первый день;
· На каждый кейс выделен фиксированный призовой фонд, который распределяется между командами, успешно его решившими.
Мы также приглашаем начинающих специалистов: параллельно на той же площадке пройдёт вводный курс по интерпретации геномных данных с лекциями от профессионалов.
Важно!
Для участия в Хакатоне «ГеномIQ» и школе проводится конкурсный отбор на основе предоставленных материалов:
· Для Хакатона – анкета и краткое описание опыта в интерпретации геномных данных.
· Для Школы (начинающие специалисты) – мотивационное письмо.
Место проведения: г. Томск
Даты проведения: 8–10 апреля 2026 года
Регистрация открыта до: 28 февраля 2026 года
Подробности и регистрация на сайте: https://genomiq.medgenetics.ru/register/hac/
Или в телеграмм-канале: https://t.iss.one/GenomIQ_hackathon
Не упустите шанс проявить себя и выиграть приз!
Ждём вас в Томске!
У вас есть опыт в интерпретации генетических вариантов?
Тогда присоединяйтесь к нашему Хакатону! В течение трёх насыщенных дней в Томске вы поработаете над реальными кейсами, обменяетесь опытом и расширите свой профессиональный круг общения.
Что Вас ждёт:
· Разбор реальных клинических кейсов на основе данных полногеномного секвенирования;
· Интенсивная командная работа;
· Комфортная площадка с кофе-брейками;
· Живое общение и обмен опытом с единомышленниками;
· Призовой фонд – 500 000 рублей!
Формат мероприятия:
· Офлайн в г.Томске;
· Команды по 5 человек формируются в первый день;
· На каждый кейс выделен фиксированный призовой фонд, который распределяется между командами, успешно его решившими.
Мы также приглашаем начинающих специалистов: параллельно на той же площадке пройдёт вводный курс по интерпретации геномных данных с лекциями от профессионалов.
Важно!
Для участия в Хакатоне «ГеномIQ» и школе проводится конкурсный отбор на основе предоставленных материалов:
· Для Хакатона – анкета и краткое описание опыта в интерпретации геномных данных.
· Для Школы (начинающие специалисты) – мотивационное письмо.
Место проведения: г. Томск
Даты проведения: 8–10 апреля 2026 года
Регистрация открыта до: 28 февраля 2026 года
Подробности и регистрация на сайте: https://genomiq.medgenetics.ru/register/hac/
Или в телеграмм-канале: https://t.iss.one/GenomIQ_hackathon
Не упустите шанс проявить себя и выиграть приз!
Ждём вас в Томске!
Telegram
Хакатон "ГеномIQ"
Добро пожаловать в официальный информационный канал Школы-Хакатона ГеномIQ!
Здесь Вы найдете все самое важное о нашем мероприятии.
Присоединяйтесь к нам, чтобы быть в курсе всех событий и стать частью сообщества!
Здесь Вы найдете все самое важное о нашем мероприятии.
Присоединяйтесь к нам, чтобы быть в курсе всех событий и стать частью сообщества!
❤11🔥11
Дабл-каунт в интерпретации
Одна из самых частых причин завышенной патогенности - банальный двойной подсчёт критериев (double count, далее - дабл-каунт). Вы все видели это в Клинваре и в статьях, а может, и в заключениях уважаемых коллег. Особенно сейчас, когда ACMG V4 все еще прогревает нас своим выходом на большие экраны, но уже есть нагромождение рекомендаций друг на друга и ранжирование критериев по силе.
Сначала вспомним базу Tavtigian et al. 2020:
🟣 ВУС: 0-5 баллов
🟠 Вероятно патогенный: 6-9 баллов
🔴 Патогенный: ≥10 баллов
Чтобы понять, какие критерии нельзя считать вместе, нужно разобраться, сколько они «весят».
Да, есть калькуляторы (вот красивый по классическому ACMG, а во Franklin есть возможность вручную ранжировать силу критериев). Но если не знать, что у них под капотом, легко натянуть VUS на LP, а неописанный pLOF на Pat.
Сколько дают баллов дают критерии:
🔘 Supporting - 1 балл (PP1, PP2, PP3, PP4).
Важно: PM2 (частота) разжаловали в Supporting, а PP5 в приличном обществе больше не добавляет баллов.
🔘 Moderate - 2 балла (PM1, PM3, PM4, PM5, PM6)
🔘 Strong - 4 балла (PS1, PS2, PS3, PS4)
🔘 Very Strong - 8 баллов (PVS1)
Важно: критерии можно, а иногда и нужно ранжировать по силе:
🔘 PVS1 - это не всегда 6 баллов (посты про айсберг PVS1 раз, два, три). Есть PVS1_supp, PVS1_mod и т.д.
🔘 PP3 тоже можно калибровать. Теоретически - до Moderate и Strong. Практически - лучше оставлять Supporting, если нет отдельных спецификаций от ClinGen. Иначе можно легко наплодить верпатов.
Это только примеры, у других критериев тоже существует ранжирование по силе. Держим это в голове! Подробно разберём отдельно как-нибудь в другой раз.
🏴 Зачем вообще запрет на дабл-каунт?
Чтобы не завышать патогенность и оставить в покое сов и глобусы. Некоторые критерии описывают одну и ту же биологическую гипотезу. Если сложить их, получается искусственное усиление. (VUS → LP, LP → P)
Классически ловушки:
➡️ PP3 (предикторы) + PVS1 (LOF)
LOF уже учтён в PVS1, предикторы не добавляем. Канонический сайт сплайсинга - тоже нет. Да, SpliceAI предсказывает, но считать его не надо.
➡️ PM5 (другая АК описана как LPAT/PAT) + PM1 (хот-спот)
Оба критерия про критичность белковой позиции. PM5 более специфичен - выбираем его.
➡️ PVS1 (LOF) + PM4 (изменение длины белка)
Выбираем тот критерий, который соответствует молекулярному механизму (см. дерево принятия решений по PVS1)
➡️ PS3 (функциональные исследования) + PP3 (предикторы)
Есть качественное функциональное исследование? Предсказали уже не усиливают доказательство.
➡️ PS1 (такая же АК описана как LPAT/PAT) + PM5 (другая АК описана как LPAT/PAT)
Если применим PS1, PM5 не добавляем. Выбираем более сильный критерий.
❗️ Главное правило
Если два критерия:
🔘 основаны на одной биологической логике
🔘 подтверждают одну и ту же гипотезу
🔘 не являются независимыми линиями доказательств
- это дабл-каунт, независимо от их силы.
Еще один важный момент:
Даже если вы не сложили баллы в калькуляторе и не учитывали их в интерпретации варианта, но в текстовом описании перечислили оба зависимых критерия - это может создать ложное впечатление у читающего (коллеги, рецензента, себя из будущего). Поэтому:
🔘 Если вы не применяете PP3 к варианту в каноническом сайте сплайсинга - не пишите в тексте про вердикт SpliceAI.
🔘 Если вы не применяете PP3 вместе с PS3 - не перечисляйте предикторы в тексте у хорошо известного патогенного варианта с качественным функциональным исследованием.
Текст заключения - это не просто перечень всего, что видите. Это расшифровка того, что реально пошло в подсчёт баллов и является доказательством патогенности. Лишние критерии в тексте - это скрытый дабл-каунт, даже если вы его не посчитали.
Думайте. Подписаться.
Скука интерпретатора
Одна из самых частых причин завышенной патогенности - банальный двойной подсчёт критериев (double count, далее - дабл-каунт). Вы все видели это в Клинваре и в статьях, а может, и в заключениях уважаемых коллег. Особенно сейчас, когда ACMG V4 все еще прогревает нас своим выходом на большие экраны, но уже есть нагромождение рекомендаций друг на друга и ранжирование критериев по силе.
Сначала вспомним базу Tavtigian et al. 2020:
Чтобы понять, какие критерии нельзя считать вместе, нужно разобраться, сколько они «весят».
Да, есть калькуляторы (вот красивый по классическому ACMG, а во Franklin есть возможность вручную ранжировать силу критериев). Но если не знать, что у них под капотом, легко натянуть VUS на LP, а неописанный pLOF на Pat.
Сколько дают баллов дают критерии:
Важно: PM2 (частота) разжаловали в Supporting, а PP5 в приличном обществе больше не добавляет баллов.
Важно: критерии можно, а иногда и нужно ранжировать по силе:
Это только примеры, у других критериев тоже существует ранжирование по силе. Держим это в голове! Подробно разберём отдельно как-нибудь в другой раз.
Чтобы не завышать патогенность и оставить в покое сов и глобусы. Некоторые критерии описывают одну и ту же биологическую гипотезу. Если сложить их, получается искусственное усиление. (VUS → LP, LP → P)
Классически ловушки:
LOF уже учтён в PVS1, предикторы не добавляем. Канонический сайт сплайсинга - тоже нет. Да, SpliceAI предсказывает, но считать его не надо.
Оба критерия про критичность белковой позиции. PM5 более специфичен - выбираем его.
Выбираем тот критерий, который соответствует молекулярному механизму (см. дерево принятия решений по PVS1)
Есть качественное функциональное исследование? Предсказали уже не усиливают доказательство.
Если применим PS1, PM5 не добавляем. Выбираем более сильный критерий.
Если два критерия:
- это дабл-каунт, независимо от их силы.
Еще один важный момент:
Даже если вы не сложили баллы в калькуляторе и не учитывали их в интерпретации варианта, но в текстовом описании перечислили оба зависимых критерия - это может создать ложное впечатление у читающего (коллеги, рецензента, себя из будущего). Поэтому:
Текст заключения - это не просто перечень всего, что видите. Это расшифровка того, что реально пошло в подсчёт баллов и является доказательством патогенности. Лишние критерии в тексте - это скрытый дабл-каунт, даже если вы его не посчитали.
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
❤30🔥17 6
Трансы и прочие нюансы
Давайте продолжим тему недопонятых критериев и натянутой патогенности.
Один из самых любимых - PM3:
Он не раз «поднимал с колен» слабенькие VUS-ы. За это стоит поблагодарить классический гайд ACMG 2015, чьи местами размытые формулировки позволяли вольно его трактовать.
Если использовать рекомендации из классического ACMG:
🔘 PM2 (редкий)
🔘 PM3 (в транс- положении с патом)
🔘 PP3 (предикторы ругаются)
🔘 любой слабый (supporting) и не всегда корректно применённый критерий (например, PP4 - специфичный фенотип).
...и вот уже перед нами почти сияющий LP. Браво!😎
Не слишком ли лихо? Вот и уважаемая группа ClinGen (SVI 2019) пришла к выводу, что слишком жирно за транс положение с патом давать такой вес критерию, и переосмыслила PM3. И опять заставила нас считать баллы!
Как работает PM3 по новым правилам:
1⃣ Статус пациента
Исследуемый должен быть больным (и больным искомым/найденным заболеванием, мы не ищем случайные находки, особенно пары LP/VUS или VUS /VUS).
2⃣ Редкость
Оба варианта должны быть достаточно редкими (PM2). Даже если вы подтвердили транс- в трио, но исследуемый вариант слишком частый в популяции - он отправляется в корзину.
3⃣ Калькулятор
Теперь PM3 - это балльная система. Баллы зависят от:
🔘 патогенности варианта на втором аллеле
🔘 подтверждённости фазы
Примеры:
🔘 Подтверждённый транс- с P/LP → 1 балл
🔘 Фаза неизвестна, второй вариант P/LP → 0.5 балла
🔘 Гомозигота → 0.5 балла
🔘 Подтверждённый транс- с VUS → 0.25 балла
🔘 Фаза неизвестна, второй вариант VUS → 0
4⃣ Суммируем баллы от всех (!) пробандов
🔘 1 балл → Moderate
🔘 2 балла → Strong
🔘 4 балла → Very Strong
5⃣ Лимитированные баллы
🔘 Все гомозиготные случаи (и ваши, и из литературы) в сумме дают максимум 1 балл
🔘 Все случаи с VUS на втором аллеле - максимум 0.5 балла суммарно.
Что это значит? Если в литературе описано 123 пробанда с вариантом в гомозиготе и у вас еще есть 1 пробанд - эти доказательства все равно весят 1 балл.
🔎 А теперь следите за руками, достаем двойные листочки:
🔘 у вашего пробанда вариант в транс- положении с патом (1 балл)
🔘 1 опубликованный случай в транс- положении с патом (1 балл)
🔘 1 опубликованный случай в гомозиготе (0,5 баллов)
🔘 2 опубликованных случая в транс- положении с VUS вариантом (0,25 + 0,25 баллов)
Итого: всего 3 балла → PM3_Strong. А пробандов аж 5!
Все это значит, что жонглирование баллами позволяет подвинуть силу критерия как сторону поддерживающего, так и в сторону очень сильного (что в каком-то смысле тоже повод для манипуляций).
Предвосхищая вопрос "Но наш неописанный вариант действительно LP, нам что, нельзя использовать критерии?!", ответим - можно, но следует это делать так, чтобымаме админам не было стыдно.
Думайте. Подписаться.
Скука интерпретатора
Давайте продолжим тему недопонятых критериев и натянутой патогенности.
Один из самых любимых - PM3:
вариант находится в транс-положении с другим патогенным/вероятно патогенным вариантом в том же гене при рецессивном заболевании
Он не раз «поднимал с колен» слабенькие VUS-ы. За это стоит поблагодарить классический гайд ACMG 2015, чьи местами размытые формулировки позволяли вольно его трактовать.
Если использовать рекомендации из классического ACMG:
...и вот уже перед нами почти сияющий LP. Браво!
Не слишком ли лихо? Вот и уважаемая группа ClinGen (SVI 2019) пришла к выводу, что слишком жирно за транс положение с патом давать такой вес критерию, и переосмыслила PM3. И опять заставила нас считать баллы!
Как работает PM3 по новым правилам:
Исследуемый должен быть больным (и больным искомым/найденным заболеванием, мы не ищем случайные находки, особенно пары LP/VUS или VUS /VUS).
Оба варианта должны быть достаточно редкими (PM2). Даже если вы подтвердили транс- в трио, но исследуемый вариант слишком частый в популяции - он отправляется в корзину.
Теперь PM3 - это балльная система. Баллы зависят от:
Примеры:
Что это значит? Если в литературе описано 123 пробанда с вариантом в гомозиготе и у вас еще есть 1 пробанд - эти доказательства все равно весят 1 балл.
Итого: всего 3 балла → PM3_Strong. А пробандов аж 5!
Все это значит, что жонглирование баллами позволяет подвинуть силу критерия как сторону поддерживающего, так и в сторону очень сильного (что в каком-то смысле тоже повод для манипуляций).
Предвосхищая вопрос "Но наш неописанный вариант действительно LP, нам что, нельзя использовать критерии?!", ответим - можно, но следует это делать так, чтобы
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
Про время
(прим. админа: здесь и далее полусубъективное восприятие через призму опыта, некоторых статей и ИИ-генерации ответов)
Существует такой термин как "turnaround time" (TAT), он же "срок выполнения работы", что в применительно к NGS означает время от забора крови до получения заключения врачом.
TAT - краеугольный камень клинической медицины (и не только генетики), т.к. влияет на менеджмент пациентов и увеличивает экономическую эффективность (количество статей про rapid trio wgs in NICU хорошо это подчеркивает).
Тем не менее, автоматизация лабораторных процессов, ускорение работы пайплайна, а также самый модный AI-based софт с приоритизацией вариантов незначительно влияют скорость работы клинического интерпретатора. Интерпретация так и остается узким местом всего процесса (до тех пор, пока не изобретут ИИ-агента, бьющего скучающего интерпретатора по шапке 😎 ). Формально скорость интерпретации не регламентирована (нет специальности - нет мультиков 😀 ).
А теперь к сути: сколько времени действительно нужно (или можно) тратить на один образец?
Разберём несколько факторов:
🟡 Моно или трио
Трио ускоряет работу - можно сразу откинуть рецессивные варианты в цис-, не de novo варианты и другой "мусор", в моно этой роскоши нет.
🟡 Работа "по СОПам" или "по опыту/чутью/интуиции"
СОПы упрощают работу, а значит и ускоряют (хотя длинные гайды проще жизнь не делают). С другой стороны, опытный интерпретатор часто понимает куда нужно посмотреть в первую очередь, закрывая кейс за 5 минут (но бывают разные исключения, досматривайте образцы до конца).
🟡 Полный геном или полный экзом
Больше информации - больше возни, все очевидно. Описание сложной перестройки из трёх хромосом по HGVSg занимает весь день, всю ночь и ещё немного.
🟡 "Очевидный" фенотип или "мертвый"?
Рабдомиомы, туберы и пятна на коже? Да, идём искать варианты в TSC1/2. Не нашли? Проверяем факоматозы. Не нашли? Лучше досмотреть и закончить. "Но как же так, тут же очевидно генетика, я найду!!!" - говорит берущее верх честолюбие, кровь приливает к глазам, а образец на недели зависает (вместе с Excel🤡 ), увеличивая ТАТ до n-лет.
🟡 Рутинный анализ или "что-то новое"
Биоинформатик подкрутил новый модный тул по поиску CNV, поэтому теперь лаборатория смотрит ещё одну таблицу с непонятными аутпутами. А может "мы теперь ищем LOH и мобильные элементы!"?
🟡 Первичный или повторный анализ данных
Зачастую повторный анализ проводят, когда на первичном ничего не найдено, найдено не то, или появились новые важные данные. По определению повторный анализ занимает больше времени.
И как же при этом хочется почувствовать превосходство, потешить самолюбие, поднять свое ЧСВ и найти тот самый ВАУС при переанализе данных за другой лабораторией. Пусть он будет неказистый, пусть он не подходил во время первичного анализа, т.к. сейчас появилась новая клиника. Победителей не судят.
🟡 Excel-таблица или софт
Ничего не попишешь, софт с приоритизацией ускоряет работуи когда-нибудь нас заменит. А Excel зависает. Всегда зависает.
🟡 Наличие или отсутствие KPI
Кабан Кабаныч объявил, что 100 образцов в неделю неприемлемо и с Нового года мы делаем 150. Это вынуждает идти или к тайм-менеджменту, или к увольнению. Героизм хорош в меру.
🟡 Сдельная оплата или фиксированный оклад
Нужно больше денег? Делаем больше кейсов. Зарплата не меняется от кейсов - спокойно ковыряем десятый ВАУС.
🟡 Человеческий фактор
Два разных интерпретатора смотрят один и тот же кейс с разной скоростью. И это не всегда только про насмотренность, а про стиль кунг-фу, бэкграунд образования и личный порог тревожности.
Не забываем про всадников апокалипсиса, которые влияют на скорость интерпретации особенно критично:
⭐️ усталость
⭐️ выгорание
⭐️ созвоны и разговоры о важном
⭐️ постоянное переключение между задачами
Так сколько тратить времени? Мы не знаем, посчитайте баллы по пунктам и возвращайтесь в комментарии🤓
Думайте. Подписаться.
Скука интерпретатора
(прим. админа: здесь и далее полусубъективное восприятие через призму опыта, некоторых статей и ИИ-генерации ответов)
Существует такой термин как "turnaround time" (TAT), он же "срок выполнения работы", что в применительно к NGS означает время от забора крови до получения заключения врачом.
TAT - краеугольный камень клинической медицины (и не только генетики), т.к. влияет на менеджмент пациентов и увеличивает экономическую эффективность (количество статей про rapid trio wgs in NICU хорошо это подчеркивает).
Тем не менее, автоматизация лабораторных процессов, ускорение работы пайплайна, а также самый модный AI-based софт с приоритизацией вариантов незначительно влияют скорость работы клинического интерпретатора. Интерпретация так и остается узким местом всего процесса (
А теперь к сути: сколько времени действительно нужно (или можно) тратить на один образец?
Разберём несколько факторов:
Трио ускоряет работу - можно сразу откинуть рецессивные варианты в цис-, не de novo варианты и другой "мусор", в моно этой роскоши нет.
СОПы упрощают работу, а значит и ускоряют (хотя длинные гайды проще жизнь не делают). С другой стороны, опытный интерпретатор часто понимает куда нужно посмотреть в первую очередь, закрывая кейс за 5 минут (но бывают разные исключения, досматривайте образцы до конца).
Больше информации - больше возни, все очевидно. Описание сложной перестройки из трёх хромосом по HGVSg занимает весь день, всю ночь и ещё немного.
Рабдомиомы, туберы и пятна на коже? Да, идём искать варианты в TSC1/2. Не нашли? Проверяем факоматозы. Не нашли? Лучше досмотреть и закончить. "Но как же так, тут же очевидно генетика, я найду!!!" - говорит берущее верх честолюбие, кровь приливает к глазам, а образец на недели зависает (вместе с Excel
Биоинформатик подкрутил новый модный тул по поиску CNV, поэтому теперь лаборатория смотрит ещё одну таблицу с непонятными аутпутами. А может "мы теперь ищем LOH и мобильные элементы!"?
Зачастую повторный анализ проводят, когда на первичном ничего не найдено, найдено не то, или появились новые важные данные. По определению повторный анализ занимает больше времени.
И как же при этом хочется почувствовать превосходство, потешить самолюбие, поднять свое ЧСВ и найти тот самый ВАУС при переанализе данных за другой лабораторией. Пусть он будет неказистый, пусть он не подходил во время первичного анализа, т.к. сейчас появилась новая клиника. Победителей не судят.
Ничего не попишешь, софт с приоритизацией ускоряет работу
Кабан Кабаныч объявил, что 100 образцов в неделю неприемлемо и с Нового года мы делаем 150. Это вынуждает идти или к тайм-менеджменту, или к увольнению. Героизм хорош в меру.
Нужно больше денег? Делаем больше кейсов. Зарплата не меняется от кейсов - спокойно ковыряем десятый ВАУС.
Два разных интерпретатора смотрят один и тот же кейс с разной скоростью. И это не всегда только про насмотренность, а про стиль кунг-фу, бэкграунд образования и личный порог тревожности.
Не забываем про всадников апокалипсиса, которые влияют на скорость интерпретации особенно критично:
Так сколько тратить времени? Мы не знаем, посчитайте баллы по пунктам и возвращайтесь в комментарии
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
Некодирующие варианты
Если про интроны говорят много, то остальные некодирующие области окружены «туманом войны», и варианты в них чаще предпочитают вообще не смотреть и не выносить. Промоторы, энхансеры, 5’UTR, 3’UTR теоретически могут натворить делов. Но что с ними делать и как искать?
Строгих и универсальных правил для этих областей нет. Даже при наличии биологической гипотезы доказать причинный механизм часто сложно, поэтому «дотянуть» вариант до диагностической категории бывает практически невозможно.
Рабочая группа SVI при ClinGen опубликовала рекомендации по интерпретации некодирующих вариантов, но они задают скорее рамки оценки, чем дают простой алгоритм.
Поэтому первый вопрос, который мы должны задать себе:
Какие некодирующие области имеет смысл рассматривать?
Согласно рекомендациям, в клинической практике целесообразно ограничиваться участками, для которых существует экспериментальная или функциональная валидность:
🔘 Интроны и UTR, относящиеся к хорошо валидированным транскриптам.
🔘 Промоторные области, определённые как участки открытого хроматина вокруг канонического TSS (сайта начала транскрипции).
🔘 Другие цис-регуляторные элементы - при условии, что существует экспериментальное подтверждение их связи с конкретным геном. Сложно😢 !
Межгенные варианты без доказанной связи с геном-мишенью в рутинной диагностике обычно не рассматриваются, это уже «рокет саенс» и не для интерпретатора в вакууме лаборатории.
Чтобы вообще вынести некодирующий вариант в заключение (особенно НЕ интронные варианты), он должен пройти предварительную фильтрацию с учётом огромного количества некодирующих изменений в геноме (98% не кодирует белки).
Базовые критерии для выбора варианта:
1. Ген морбидный и установлена связь ген-фенотип (как-нибудь разберем что такое GDV😎 ).
2. Вариант редкий (PM2).
Пока всё как с обычными VUS - ничего нового.
Едем дальше: когда вариант начинает становиться действительно привлекательным для вынесения?
Критерии, которые используются в рекомендациях:
🔘 PP3: предикторы in silico. Применимость и доказательность инструментов ограничена, особенно вне сплайсинга. Тут самые разнообразные наборы программ, все зависит от того, какую биологическую гипотезу мы используем. Подробнее есть в таблице в рекомендациях. Спойлер: сплайсинг можно подозревать не только в интронах. Важно: сила доказательства PP3 обычно не превышает supporting.
🔘 PP4: фенотип пациента высокоспецифичен и хорошо коррелирует с геном. Наш любимый!
🔘 PM3: вариант обнаружен в транс с pat/lpat (для AR). Используем осторожно для интронов в больших генах - вероятность случайных редких вариантов крайне высокая.
🔘 PS2/PM6: de novo рекомендации разрешают, однако важно помнить:
у каждого человека возникает в среднем ~50–80 de novo SNV за поколение.
🔘 PM1: Можно применять только при наличии доказанного функционально значимого регуляторного домена, в котором наблюдается кластер патогенных вариантов. Для большинства регуляторных областей это условие не выполняется.
🔘 PP1: Сегрегационные данные применимы и могут быть значимы, но редко доступны в достаточном объёме.
Функциональные исследования
И только пройдя весь этот отбор вариант может уйти на функциональное исследование, которое способно «качнуть» некодирующий вариант из VUS в Lben/Ben или Lpat/Pat.
Но давайте будем честны:
🔘 функциональный анализ доступен не во всех лабораториях,
🔘 он требует времени,
🔘 это дорогое удовольствие,
🔘 не всегда воспроизводим.
Поэтому в реальной практике вариант просто останется в статусе VUS. Именно поэтому мы рекомендуем достаточно строгий отбор кандидатов, чтобы они имели шансы на дальнейшее продвижение покарьерной лестнице (или понижение).
И, пожалуй, это главный принцип работы с некодирующими вариантами: тут очень важны высокая планка доказательности и биологическая гипотеза, которую надо отразить в заключении.
Думайте. Подписаться.
Скука интерпретатора
Если про интроны говорят много, то остальные некодирующие области окружены «туманом войны», и варианты в них чаще предпочитают вообще не смотреть и не выносить. Промоторы, энхансеры, 5’UTR, 3’UTR теоретически могут натворить делов. Но что с ними делать и как искать?
Строгих и универсальных правил для этих областей нет. Даже при наличии биологической гипотезы доказать причинный механизм часто сложно, поэтому «дотянуть» вариант до диагностической категории бывает практически невозможно.
Рабочая группа SVI при ClinGen опубликовала рекомендации по интерпретации некодирующих вариантов, но они задают скорее рамки оценки, чем дают простой алгоритм.
Поэтому первый вопрос, который мы должны задать себе:
Есть ли достаточные основания подозревать именно этот вариант в данном клиническом контексте?
Какие некодирующие области имеет смысл рассматривать?
Согласно рекомендациям, в клинической практике целесообразно ограничиваться участками, для которых существует экспериментальная или функциональная валидность:
Межгенные варианты без доказанной связи с геном-мишенью в рутинной диагностике обычно не рассматриваются, это уже «рокет саенс» и не для интерпретатора в вакууме лаборатории.
Чтобы вообще вынести некодирующий вариант в заключение (особенно НЕ интронные варианты), он должен пройти предварительную фильтрацию с учётом огромного количества некодирующих изменений в геноме (98% не кодирует белки).
Базовые критерии для выбора варианта:
1. Ген морбидный и установлена связь ген-фенотип (как-нибудь разберем что такое GDV
2. Вариант редкий (PM2).
Пока всё как с обычными VUS - ничего нового.
Едем дальше: когда вариант начинает становиться действительно привлекательным для вынесения?
Критерии, которые используются в рекомендациях:
у каждого человека возникает в среднем ~50–80 de novo SNV за поколение.
Функциональные исследования
И только пройдя весь этот отбор вариант может уйти на функциональное исследование, которое способно «качнуть» некодирующий вариант из VUS в Lben/Ben или Lpat/Pat.
Но давайте будем честны:
Поэтому в реальной практике вариант просто останется в статусе VUS. Именно поэтому мы рекомендуем достаточно строгий отбор кандидатов, чтобы они имели шансы на дальнейшее продвижение по
И, пожалуй, это главный принцип работы с некодирующими вариантами: тут очень важны высокая планка доказательности и биологическая гипотеза, которую надо отразить в заключении.
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
Ответы ч.1: Как искать домены?
Мы обещали разобрать вопросы, которые вы нам оставили в посте про розыгрыш лучшей футболки на земле.
Среди них был один очень практический:
"Как быстро найти домен белка?"
А правда - как? Попробуем ответить в контексте работы интерпретатора. Белковую биоинформатику и прочую черную магию пока оставим тем, кто действительно в этом шарит. Мы же посмотрим на быстрые и практичные способы.
🔵 Геномные браузеры
Franklin и VarSome по умолчанию отображают домены белков в "Region viewer/Region browser" в виде отдельного трека.
GeneBe также отображает структуру белка в своем "Genome browser", а MobiDetails прописывает "Position/Domain".
Просто закиньте свой вариант и наслаждайтесь.
UCSC даёт возможность включить нужный трек (и ещё тысячу других, он очень гибкий) - трек Uniprot - и посмотреть на домен, если он есть.
Это самые быстрые и простые способы, но они немного поверхностные: домены там уже преданнотированы, и не всегда понятно , из какой базы они взяты (InterPro? Uniprot? А как давно обновляли?).
🔵 Белковые базы данных
Более надёжный путь - смотреть первоисточники. Это путь воина!
По названию гена ищется нужный человеческий белок🐿 . Обычно поиск начинается с Uniprot - находим нужный белок и просматриваем вкладку "Domain". Если нам не нравится, копируем Uniprot ID и ищем дальше - InterPro, AlphaFold и другие.
Длинный и неинтуитивный путь, требует смирения и привыкания к незнакомым интерфейсам и вкладками, но может оказаться более информативным.
Важно: иногда оказывается, что границы домена в разных базах не совпадают - это нормально. Разные базы используют разные модели поиска доменов, разные наборы последовательностей для обучения и разные критерии выравнивания, поэтому координаты могут немного "плавать".
В практике интерпретации обычно ориентируются на консенсус нескольких баз. Если несколько источников указывают на один и тот же функциональный регион, ему, как правило, можно доверять.
🔵 Поиск литературы
Этот способ в опасной близости кГаргантюа с интерпретацией. Долгий, мутный и противоречивый, но иногда единственный.
🔵 VEP
Позволяет онлайн проаннотировать любой вариант (в веб-версии). Если включить всю "Protein annotation" можно получить необходимый результат.
Редкий покемон. Для изысканных пользователей.
Зачем нам знать домены в лицо? Чтобы применить критерий PM1 (который не очень понятно как применять, спасибо, ACMG😀 ), но о нем поговорим в следующий раз.
Думайте. Подписаться.
Скука интерпретатора
Мы обещали разобрать вопросы, которые вы нам оставили в посте про розыгрыш лучшей футболки на земле.
Среди них был один очень практический:
"Как быстро найти домен белка?"
А правда - как? Попробуем ответить в контексте работы интерпретатора. Белковую биоинформатику и прочую черную магию пока оставим тем, кто действительно в этом шарит. Мы же посмотрим на быстрые и практичные способы.
Franklin и VarSome по умолчанию отображают домены белков в "Region viewer/Region browser" в виде отдельного трека.
GeneBe также отображает структуру белка в своем "Genome browser", а MobiDetails прописывает "Position/Domain".
Просто закиньте свой вариант и наслаждайтесь.
UCSC даёт возможность включить нужный трек (и ещё тысячу других, он очень гибкий) - трек Uniprot - и посмотреть на домен, если он есть.
Это самые быстрые и простые способы, но они немного поверхностные: домены там уже преданнотированы, и не всегда понятно , из какой базы они взяты (InterPro? Uniprot? А как давно обновляли?).
Более надёжный путь - смотреть первоисточники. Это путь воина!
По названию гена ищется нужный человеческий белок
Длинный и неинтуитивный путь, требует смирения и привыкания к незнакомым интерфейсам и вкладками, но может оказаться более информативным.
Важно: иногда оказывается, что границы домена в разных базах не совпадают - это нормально. Разные базы используют разные модели поиска доменов, разные наборы последовательностей для обучения и разные критерии выравнивания, поэтому координаты могут немного "плавать".
В практике интерпретации обычно ориентируются на консенсус нескольких баз. Если несколько источников указывают на один и тот же функциональный регион, ему, как правило, можно доверять.
Этот способ в опасной близости к
Позволяет онлайн проаннотировать любой вариант (в веб-версии). Если включить всю "Protein annotation" можно получить необходимый результат.
Редкий покемон. Для изысканных пользователей.
Зачем нам знать домены в лицо? Чтобы применить критерий PM1 (который не очень понятно как применять, спасибо, ACMG
Думайте. Подписаться.
Скука интерпретатора
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня очень важный день!
Мы (подписчики и второй админ) поздравляем Дашу с днём рождения!🥳 🥳
Без Даши не было бы и паблика, и самых вумных постов, и самых смешных мемов этого канала😎 .
Скидывайте свои лучшие (и смешные) открытки-поздравления из Whatsapp в комментарии😀
И подписывайтесь, это лучший подарок🤩
Мы (подписчики и второй админ) поздравляем Дашу с днём рождения!
Без Даши не было бы и паблика, и самых вумных постов, и самых смешных мемов этого канала
Скидывайте свои лучшие (и смешные) открытки-поздравления из Whatsapp в комментарии
И подписывайтесь, это лучший подарок
Please open Telegram to view this post
VIEW IN TELEGRAM