Lab Mouse
2.15K subscribers
775 photos
251 videos
6 files
365 links
Генетика 🧬 Биоинформатика 💻 Data Science
Лекции: https://gitazone.org/
Инста: https://www.instagram.com/lab.mouse
TikTok: https://www.tiktok.com/@labmousetalks
YouTube: https://www.youtube.com/@GitaZone
Download Telegram
2️⃣ Канал Еки в телеграм:
Материалы к посту о том, как ультрафиолет повреждает клетки

Этот пост – итог эфира и проекта «Наука против Солнца», который мы провели вместе с Аней из lab.mouse и Асей, которая ведет замечательный инстаграм и телеграм-канал о косметической химии.

Мой пост о том, как ДНК повреждается ультрафиолетом. Я уже много писала на тему того, как клетка справляется с такими повреждениями, и что происходит, если все же справиться не удается. Об этом – в подборке постов гайда «Молекулярная онкология».
В этом посте подробней о прямом и непрямом повреждении ДНК.
Тут – о механизме образования реактивных форм кислорода и роли меланина.
Одна из статей, которую я упоминала в первой части эфира (которая, к сожалению, не сохранилась..) – статья, показавшая, что меланин может способствовать повреждению ДНК.

Кроме того, я разобрала одну из статей, которая якобы показывает, что использование санскрина приводит к раку кожи. Но это не единственный источник мифов. Я нашла целую книгу о том, какие якобы опасные солнцезащитные средства. На амазоне есть чуток текста, и я уже фэйспалмлю, но более полный обзор на нее можно найти тут.

У Ани пост о статистике рака кожи, и почему солнцезащитные средства реально работают.
У Аси – о том, какие бывают средства и как ими пользоваться.
1
1 сентября 2016 года я снова села за парту. Мне вот-вот должно было исполниться 29, а за плечами был долгий путь в профессию, которую в этот день я планировала оставить в прошлом.
За те прошедшие почти 10 лет я прошла путь от установщика программного обеспечения и специалиста техподдержки до старшего системного администратора и правой руки руководителей компаний, на которые работала. Это были не простые 10 лет. Годы, когда девушки в ИТ считались экзотикой, на собеседования в кабинет забегали все сотрудники компании, просто чтобы посмотреть на это «шоу», а многие компании звали на собеседование только из любопытства. За эти годы я обросла связями в профессиональной сфере, а отлаженная работа требовала все меньше и меньше затрат сил. Это была комфортная позиция.
Слишком комфортная.
👍2
В один день, 1 сентября 2016, из квалифицированного специалиста я стала «всего лишь» студентом. А спустя еще немного времени из «серверов начальника и юзверей командира» — младшим аналитиком без особых знаний, опыта работы по профессии, связей и в новом незнакомом городе.

Было ли мне страшно? Да.
Хорошо ли я понимала, что делаю? Скорее нет.
Решилась бы я снова, если бы машина времени доставила меня обратно в весну 2016-го, когда было принято это решение? Я не знаю.

Мне часто (действительно часто, а не просто блогерский оборот) приходят вопросы: смогу ли я, если мне уже 30? 40? Смогу ли я перейти из медицины? Лаборатории? Смогу ли заняться биоинформатикой, если я программист? Лингвист?
И вот он, честный ответ: Я НЕ ЗНАЮ.

Если бы эту страницу вел коуч, он ответил бы: Конечно да! Нужно только твердо решиться!
Но так это не работает.

Каждая ситуация уникальна. И даже при наличии самой сильной мотивации у человека может быть дома ребенок, которого просто реально не с кем оставить. Или долги, которые надо отдавать, и нельзя позволить себе потерять в заработке хотя бы на время. Не корите себя, если сейчас желаемое невозможно. Так действительно бывает.
Я не знаю, есть ли свет в конце вашего тоннеля. И лишь могу мысленно обнять вас и пожелать, чтобы он там появился.
Поддержка хоть кого-то из близких тоже важна и не стоит ее недооценивать. А вот бэкграунд знаний нарастить можно точно, так что во всем списке необходимого — это то единственное, что действительно не проблема.

Так вот. Сегодня, 1 сентября 2021 года я могу точно сказать: со мной все это было не зря. Отправляясь в то плавание, я не знала, что меня прибьет к берегам биоинформатики и биомедицинской аналитики, и не могла представить, что найду в этом свое самое любимое дело.
🔥3
1 сентября многие традиционно дают себе обещание начать учить что-то новое. Поэтому:
Если вы ждали знака, то считайте, что этот пост — он.
Если искали поддержки, то я здесь, чтобы дать ее.
Если ждали идеального времени, то скажу честно: его не существует.
А если ждали подсказки, с чего начать, то ниже я составила для вас полноценный learning path — три подборки БЕСПЛАТНЫХ материалов по погружению в Data Science, необходимую математику и доменную область — биологию и генетику. Каждая позиция в списке сопровождается моими комментариями о том, как, когда и кому следует это смотреть/читать.
Курсы по программированию и науке о данных. Выстроены в порядке возрастания сложности. Как learning path.

0. Малый ШАД - Что такое Big Data и почему это страшно интересно - Андрей Себрант
https://www.youtube.com/watch?app=desktop&v=TEHdfPa1eJA

Под чай с тортиком и чисто для вдохновения. Чтобы понять, зачем вам нужно все то, о чем будут курсы из списка ниже.

1. Python: основы и применение
https://stepik.org/course/512/

Это лучшее введение в программирование на питоне, в котором толково и глубоко объясняются важные базовые вещи.

Шаг в сторону: если при прохождении “Python: основы и применение” возникает слишком много сложностей, его можно отложить и начать с “Программирование на Python” https://stepik.org/course/67
Совет: не стоит обязательно “добивать” курс до конца. Лучше использовать его для тех моментов, которые вызвали сложности в курсе “Python: основы и применение”. То есть как бы проходить два курса параллельно, но с целью второй закончить полностью, а первый использовать как некий конспект или тренажер к нему.

2. Математика и Python для анализа данных
https://www.coursera.org/learn/mathematics-and-python
Первый курс из специализации. Сама специализация тоже очень хорошая и курсы стоящие. Важно! В нем же вы найдете теорию из дифуров и матана, которой будет достаточно для начала.

Совет: пройти первый курс и начать поиски позиции джуниора. Остальные курсы специализации (и любые другие) будет полезнее проходить уже в рамках подготовки к собеседованию или параллельно с первой работой. Но без практического опыта применения полученные на курсе знания быстро пропадут.

3. Открытый курс машинного обучения. От ODS
https://habr.com/ru/company/ods/blog/322626/

Можно проходить как курс, а можно использовать как справочник, который всегда должен быть под рукой. На странице можно найти ссылки на видео, дополнительные статьи и материалы, но главное, на хаб сообщества в слаке. Там есть каналы с вакансиями, каналы для поисков стажировок, помощи, обучения и просто общения.

4. Введение в Data Science и машинное обучение
https://stepik.org/course/4852/syllabus
Прекрасный, достаточно легкий, но емкий курс. Много обзорных тем. Внутри курса есть интервью с людьми из бизнеса, которые рассказывают о своем опыте работы в ДС.

5. Свободное погружение в СУБД
https://stepik.org/course/70710/promo
Курс про SQL и архитектуру баз данных. Основной стек дата-аналитика это питон + sql, так что без этого никуда.
Этот курс не совсем для новичков, кое-что нужно знать. Но, скажу честно, не нашла ни одного приличного, не нудного и реально практического курса по БД для полных новичков. Везде очень много воды и теории, которая без приложения ничего не дает.
Совет: какой бы у вас не был опыт, начните неспешно проходить этот курс. А если какая-то тема, термин или решение вызывает у вас вопрос, просто гуглите материалы конкретно по нему отдельно.
Пригодится может такая шпаргалка: https://proglib.io/p/sql-for-20-minutes

6. Hadoop. Система для обработки больших объемов данных
https://stepik.org/course/150/
Великолепный, подробный, фундаментальный и практический курс. Особо рекомендую внимательно читать комменты под каждым модулем. Там много интересного.
Совет: не проходите этот курс просто так. Система хадуп используется далеко не каждой компанией и не на каждом проекте. Вполне может быть так, что вы никогда не столкнетесь с нею в практике, но сейчас потратите на курс много времени. Советую обратиться к данному курсу только в случае, если вы целитесь на вакансию, где указан хадуп или он требуется в рамках вашего текущего или потенциального проекта. Для общего понимания будет эффективнее с точки зрения времени как ресурса просто прочесть пару популярных статей на том же хабре.

Математика

1. Основы статистики
https://stepik.org/course/76/
Бесконечно любимый и бесконечно рекомендуемый курс Анатолия Карпова от Института биоинформатики. Ничего лучше я не нашла за последние много лет. Просто, практично, понятно, с крайне прикладными примерами. Курс ориентирован на биологов и медиков, а не на математиков.
У курса вышли также продолжение (части 2 и 3),
но для их прохождения вам уже понадобится базовое знание языка R.

Поэтому сразу рекомендация курсов по R:
Раз “Основы программирования на R” https://stepik.org/course/497/info
И два “Анализ данных в R” https://stepik.org/course/129/info

2. Теория вероятностей для начинающих
https://www.coursera.org/learn/probability-theory-basics
Курс от великолепного Райгородского. Всем бы так преподавали тервер в ВУЗе и были бы мы страной из одних математиков.


В дополнение:
Список рекомендаций курсов, сделанный Институтом Биоинформатики. Кое в чем пересекается с моими личными рекомендациями.
https://vc.ru/education/33816-25-kursov-dlya-nachinayushchih-data-analitikov

Для работа с любым проектом в любой компании вам будет нужен Git. Советую привыкать к нему заранее. Курс: Основы Git https://stepik.org/course/3145

Готовьтесь забыть про винду, если не сделали этого ранее. Весь ДС (и биоинформатика тоже) — это линукс (ну и мак). Вам обязательно нужно знать базовые консольные штуки. Так что вот сразу курс (рассчитанный снова на людей не из ИТ!) Введение в Linux https://stepik.org/course/73


Все курсы подобраны только на русском языке и бесплатны! Исключение только курс Математика и Python для анализа данных, но его тоже можно пройти бесплатно по программе спонсорства от курсеры.


Доменная область:

Читать все также сверху вниз по порядку нарастания серьезности.

1️⃣ Что такое биоинформатика
https://www.youtube.com/watch?v=nsYS47jFF8o
Очень короткий, но очень классный рисованный «мультик» о том, что такое биоинформатика, от ФКН ВШЭ

2️⃣"Хватит медитировать — пора моделировать"
https://www.youtube.com/watch?v=WSLZBD04N5k
Под чай. Классная лекция о том, как делается моделирование и зачем это все нужно. Разработка лекарств и борьба с химическим оружием, понимание болезней и создание молекулярных машин.

3️⃣ Курс мини-лекций “Биоинформатика и геномика”
Набор небольших видео от человека, вдохновившего лично меня удариться в биоинформатику. Михаил Сергеевич Гельфанд рассказывает о том, какие задачи стоят перед современной биоинформатикой и как она пытается их решать.
https://www.youtube.com/playlist?list=PLaBchYyCSpflYQe_9Lx-RjPJpyrGgPdct
(Запасная ссылка на курс “Биоинформатика как дисциплина"
https://postnauka.ru/video/42436)

4️⃣ Курс мини-лекций “Войны бактерий”
https://postnauka.ru/courses/74882 также от МС Гельфанда

5️⃣ Курс мини-лекций “Работа генов”
https://postnauka.ru/courses/50079 9 лекций микробиолога Константина Северинова о функциях генов, современных исследованиях и геномной медицине

6️⃣ Курс с практическими заданиями “Генетика” от НГУ
https://www.lektorium.tv/genetics
Этот курс рекомендую от всей души. Заменит и напомнит всю школьную генетику, натаскает на задачки. Лектор великолепна, курс продуман и хорошо структурирован. Он же на курсере (бесплатный) https://www.coursera.org/learn/nsu-genetics

7️⃣Курс” Введение в молекулярную биологию и биомедицину" от МФТИ
https://stepik.org/course/549/syllabus
Курс очень простой и коротенький. Смотреть его почти не нужно, достаточно слушать. Вопросы после блоков корректные и несложные, но позволяют лучше закрепить и понять сказанное в видео. Уровень слушателя: вы можете совсем ничего не помнить о биологии со школы.

8️⃣Курс “ГМО: технологии создания и применение” от НГУ
https://www.coursera.org/learn/gmo
Моя АААбсолютная рекомендация. У этого курса промо-ролик как блокбастер, потому что сам курс -- блокбастер в мире курсов. Основы биологии со ставкой на биотехнологии.

9️⃣ Курс “Введение в биоинформатику (Introduction to Bioinformatics)”
https://www.coursera.org/learn/bioinformatika/
Здесь уже посложнее и налетать на него стоит со знанием основ биологии. Зато здесь работа с конкретным биоинформатическим софтом, базами и прикладными задачами. На момент, когда я проходила, они закрывали курс и была проблема с получением сертификатов. Как сейчас не знаю, но его стоит пройти и не для сертификата, а для себя.

🔟 Курс “Введение в биоинформатику: метагеномика“ от СПбГУ
https://stepik.org/course/2557/
Аналогичен курсу выше и от тех же авторов, но ориентирован на метаге
номные данные.
(Это он же на курсере https://www.coursera.org/learn/bioinformatics-metagenomics )


1️⃣1️⃣ Курс Введение в NGS. Часть 1
https://stepik.org/course/1142/
Очень конкретный, хороший практический курс по работе с NGS данными. В основном ориентирован на Illimina. Тут про все нужные инструменты

1️⃣2️⃣ Курс Секвенирование 3-го поколения на Oxford Nanopore
https://stepik.org/course/8092/
Аналогичен курсу выше, но ориентирован на напорные данные. Очень практический. Авторы те же.

Бонусное:

1️⃣ Курс Генетика и геномика популяций
https://stepik.org/course/9182/
Для тех, кто хочет прямо разобраться в теме. Внутри много математики и зубодробительной теории, но интересной.

2️⃣ Курс Молекулярная филогенетика
https://stepik.org/course/2054/
Тут реальная биоинформатика, с реальной математикой в ее основе и с реальными инструментами. Маст си для тех, кому надо решать задачи по изучению эволюции чего-либо.

3️⃣ Курс Биотехнологии: генная инженерия
https://stepik.org/course/94/
Полезно пройти, если ваши рабочие задачи связаны с подготовкой данных после секвенирования. Подробно и хорошо про подготовку библиотек, клонирование, рестрикция, ПЦР и все его виды
И напоследок хочу дать немного советов о том, как и где искать работу в сфере DS (и в биотехе).

1. Hh — не очень хороший вариант, хотя и там можно найти что-то интересное. И все же, ставку я бы предложила делать на Хабр Карьера (https://career.habr.com/, это бывший МойКруг) и linkedin. Обязательно заведите профиль на обоих сайтах и заполните его максимально релевантно тому, какую работу ищете. Добавляйте в свою сеть рекрутеров и сами принимайте предложения. Чем больше ваша сеть — тем больше вам будет доступно материалов и приходить предложений.
2. Вступайте в профессиональные сообщества. Там часто публикуют вакансии, нередко можно оставить свое резюме и просто заводить знакомства, которые могут перерасти в сотрудничество и даже найм. Главное сообщество датасатанистов — Open Data Science (ODS, @ods_ai в инстаграм). Как туда попасть и прочие пароли-явки включила в пост в телеграмме. Сообщество объединяет специалистов из тысяч(!) городов со всего мира. Организует конференции, митапы и просто неформальные завтраки. Посиделки участников есть почти во всех крупных городах.
3. Если вас интересует биология/генетика как доменная область — ваш главный ресурс https://blastim.ru/ (недавно и в инстаграм — @blastim.ru). Подпишитесь на рассылку вакансий и заполните там профиль. Рекомендации по составлению резюме и прочее полезное тоже найдете на сайте.
4. Все хотят опыт, но где его взять? Завести pet-project. Небольшой домашний проект, который можно будет показать потенциальному работодателю, чтобы он мог оценить, что вы человек, способный довести проект до чего-то осмысленного и вообще что-то понимаете в этом всем. Не всегда легко придумать себе задачу самостоятельно, поэтому, как вариант, можно участвовать в хакатонах, контестах и прочем. Начните поиск с платформы kaggle. Если с английским пока сложно, осваивайте русскоязычные платформы. Поиск в гугл выдаст вам целую кучу мероприятий по запросу «хакатон». Нередко в качестве приза на них можно получить и предложение о работе.
5. Не игнорируйте курсы от компаний. Часто они подразумевают найм по итогам их прохождения. Выбирайте крупную компанию, в которой хотели бы работать, и изучайте, нет ли таких курсов у них. (Кстати, у нас в @quantori_community они тоже есть)
6. Будьте за любой кипеж: посещайте конференции и профессиональные мероприятия и не стойте там у стенки! Завязывайте знакомства, расспрашивайте, рассказывайте о себе. Это именно то главное, зачем ИТ-сообщество их организует. А вовсе не чтобы лекции прочитать, поверьте. Конечная цель всего — хантинг (даже если эта цель маскируется под другие или не является единственной).
7. Напишите письмо в компанию, которая вам нравится, и приложите резюме. Даже если там нет сейчас открытой вакансии! Главное правило «за спрос не бьют в нос» 😉. И даже если прямо сейчас вам ничего не предложат, ваше резюме останется в базе компании и может быть поднято оттуда при необходимости.

С 1 сентября, друзья! Пусть этот новый год будет продуктивным (и не сведет никого с ума 😜).
Инструмент для онлайн мониторинга штаммов вируса гриппа по всему миру и за всю историю сбора данных. Там же можно посмотреть данные по эболе, денге и другим инфекциям.

https://nextstrain.org/flu/seasonal/h3n2/ha/2y
А у меня как раз новый пост, и не простой, а в коллаборации с любимой lab.mouse.

Материалы к посту о Синтии.
С нуля ли эта бактерия?

DOI: 10.1126/science.1151721 – как собрали первый геном генитальной микоплазмы
DOI: 10.1126/science.1190719 – как засунули геном M. mycoides в клетку M. capricolum
DOI: 10.1126/science.aad6253 – как собрали Синтию 3.0
Про расшифровку пасхалок в блоге Кена Шириффа – https://www.righto.com/2010/05/decoding-secret-dna-code-in-venters.html
И еще больше программирования – https://www.righto.com/2010/06/using-arc-to-decode-venters-secret-dna.html

Как найти гены, которые бактерии не нужны – https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1324956/

Как и зачем искусственно синтезировать ДНК?
https://www.nature.com/articles/nmeth.2918

Источники для части Мышки
[1] https://ru.wikipedia.org/wiki/Ермакова,_Ирина_Владимировна
[2] https://www.youtube.com/watch?v=_sAmiBkj4Oo&t=2s
[3] Ирина Ермакова и инопланетяне. Полная лекция https://www.youtube.com/watch?v=C19dBcAjP3c
[4] Ученые против мифов - 2 и Премия ВРАЛ. Итоги https://antropogenez.ru/forum-itogi2/
[5] Ирина Ермакова: Почетный Академик ВРАЛ https://www.youtube.com/watch?v=N1jhoCfCL3M
[6] Биполярная вирусология: оправданна ли паника вокруг вакцинации детей
В Сети набирает популярность петиция против школьных прививок от COVID, но что о её доводах говорит наука? (в названии сохранена авторская орфография) https://news.ru/society/virusologicheskij-likbez-stoit-li-boyatsya-vakcinacii-detej-ot-covid-19/
[7] Виновата бактерия «Синтия» — сенсационная версия появления коронавируса от ученого-биолога с мировым именем Ирины Ермаковой https://nashamoskovia.ru/news-16326.html
[8] Глобальные эпидемии: что нам грозит? https://otr-online.ru/programmy/segodnya-v-rossii/globalnye-epidemii-chto-nam-grozit-41387.html
[9] Deepwater Horizon и COVID-19: «Никакими патогенными свойствами бактерия «Синтия» не отличается» https://realnoevremya.ru/articles/172228-razoblachenie-teorii-zagovora-pro-koronavirus