Strong baseline

На прошлой неделе был на CytoData 2023.
Погода, конечно, не очень, в Сегеде в тот момент было +24 а в Хельсинки я приехал к мерзнущим чайкам в +4.

Проводить CytoData начали в 2016 и носило это скорее формат хакатона, в последующие годы сделали еще симпозиум и воркшопы и посвящено все это image-based profiling, ну
и смежным темам, например сегментированию клеток. Один год проводят в США, другой в Европе.

Первый день были воркшопы один проводила Recursion, второй ThinkCyte. Тут произошла заминка, почти все пошли на воркшоп Recursion, он был в основном зале, а ThinkCyte были в
какой-то другой аудитории и параллельно, мне так кажется что не все поняли что эти воркшопы были параллельно, а не последовательно. Я был на Recursion, рассказывали про анализ данных датасета JUMP (его очень маленькой части), еще рассказывали про "proximity bias" (нокауты генов из одного плеча хромосомы могут быть фенотипически похожи, даже если не должны) отсюда.
Потом была панель и доклад Berend Snijder про их последние работы и как анализ изображений помогает в раковой терапии.

Второй день — симпозиум, была пара докладов про multiplexed imaging, были доклады про софт и инфраструктуру, ну и конечно про профайлинг.
Я рассказывал про нашу статью с DINO. Мои коллеги из лабы привозили постеры, например про (мис)интерпретацию метрик в сегментировании. У меня тоже был постер про нашу статью принятую с NeurIPS 2023, первый автор к сожалению не смогла приехать, но она рассказывала про мою статью в США на другой конференции (SBI2), так и покрываем все локации.

Третий и четвертый день — хакатон, данные, конечно изображения: 6 каналов DAPI и маркеры cancer-associated фибробластов.
Задачи такие:
- Exploratory data analysis
- Предсказать Fuhrman grading
- Как локация влияет на предсказание и исследовать структуру ткани

Во второй задаче затащили ребята, которые зарядили AutoML (но я, к сожалению, не помню на каких фичах).
Мы в этой задаче взяли просто фичи ImageNet (каждый кусок изображения отдельно, потом агрегировали), потом смотрели какие каналы дают больше информации и сделали Random Forest, этого было достаточно для второго места.
Но мы выиграли в третьей задаче, так что ок.

Кормили вкусно, это важно.
В Венгрии большая проблема с рыбой, с морепродуктами еще хуже, тут хоть дали рыбы поесть.

Программа - можно просто посмотреть авторов и нагуглить что они делают.
Еще есть GitHub-страница со статьями и ресурсами, обновляется не очень часто, но вдруг кому интересно.

bioRxiv

High-resolution genome-wide mapping of chromosome-arm-scale truncations induced by CRISPR-Cas9 editing

CRISPR-Cas9 editing is a scalable technology for mapping of biological pathways, but it has been reported to cause a variety of undesired large-scale structural changes to the genome. We performed an arrayed CRISPR-Cas9 scan of the genome in primary human…

⚡5

305 viewsedited 22:02