Data-Diving // Pro Data
2.25K subscribers
208 photos
12 videos
284 links
Канал для начинающих дата-аналитиков.

Академия аналитики данных: https://data-diving.ru/
Download Telegram
ИИ-лаборатория ТГУ и AIRI приглашает томских студентов на стажировку

Лаборатория ИИ в химии и молекулярной инженерии Института анализа больших данных и искусственного интеллекта ТГУ и Института AIRI объявила набор на стажировку для студентов любых вузов Томска.

Это вторая стажировка в новой лаборатории под руководством сильнейших экспертов из Томска и Москвы. Тема весеннего семестра — ИИ-технологии для химии и химической инженерии ☝️ Лучшие стажеры могут получить предложение о работе в лаборатории!

Что получат стажеры:
🔹 Участие в разработке новых технологий для органической химии, материаловедения, хемоинформатики и глубокого обучения нейронных сетей
🔹 Обучение у специалистов в области ИИ в химии, имеющих опыт коммерческого R&D в течение 10+ лет и статьи в ведущих журналах и конференциях (Q1 и A*)
🔹 Опыт работы с технологиями обработки текстов на естественных языках на основе больших языковых моделей и навыки использования российских LLM-технологий Maestro, GigaChain, Wikontic, GigaEvo для научных задач
🔹 Возможность реализовать свой собственный проект
🔹 Сертификат о прохождении стажировки

Попасть на стажировку можно на конкурсной основе. Резюме и мотивационные письма принимаются до 16 февраля. Отбор строгий — в прошлом году на первую стажировку претендовали 3 человека на место. Результаты отбора станут известны 2 марта. Стажировка пройдет с 13 марта по 30 мая.

Что нужно для участия в стажировке:
🔹 Умение программировать на Python (или возможность быстро освоить этот язык)
🔹 Широкая эрудиция или профильное образования в сфере химии и материаловедения
🔹 Умение пользоваться ИИ-ассистентами на базовом уровне
🔹 Жить в Томске или Томской области
🔹 Иметь возможность уделять проекту не менее 10-15 часов в неделю


Разделы резюме:
🔹 Контактная информация: ФИО, телефон, email, город
🔹 Мотивация: краткое описание ваших ожиданий и мотивации
🔹 Образование: основное и дополнительное, связанное с химией / ИИ
🔹Профессиональный опыт: практики, стажировки, проекты
🔹 Ключевые навыки: технические и soft skills
🔹 Химический бэкграунд: знания в области химии / материаловедения, владение физико-химическими методами анализа
🔹 Технические навыки: владение Python, R или другими языками программирования
🔹 Аналитические компетенции: опыт работы с данными, статистический анализ
🔹 Проекты: описание релевантного исследовательского опыта (если есть)
🔹 Публикации: список научных работ (при наличии)


✍️ Форма для регистрации: https://clck.ru/3Ramk3
Наш традиционный подарок влюблённым в большие данные!

В честь Дня всех влюблённых и международной Недели любви к данным (Love Data Week)
команда Консорциума Big Data собрала список из открытых наборов больших данных, которые могут быть полезны исследователям из университетов. Делитесь этим каталогом с коллегами и студентами!

А в конце этого сообщения — ссылки на лекции о больших данных! Учитесь бесплатно у наших экспертов!

КАТАЛОГ ОТКРЫТЫХ ДАННЫХ

❤️ ДАННЫЕ ИЗ СОЦСЕТИ — более 2 миллионов постов и 3 миллионов комментариев

Наборы данных состоят из контента, опубликованного в группах российских университетов в социальной сети "ВКонтакте". Датасеты содержат публикации и комментарии университетских пабликов с июня 2023 года по июнь 2024 года.

https://data.mendeley.com/datasets/kf3s4xf33j/1 (2023-2024 гг)

❤️ ДАННЫЕ С ПЛАТФОРМЫ "РОСНАВЫК"

Наборы данных содержат информацию о вакансиях с популярных сайтов по поиску работы в России. Датасеты включают следующие источники: hh.ru, trudvsem.ru, superjob.ru, rabota.ru.

• Данные о вакансиях в сфере туризма https://data.mendeley.com/datasets/wbt7gy6dsp/1
• Данные о вакансиях в сельском хозяйстве https://data.mendeley.com/datasets/5y2m93mp5n/1
• Данные о вакансиях в сфере искусственного интеллекта https://data.mendeley.com/datasets/wyjh8c4ywr/1
• Данные о вакансиях в российских операционных системах https://data.mendeley.com/datasets/2xyz5rwhcn/1
• Данные о вакансиях в строительстве https://data.mendeley.com/datasets/7p9mxrkjx8/1
• Данные о вакансиях в сфере электронных вычислений, оптики, приборостроения, радиоэлектроники и автоматизации https://data.mendeley.com/datasets/zcyg9tfrv8/1
• Данные о вакансиях в ювелирном бизнесе https://data.mendeley.com/datasets/nxk54gwfjx/1

Где будет полезно?
Аналитика рынка труда, аналитика больших данных, социология образования, аналитика общественного мнения, обработка естественного языка, анализ социальных сетей, анализ образования.


❤️ БЕСПЛАТНЫЕ ЛЕКЦИИ О ДАННЫХ
• Лекторий академии Data Diving https://data-diving.ru/lec
• Дизайн аналитического исследования https://stepik.org/course/174831/promo?b24form_user=2.351-1739252275-ea01eb429fd7c43cf1f118630c4d2e4ae2170ace17106c981c48b8763ede0a34
• Видео-кейс: как найти мнения студентов и не потонуть в спаме https://rutube.ru/video/8002312904d26b06c93cb538c7f50a82/
• Текстовый анализ, визуализация и экспорт больших данных https://yandex.ru/video/preview/10188062422609537402
• Совместный курс лекций компании "Мегапьютер" и Президентской академии "Основы анализа данных и машинного обучения" https://www.megaputer.ru/obuchenie/lekcii/

📱 Университетский консорциум исследователей больших данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍32
Подай заявку до 25 февраля на бесплатную стажировку в ИИ-лабораторию ТГУ и AIRI!

Лаборатория искусственного интеллекта в химии и молекулярной инженерии Института анализа больших данных и искусственного интеллекта ТГУ и Института AIRI набирает студентов любых вузов Томска на стажировку "ИИ-технологии для химии и химической инженерии".

☝️ Лучшие стажеры могут претендовать на трудоустройство в лаборатории!

Что получат стажеры:
🔹 Участие в разработке новых технологий для органической химии, материаловедения, хемоинформатики и глубокого обучения нейронных сетей
🔹 Обучение у специалистов в области ИИ в химии, имеющих опыт коммерческого R&D в течение 10+ лет и статьи в ведущих журналах и конференциях (Q1 и A*)
🔹 Опыт работы с технологиями обработки текстов на естественных языках на основе больших языковых моделей и навыки использования российских LLM-технологий Maestro, GigaChain, Wikontic, GigaEvo для научных задач
🔹 Возможность реализовать свой собственный проект
🔹 Сертификат о прохождении стажировки

Попасть на стажировку можно на конкурсной основе. Резюме и мотивационные письма принимаются до 25 февраля. Стажировка пройдет с 13 марта по 30 мая.

Что нужно для участия в стажировке:
🔹 Умение программировать на Python (или возможность быстро освоить этот язык)
🔹 Широкая эрудиция или профильное образования в сфере химии и материаловедения
🔹 Умение пользоваться ИИ-ассистентами на базовом уровне
🔹 Жить в Томске или Томской области
🔹 Иметь возможность уделять проекту не менее 10-15 часов в неделю


Разделы резюме:
🔹 Контактная информация: ФИО, телефон, email, город
🔹 Мотивация: краткое описание ваших ожиданий и мотивации
🔹 Образование: основное и дополнительное, связанное с химией / ИИ
🔹Профессиональный опыт: практики, стажировки, проекты
🔹 Ключевые навыки: технические и soft skills
🔹 Химический бэкграунд: знания в области химии / материаловедения, владение физико-химическими методами анализа
🔹 Технические навыки: владение Python, R или другими языками программирования
🔹 Аналитические компетенции: опыт работы с данными, статистический анализ
🔹 Проекты: описание релевантного исследовательского опыта (если есть)
🔹 Публикации: список научных работ (при наличии)


✍️ Форма для регистрации: https://clck.ru/3Ramk3
Начался прием заявок на главную университетскую премию в области ИИ и Big Data «Гравитация»

В этом году она пройдет в четвертый раз. Заявки принимаются до 30 марта включительно на сайте.

Организаторы премии — Президентская академия, Томский государственный университет и ассоциация «Университетский консорциум исследователей больших данных». В прошлом году на премию было подано более 200 заявок от вузов, бизнеса, научных организаций, госучреждений и школ, ИТ-команд.

Заявки на участие принимаются по четырем тематическим направлениям:
🔹«Данные»
🔹«Алгоритмы»
🔹«Практика»
🔹«Потенциал».
Эксперты определят победителей и отметят перспективные проекты. Церемония награждения состоится в мае 2026 года.

Экспертами премии выступают представители Института системного программирования РАН, Федерального исследовательского центра «Информатика и управление» РАН, МГТУ им. Н.Э. Баумана, Сколтеха, Сбера и др.

📱 Университетский консорциум исследователей больших данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
МГПУ приглашает студентов бакалавриата и специалитета ВУЗов к участию в конкурсе «Московский студенческий DATA-Хакатон».

Целью Хакатона является повышение уровня владения инструментами работы с данными и формирование навыков подготовки аналитических отчетов по итогам выполненных исследований.

Участникам предлагаются реальные задачи и датасеты от партнеров Хакатона – ведущих ИТ-компаний России.

Хакатон пройдет в очном формате 17-18 апреля 2026 г. по адресу: г. Москва, 2-й Сельскохозяйственный пр-д, д. 4.

Победители и призеры Хакатона получат возможность прохождения стажировок в компаниях партнеров Конкурса.

Регистрация и более подробная информация на официальном сайте Хакатона.

Контактное лицо – Пустовойтенко Марина Владимировна, заместитель директора ИЦО МГПУ, тел.: +7 (916) 683-18-92, e-mail: [email protected]
#НовостиВузов #ИвГУ

Сети в науке: как разобраться в хитросплетениях соавторства


Приглашаем исследователей, аналитиков, молодых ученых, аспирантов и студентов на открытый научный семинар «Сети в науке: анализ соавторства и научных сообществ в цифровую эпоху». В эру больших данных важно не просто публиковаться, но и понимать структуру научного ландшафта. Как связаны ученые внутри одной дисциплины? Кто формирует тренды? Как визуализировать сообщества?

Эти и другие вопросы мы разберем с приглашенным экспертом — Дарьей Мальцевой, кандидатом социологических наук, заведующей Международной лабораторией прикладного сетевого анализа НИУ ВШЭ.

На семинаре вы:
узнаете, что такое библиометрический анализ и как работают современные наукометрические базы
увидите, как строятся «карты науки» и интеллектуальные структуры.
научитесь выявлять ключевых исследователей и «точки роста» в разных областях знаний
освоите инструментарий: работа в программах VOSviewer и Biblioshiny на реальных примерах.

💥Семинар пройдет онлайн 5 марта. Начало в 17:00.

Для кого: для всех, кто хочет чувствовать науку сквозь призму данных. Регистрация обязательна: https://forms.yandex.ru/cloud/69a5b1e984227c77fff0db0e/

Научный семинар организован в рамках деятельности Университетского консорциума исследователей больших данных.

📱 Университетский консорциум исследователей больших данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21
​​Вакансии! (удалённо)

Тьюторы-ревьюеры на курсы:
1. «АБ-тестирование»
2. «Автоматизация обработки данных и построение витрин данных»

Что нужно делать:
1. Работать в чате со студентами (отвечать на вопросы, помогать разбираться в сложных темах, подсвечивать типовые ошибки). Это не круглосуточная поддержка, но регулярное присутствие и включённость обязательны.
2. Проверять практические задания (выставлять оценки по критериям, готовить обратную связь).

Будем рады видеть в своей команде, если ты:
• умеешь давать конструктивную, развивающую обратную связь;
• cпокойно работаешь с вопросами разного уровня – от базовых до продвинутых;
• формулируешь мысли четко и структурированно;
• соблюдаешь дедлайны;
• готов к регулярной асинхронной коммуникации в чате.

Нам важно, чтобы ревьюер не просто ставил балл, а помогал студенту стать сильнее.

Кого мы ищем
Тьютор курса «АВ тестирование»:
Ты – практикующий специалист по A/B-тестированию, который хочет не только запускать эксперименты, но и помогать другим делать это правильно. Нам важен реальный практический опыт в A/B-тестировании, а не только теоретическая база.

Профессиональные компетенции:
• Python
• проектирования и запуска A/B-тестов в продуктовой среде;
• умение выбирать метрики (включая продуктовые фреймворки вроде HEART, AARRR);
• формулирования гипотез и понимания их приоритизации;
• понимания статистических критериев (t-test, Mann–Whitney, bootstrap, Monte Carlo, AA-тесты и валидация критериев);
• умение считать MDE и объем выборки, проектировать дизайн эксперимента;
• понимание проблемы подглядывания и способы ее решения (включая последовательное тестирование);
• работе с методами снижения дисперсии (CUPED / CUMPED / CUPAC, стратификация, пост-стратификация, мэтчинг);
• понимание проблемы множественного тестирования и применение поправки на практике;
• знание специфики ratio-метрик и проблемы зависимости наблюдений.

Тьютор курса «Автоматизация обработки данных и построение витрин данных»:
Ты – практикующий специалист по DWH / Data Engineering, который хочет делиться опытом и помогать студентам разбираться в архитектуре хранилищ, SQL и ETL-процессах.

Профессиональные компетенции:
• SQL
• работа с DWH и участие в проектировании хранилищ;
• Понимаешь архитектуру хранилища данных и различия подходов (Kimball / Inmon);
• Знаешь, как строятся витрины данных под BI;
• Уверенно пишешь сложный SQL (JOIN, оконные функции, оптимизация);
• Понимаешь, как данные проходят путь от источника до дашборда;
• Работал(а) с ETL/ELT-процессами;
• Понимаешь базовые принципы Data Vault и современные подходы к моделированию;
• Знаешь, что такое MPP, партиционирование, индексы и планы запросов;

Что мы предлагаем:
• Официальное трудоустройство в соответствии с ТК РФ или по договору ГПХ;
• Работа в сплочённой команде.
• Возможность систематизировать собственную экспертизу.
• Работа с мотивированными студентами.
• Участие в развитии сильной инженерной школы.
• Гибкий формат и удалёнка.

Присоединяйся!

По всем вопросам и дополнительным условиям обращаться к Ольге: @KadinevaOS
1🔥1