Data Fusion
4.09K subscribers
277 photos
22 videos
1 file
107 links
Официальный канал конференции Data Fusion и ComDS — Data Science-сообщества ВТБ 💙
Download Telegram
Отвечаем на вопросы, которые не успели разобрать на Data Fusion. Начнем с Retrieval-Augmented Generation

🗯 Какие плюсы и минусы моделей, объединяющих традиционные генеративные и поисковые компоненты, наблюдаются на практике?

Попросили ответить Льва Меркушова, модератора сессии RAG:

💬 «Модели, объединяющие как традиционные векторные, так и полнотекстовые поисковые компоненты, позволяют использовать преимущества как семантического понимания, так и точных совпадений ключевых слов.

Полнотекстовый поиск хорошо справляется с точными совпадениями слов и фраз. Векторный поиск находит документы, близкие по смыслу, даже если дословного совпадения нет. В общем, гибридные системы дают повышенную релевантность поиска, так как обрабатывают как простые, так и неточные/абстрактные запросы.

Среди минусов — более сложная реализация и необходимость настройки баланса между двумя типами поиска».

Если вы не успели посетить сессию лично, делимся полезными ссылками:

Запись сессии с участием ключевых экспертов в области

Презентация к выступлению Алексея Незнанова «Мечтают ли андроиды о большом и чистом эксплицитном знании?»
7🔥5🙏1
Пары по ИИ: базовый минимум
Пары по римскому праву: роскошный максимум
💅

Рассказываем о нашем партнере — классной магистратуре Физтеха по искусственному интеллекту 4И, которая только что выпустила третий поток.

В программе совмещается сильнейшая техническая подготовка, обучение бизнес-навыкам и гуманитарная база. Работа над дипломом — полноценный обязательный курс с серьезной научно-исследовательской работой, «прогуливать» пары рискуют только самые смелые, а изучать непривычный курс римского права и истории придется так же тщательно, как и анализ данных.

В числе преподавателей — лучшие. Вот, например, о программе рассказывает ее академический руководитель Константин Вячеславович Воронцов, а в этом году к списку лекторов присоединился Алексей Савватеев.

Да и учиться классно. Подтверждает выпускница этого года Анастасия Кушнерёва, которая пришла к нам в банк на работу. Взяли у Насти небольшое интервью — почитайте ⭐️

Всем выпускникам в добрый путь! Ждем с дипломами по адресу Пресненская, 10:)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍3🥰3
🚀 Экстренное включение в ваш вечер пятницы!

Наш Data Fusion Contest, соревнование по ML, приуроченное к конференции, стал лучшим ИИ-хакатоном в России.

Благодарим за высокую оценку жюри, а еще, конечно, нашу DS-команду, которая каждый год старается придумать для вас все более сложные и интересные задачи!

Награду получают наш деврел Инна Гринько и руководитель отдела спецпроектов нашего партнера по проведению хакатона ИТ-холдинга Т1 Елизавета Самарцева. Девчонки организуют и контролируют весь процесс проведения хакатона, чтобы вы кайфовали от задач и больше ни о чем не думали.

Ура! 🥳

Соревнования Data Fusion Contest
Please open Telegram to view this post
VIEW IN TELEGRAM
13🥰5🤩4🕊2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥128❤‍🔥5
Публикуем обзор и подробный разбор задач лучшего ИИ-хакатона России 😌

Повод еще раз поаплодировать нашим победителям этого года — вот они, на фото 👏

Точную постановку всех трех задач и лайфхаки победителей найдете в статье на Хабре.

А какие задачи вы бы хотели решать на Data Fusion Contest в следующем году? Делитесь в комментариях!
11🔥6🥰4👏2
Если вы (как и мы) за последнюю неделю потеряли счет, сколько уже съели мороженого, то наши DS озадачились и посчитали, сколько мороженого едят круглый год по всей стране!

Надеялись, что будет прохладнее, пока делали этот ресеч.

Такие исследования мы делаем на нашей Геоплатформе — это сервис, который агрегирует обезличенные данные о транзакциях наших клиентов и обогащает их данными партнеров.

📊 Что выяснили:
1. Больше всего мороженого на человека покупают в Курской, Тюменской, Смоленской, Белгородской и Нижегородской областях — до 7 пачек в год на жителя (средняя цена — 60–70₽).
2. В среднем по стране — 4,5–5 пачек при цене ~90₽.
3. Cамое дорогое мороженое — на Дальнем Востоке (до 140₽) и в Москве
4. Меньше всего покупают мороженого в регионах Северного Кавказа и в Тыве.

🍦 Пломбир, рожок или лед? (захотеееелось)
1. Пломбир лидирует в Курской, Нижегородской, Удмуртии, Чувашии и Югре
2. Рожки — топ в Тюменской, Смоленской, Пензенской и СПб
3. Фруктовый лёд — фаворит в Коми, Бурятии, Костроме и Брянске

👫 Гендерные предпочтения
1. В ряде регионов мужчины покупают на 20% больше мороженого, чем женщины (например, в Мурманской, Хакасии и Пскове)
2. А в других — наоборот: женщины лидируют (например, в Тюменской и Марий Эл)
3. Женщины чаще выбирают более дорогие виды мороженого!
7👍5🔥5❤‍🔥2👏1
Media is too big
VIEW IN TELEGRAM
Мы принесли вам классный анонс, который потребует от вас минимизировать latency в реакции и регистрации это поймут DS-ы 😁

⚡️29 июля ComDS (наше комьюнити data scientists ВТБ) совместно с МТС True Tech устроит Summer DS Night — вечерний open-air митап в летнем кинотеатре бара STRELKA.

Афиша:


🍿 Открытый микрофон: «Вызовы для DS 2025 в России».
В главных ролях:
— Никита Зелинский, CDS & Head of ML Platforms МТС, автор канала Дата канальи – про „специалистов“ данных в ML/AI
— Евгений Смирнов, CDS & Head of ML Lab, Alfa-Bank, автор канала Нескучный Data Science
— Шамаев Юлий, начальник управления моделирования партнерств и ИТ-процессов, Банк ВТБ.

🍿 «Наши RecSys-технологии: как мы завариваем вашу любимую музыку»
Дмитрий Берестнев, начальник управления машинного обучения, Hi-Fi стриминга Звук.

🍿 «Трансформеры в кино. Как мы строим персональные рекомы в KION»
Даниил Пиманов, Team Lead RecSys в KION, MWS Big Data.

🍿 «Георекомендации: как мы подсказываем клиентам, где тратить деньги»
Алексей Пустынников, DS Team Lead команды GeoML Банка ВТБ

🍿 «Serving по-взрослому: ускорение NLP inference в 50 раз в Антиспаме»
Илья Денисов, ML Team Lead команды Антифрод MWS Big Data.

🍿 «Практические кейсы внедрения Rag: помощник оператора и HelpDesk»
Александр Вавилкин, Middle Data Scientist, Альфа Банк.

Готовьте ваши вопросы спикерам, под попкорн будем выбирать лучшие!

🗓 29 июля
🕗 19:00–22:30
🎬 Берсеневская наб., 14, стр. 5, Москва


Количество мест ограничено
Регистрация по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥107👍6🙏1
Check-list.pdf
441.6 KB
💚 Подготовили для DS полезный чек-лист в разгар отпускного сезона

Отмечайте выполненные пункты, не забывайте о дедлайнах и делигировании и отдыхайте с чистой совестью! И делитесь чек-листом с коллегами 🐧🌴☀️

Какие еще пункты добавили бы, чтобы спокойно отключиться от рабочих чатов во время отпуска? 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
11🙏6👍4🐳2😁1