Отвечаем на вопросы, которые не успели разобрать на Data Fusion. Начнем с Retrieval-Augmented Generation
🗯 Какие плюсы и минусы моделей, объединяющих традиционные генеративные и поисковые компоненты, наблюдаются на практике?
Попросили ответить Льва Меркушова, модератора сессии RAG:
💬 «Модели, объединяющие как традиционные векторные, так и полнотекстовые поисковые компоненты, позволяют использовать преимущества как семантического понимания, так и точных совпадений ключевых слов.
Полнотекстовый поиск хорошо справляется с точными совпадениями слов и фраз. Векторный поиск находит документы, близкие по смыслу, даже если дословного совпадения нет. В общем, гибридные системы дают повышенную релевантность поиска, так как обрабатывают как простые, так и неточные/абстрактные запросы.
Среди минусов — более сложная реализация и необходимость настройки баланса между двумя типами поиска».
Если вы не успели посетить сессию лично, делимся полезными ссылками:
Запись сессии с участием ключевых экспертов в области
Презентация к выступлению Алексея Незнанова «Мечтают ли андроиды о большом и чистом эксплицитном знании?»
🗯 Какие плюсы и минусы моделей, объединяющих традиционные генеративные и поисковые компоненты, наблюдаются на практике?
Попросили ответить Льва Меркушова, модератора сессии RAG:
💬 «Модели, объединяющие как традиционные векторные, так и полнотекстовые поисковые компоненты, позволяют использовать преимущества как семантического понимания, так и точных совпадений ключевых слов.
Полнотекстовый поиск хорошо справляется с точными совпадениями слов и фраз. Векторный поиск находит документы, близкие по смыслу, даже если дословного совпадения нет. В общем, гибридные системы дают повышенную релевантность поиска, так как обрабатывают как простые, так и неточные/абстрактные запросы.
Среди минусов — более сложная реализация и необходимость настройки баланса между двумя типами поиска».
Если вы не успели посетить сессию лично, делимся полезными ссылками:
Запись сессии с участием ключевых экспертов в области
Презентация к выступлению Алексея Незнанова «Мечтают ли андроиды о большом и чистом эксплицитном знании?»
❤7🔥5🙏1
Пары по ИИ: базовый минимум
Пары по римскому праву: роскошный максимум 💅
Рассказываем о нашем партнере — классной магистратуре Физтеха по искусственному интеллекту 4И, которая только что выпустила третий поток.
В программе совмещается сильнейшая техническая подготовка, обучение бизнес-навыкам и гуманитарная база. Работа над дипломом — полноценный обязательный курс с серьезной научно-исследовательской работой, «прогуливать» пары рискуют только самые смелые, а изучать непривычный курс римского права и истории придется так же тщательно, как и анализ данных.
В числе преподавателей — лучшие. Вот, например, о программе рассказывает ее академический руководитель Константин Вячеславович Воронцов, а в этом году к списку лекторов присоединился Алексей Савватеев.
Да и учиться классно. Подтверждает выпускница этого года Анастасия Кушнерёва, которая пришла к нам в банк на работу. Взяли у Насти небольшое интервью — почитайте⭐️
Всем выпускникам в добрый путь! Ждем с дипломами по адресу Пресненская, 10:)
Пары по римскому праву: роскошный максимум 💅
Рассказываем о нашем партнере — классной магистратуре Физтеха по искусственному интеллекту 4И, которая только что выпустила третий поток.
В программе совмещается сильнейшая техническая подготовка, обучение бизнес-навыкам и гуманитарная база. Работа над дипломом — полноценный обязательный курс с серьезной научно-исследовательской работой, «прогуливать» пары рискуют только самые смелые, а изучать непривычный курс римского права и истории придется так же тщательно, как и анализ данных.
В числе преподавателей — лучшие. Вот, например, о программе рассказывает ее академический руководитель Константин Вячеславович Воронцов, а в этом году к списку лекторов присоединился Алексей Савватеев.
Да и учиться классно. Подтверждает выпускница этого года Анастасия Кушнерёва, которая пришла к нам в банк на работу. Взяли у Насти небольшое интервью — почитайте
Всем выпускникам в добрый путь! Ждем с дипломами по адресу Пресненская, 10:)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍3🥰3
Наш Data Fusion Contest, соревнование по ML, приуроченное к конференции, стал лучшим ИИ-хакатоном в России.
Благодарим за высокую оценку жюри, а еще, конечно, нашу DS-команду, которая каждый год старается придумать для вас все более сложные и интересные задачи!
Награду получают наш деврел Инна Гринько и руководитель отдела спецпроектов нашего партнера по проведению хакатона ИТ-холдинга Т1 Елизавета Самарцева. Девчонки организуют и контролируют весь процесс проведения хакатона, чтобы вы кайфовали от задач и больше ни о чем не думали.
Ура! 🥳
Соревнования Data Fusion Contest
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13🥰5🤩4🕊2
Публикуем обзор и подробный разбор задач лучшего ИИ-хакатона России 😌
Повод еще раз поаплодировать нашим победителям этого года — вот они, на фото 👏
Точную постановку всех трех задач и лайфхаки победителей найдете в статье на Хабре.
А какие задачи вы бы хотели решать на Data Fusion Contest в следующем году? Делитесь в комментариях!
Повод еще раз поаплодировать нашим победителям этого года — вот они, на фото 👏
Точную постановку всех трех задач и лайфхаки победителей найдете в статье на Хабре.
А какие задачи вы бы хотели решать на Data Fusion Contest в следующем году? Делитесь в комментариях!
❤11🔥6🥰4👏2
Если вы (как и мы) за последнюю неделю потеряли счет, сколько уже съели мороженого, то наши DS озадачились и посчитали, сколько мороженого едят круглый год по всей стране!
Надеялись, что будет прохладнее, пока делали этот ресеч.
Такие исследования мы делаем на нашей Геоплатформе — это сервис, который агрегирует обезличенные данные о транзакциях наших клиентов и обогащает их данными партнеров.
📊 Что выяснили:
1. Больше всего мороженого на человека покупают в Курской, Тюменской, Смоленской, Белгородской и Нижегородской областях — до 7 пачек в год на жителя (средняя цена — 60–70₽).
2. В среднем по стране — 4,5–5 пачек при цене ~90₽.
3. Cамое дорогое мороженое — на Дальнем Востоке (до 140₽) и в Москве
4. Меньше всего покупают мороженого в регионах Северного Кавказа и в Тыве.
🍦 Пломбир, рожок или лед? (захотеееелось)
1. Пломбир лидирует в Курской, Нижегородской, Удмуртии, Чувашии и Югре
2. Рожки — топ в Тюменской, Смоленской, Пензенской и СПб
3. Фруктовый лёд — фаворит в Коми, Бурятии, Костроме и Брянске
👫 Гендерные предпочтения
1. В ряде регионов мужчины покупают на 20% больше мороженого, чем женщины (например, в Мурманской, Хакасии и Пскове)
2. А в других — наоборот: женщины лидируют (например, в Тюменской и Марий Эл)
3. Женщины чаще выбирают более дорогие виды мороженого!
Такие исследования мы делаем на нашей Геоплатформе — это сервис, который агрегирует обезличенные данные о транзакциях наших клиентов и обогащает их данными партнеров.
📊 Что выяснили:
1. Больше всего мороженого на человека покупают в Курской, Тюменской, Смоленской, Белгородской и Нижегородской областях — до 7 пачек в год на жителя (средняя цена — 60–70₽).
2. В среднем по стране — 4,5–5 пачек при цене ~90₽.
3. Cамое дорогое мороженое — на Дальнем Востоке (до 140₽) и в Москве
4. Меньше всего покупают мороженого в регионах Северного Кавказа и в Тыве.
🍦 Пломбир, рожок или лед? (захотеееелось)
1. Пломбир лидирует в Курской, Нижегородской, Удмуртии, Чувашии и Югре
2. Рожки — топ в Тюменской, Смоленской, Пензенской и СПб
3. Фруктовый лёд — фаворит в Коми, Бурятии, Костроме и Брянске
👫 Гендерные предпочтения
1. В ряде регионов мужчины покупают на 20% больше мороженого, чем женщины (например, в Мурманской, Хакасии и Пскове)
2. А в других — наоборот: женщины лидируют (например, в Тюменской и Марий Эл)
3. Женщины чаще выбирают более дорогие виды мороженого!
❤7👍5🔥5❤🔥2👏1
Блиц-опрос: любимое мороженое data scientists? 🍦
Anonymous Poll
20%
Рожок
24%
Эскимо
8%
Пломбир в вафельках
22%
Пломбир в стаканчиках
6%
Фруктовый лед
7%
Щербет
12%
Джелато
❤4
Media is too big
VIEW IN TELEGRAM
Мы принесли вам классный анонс, который потребует от вас минимизировать latency в реакции и регистрации это поймут DS-ы 😁
⚡️ 29 июля ComDS (наше комьюнити data scientists ВТБ) совместно с МТС True Tech устроит Summer DS Night — вечерний open-air митап в летнем кинотеатре бара STRELKA.
Афиша:
🍿 Открытый микрофон: «Вызовы для DS 2025 в России».
В главных ролях:
— Никита Зелинский, CDS & Head of ML Platforms МТС, автор канала Дата канальи – про „специалистов“ данных в ML/AI
— Евгений Смирнов, CDS & Head of ML Lab, Alfa-Bank, автор канала Нескучный Data Science
— Шамаев Юлий, начальник управления моделирования партнерств и ИТ-процессов, Банк ВТБ.
🍿 «Наши RecSys-технологии: как мы завариваем вашу любимую музыку»
Дмитрий Берестнев, начальник управления машинного обучения, Hi-Fi стриминга Звук.
🍿 «Трансформеры в кино. Как мы строим персональные рекомы в KION»
Даниил Пиманов, Team Lead RecSys в KION, MWS Big Data.
🍿 «Георекомендации: как мы подсказываем клиентам, где тратить деньги»
Алексей Пустынников, DS Team Lead команды GeoML Банка ВТБ
🍿 «Serving по-взрослому: ускорение NLP inference в 50 раз в Антиспаме»
Илья Денисов, ML Team Lead команды Антифрод MWS Big Data.
🍿 «Практические кейсы внедрения Rag: помощник оператора и HelpDesk»
Александр Вавилкин, Middle Data Scientist, Альфа Банк.
Готовьте ваши вопросы спикерам, под попкорн будем выбирать лучшие!
🗓 29 июля
🕗 19:00–22:30
🎬 Берсеневская наб., 14, стр. 5, Москва
Количество мест ограничено
Регистрация по ссылке
Афиша:
В главных ролях:
— Никита Зелинский, CDS & Head of ML Platforms МТС, автор канала Дата канальи – про „специалистов“ данных в ML/AI
— Евгений Смирнов, CDS & Head of ML Lab, Alfa-Bank, автор канала Нескучный Data Science
— Шамаев Юлий, начальник управления моделирования партнерств и ИТ-процессов, Банк ВТБ.
Дмитрий Берестнев, начальник управления машинного обучения, Hi-Fi стриминга Звук.
Даниил Пиманов, Team Lead RecSys в KION, MWS Big Data.
Алексей Пустынников, DS Team Lead команды GeoML Банка ВТБ
Илья Денисов, ML Team Lead команды Антифрод MWS Big Data.
Александр Вавилкин, Middle Data Scientist, Альфа Банк.
Готовьте ваши вопросы спикерам, под попкорн будем выбирать лучшие!
🗓 29 июля
🕗 19:00–22:30
🎬 Берсеневская наб., 14, стр. 5, Москва
Количество мест ограничено
Регистрация по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤7👍6🙏1
Check-list.pdf
441.6 KB
Отмечайте выполненные пункты, не забывайте о дедлайнах и делигировании и отдыхайте с чистой совестью! И делитесь чек-листом с коллегами
Какие еще пункты добавили бы, чтобы спокойно отключиться от рабочих чатов во время отпуска? 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🙏6👍4🐳2😁1