AiКвиз 💥 Каким городам соответствуют следующие координаты:
(39.9, 116.4), (-33.8, 151.2), (43.7, -79.3), (-33.9, 18.4), (35.7, 139.7)?
(39.9, 116.4), (-33.8, 151.2), (43.7, -79.3), (-33.9, 18.4), (35.7, 139.7)?
Anonymous Quiz
0%
Сидней, Кейптаун, Пекин, Торонто, Токио
5%
Торонто, Сидней, Пекин, Кейптаун, Токио
23%
Токио, Кейптаун, Торонто, Сидней, Пекин
59%
Пекин, Сидней, Торонто, Кейптаун, Токио
14%
Пекин, Торонто, Сидней, Токио, Кейптаун
Дайджест статей за прошедший период 2025 года. На случай, если вы что-то пропустили 😉
Обзор уязвимостей для LLM. Как современные фреймворки классификации, включая OWASP, Mitre и Databricks, применяются для защиты решений на базе LLM.
Как «Писец» на Тотальный диктант ходил. Не тот «Писец», когда всё плохо, диктант прошёл как запланировано, а открытая система автоматической расшифровки звукозаписей. О трудностях, которые возникли при создании Писца, об использовании Wav2vec2 и Whisper в пайплайне распознавания, о том, как и зачем файнтюнить Whisper.
3D Pose Estimation объектов фиксированной геометрии для складских роботов. В статье рассказано про end-2-end-пайплайн обучения и работу складских роботов от 3D-локализации коробок с товарами для складской робототехники.
Машинное обучение в продуктовой разработке, где его не ожидают. Вечная тема — ресурсов нет, но требуется сделать качественный продукт. В статье про разработку OCR-решения для распознавания документов. Как в рамках больших проектов получить максимальную пользу от Open Source-решений и самостоятельно создать датасет. И что надо учесть для передачи продукта заказчику.
Свой стартап на LLM — миф или реальность. По каким критериям обдумывать идею будущего стартапа, как выбрать, для кого делать продукт и с чего вообще начинать, чтобы осуществить мечту, но не просто запустить свой стартап, а и заработать на этом.
В стиле ретро: меньше слов — больше action items. Для кого-то ретро — скукота и потеря времени, для кого-то — кошмар и мучение, а для кого-то — настоящее спасение, которое помогает решать реальные проблемы. В статье о том, как добиться необходимого эффекта, а не тратить время впустую и не мучить уставшую после спринта команду.
Как я стал AI-специалистом: путь от студенческой лабораторной до оргкомитета AiConf Х. Как одна лабораторная работа по анализу данных определила карьеру автора, как пригодились соревнования и хакатоны, и почему участие в конференциях так же важно, как и прокачка резюме.
Проектируем собственную inhouse Feature Platform. Как построить внутреннюю Feature Platform, которая ускоряет внедрение ML-моделей и делает работу с данными прозрачной и управляемой.
Сохраните дайджест себе и поделитесь с коллегами 🙌
Обзор уязвимостей для LLM. Как современные фреймворки классификации, включая OWASP, Mitre и Databricks, применяются для защиты решений на базе LLM.
Как «Писец» на Тотальный диктант ходил. Не тот «Писец», когда всё плохо, диктант прошёл как запланировано, а открытая система автоматической расшифровки звукозаписей. О трудностях, которые возникли при создании Писца, об использовании Wav2vec2 и Whisper в пайплайне распознавания, о том, как и зачем файнтюнить Whisper.
3D Pose Estimation объектов фиксированной геометрии для складских роботов. В статье рассказано про end-2-end-пайплайн обучения и работу складских роботов от 3D-локализации коробок с товарами для складской робототехники.
Машинное обучение в продуктовой разработке, где его не ожидают. Вечная тема — ресурсов нет, но требуется сделать качественный продукт. В статье про разработку OCR-решения для распознавания документов. Как в рамках больших проектов получить максимальную пользу от Open Source-решений и самостоятельно создать датасет. И что надо учесть для передачи продукта заказчику.
Свой стартап на LLM — миф или реальность. По каким критериям обдумывать идею будущего стартапа, как выбрать, для кого делать продукт и с чего вообще начинать, чтобы осуществить мечту, но не просто запустить свой стартап, а и заработать на этом.
В стиле ретро: меньше слов — больше action items. Для кого-то ретро — скукота и потеря времени, для кого-то — кошмар и мучение, а для кого-то — настоящее спасение, которое помогает решать реальные проблемы. В статье о том, как добиться необходимого эффекта, а не тратить время впустую и не мучить уставшую после спринта команду.
Как я стал AI-специалистом: путь от студенческой лабораторной до оргкомитета AiConf Х. Как одна лабораторная работа по анализу данных определила карьеру автора, как пригодились соревнования и хакатоны, и почему участие в конференциях так же важно, как и прокачка резюме.
Проектируем собственную inhouse Feature Platform. Как построить внутреннюю Feature Platform, которая ускоряет внедрение ML-моделей и делает работу с данными прозрачной и управляемой.
Сохраните дайджест себе и поделитесь с коллегами 🙌
🔥4👍2
Работа нейросетей с медиаконтентом прямо в браузере – одна из самых сложных задач для современных сервисов видеоконференций. Как добиться real-time инференса, сэкономить ресурсы пользователя и при этом не потерять в качестве?
Дмитрий Балиев из SberDevices поделился опытом создания собственного движка для ML-моделей. Рассказал, почему они не стали брать готовые Open Source-решения и как построили эффективный инференс, используя возможности WebGL. Как работает их графовый движок, который дает возможность оптимизировать вычисления, но при этом аккуратно структурировать код.
✅ Подробности в статье
Дмитрий Балиев из SberDevices поделился опытом создания собственного движка для ML-моделей. Рассказал, почему они не стали брать готовые Open Source-решения и как построили эффективный инференс, используя возможности WebGL. Как работает их графовый движок, который дает возможность оптимизировать вычисления, но при этом аккуратно структурировать код.
✅ Подробности в статье
Хабр
ML-обработка видео в web-браузере для видеоконференций SaluteJazz
Нейросеть, сегментирующая изображение человека в кадре: как ускорить её в четыре раза? Привет, Хабр! Это Дмитрий Балиев из SberDevices. В этой статье, написанной по докладу с конференции Saint...
🔥1
Цифровая экономика движется вперед — и ваши знания должны успевать за ней.
Представляем Поддерживающую базу знаний Онтико — мощный ресурс для корпораций, команд и экспертов, которые ценят актуальную информацию и эффективные решения.
Для кого это:
✔ Корпорациям, которым важно решать прикладные задачи быстро и профессионально.
✔ Компаниям, стремящимся сохранять экспертизу и передавать знания внутри команды.
✔ Специалистам, которые ищут проверенные данные с фокусом на реальные бизнес-задачи.
Что внутри:
🔹 4000+ видеоматериалов — выступления, разборы, экспертные мнения.
🔹 Свежие материалы — сразу после конференций и мероприятий.
🔹 Тематические гайды — собранные под запросы вашего бизнеса.
🔹 Вебинары и Q&A сессии — инсайты от лидеров индустрии.
Это не просто база — это рабочий инструмент для роста.
📌 Подробнее здесь
Представляем Поддерживающую базу знаний Онтико — мощный ресурс для корпораций, команд и экспертов, которые ценят актуальную информацию и эффективные решения.
Для кого это:
✔ Корпорациям, которым важно решать прикладные задачи быстро и профессионально.
✔ Компаниям, стремящимся сохранять экспертизу и передавать знания внутри команды.
✔ Специалистам, которые ищут проверенные данные с фокусом на реальные бизнес-задачи.
Что внутри:
🔹 4000+ видеоматериалов — выступления, разборы, экспертные мнения.
🔹 Свежие материалы — сразу после конференций и мероприятий.
🔹 Тематические гайды — собранные под запросы вашего бизнеса.
🔹 Вебинары и Q&A сессии — инсайты от лидеров индустрии.
Это не просто база — это рабочий инструмент для роста.
📌 Подробнее здесь
🔥1
ML в тяжелой промышленности, трансформеры для поддержки, 3D-локализация для роботов, тестирование LLM, визуальные модели, нейросети для табличных данных, мультимодальная разметка и оптимизация пуш-уведомлений — все это в дайджесте открытых записей докладов с конференции AiConf 2024 ⤵️
1) Система управления процессом окомкования железорудных окатышей. Андрей Голов
Чугун, бентонит, шихта, окатыш... Технологи, операторы, датчики... Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Доклад от сталелитейной компании окунает в нюансы реальных физических процессов. И знакомит с парой новых слов 😉
2) Как мы развернули трансформер на событиях интерфейса операторов поддержки. Артём Карасюк
Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. В докладе коллеги расскажут, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.
3) 3D pose estimation объектов фиксированной геометрии для складских роботов. Aлександр Тимофеев-Каракозов
Доклад про end-2-end-пайплайн обучения и работы складских роботов Яндекса от 3D-локализации коробок с товарами для складской робототехники через keypoints estimation и instance segmentation к финальному решению, базирующемуся на active learning в среде активно меняющихся доменов.
4) За рамками сценария: непрерывное тестирование для адаптивных и безопасных LLM-систем. Эмели Драль
Эмели рассказала про failure cases LLM, дообученных на свой домен, ограничения на безопасность и надежность в продакшне. Рассмотрены стратегии повышения робастности, базирующиеся на концепциях LLM judge, а также непрерывном тестировании и мониторинге.
5) Визуальные языковые модели: от разбора архитектуры до запуска. Эмиль Шакиров
LLM обрастает разными модальностями, одной из которых является зрение. Эмиль рассказал об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур. Посмотрите, будет интересно!
6) Превращаем нейросети в SOTA и для табличных задач. Олег Сидоршин
Градиентный бустинг — SOTA для работы с табличными данными. Олег рассказал, какие архитектуры нейронных сетей использовать и как именно их обучать, чтобы догнать по качеству бустинг и впоследствии в режиме end-to-end строить модели одновременно на структурированных и слабоструктурированных данных.
7) Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения. Дмитрий Антипов
Дмитрий провел слушателей через систему подготовки размеченных мультимодальных данных. От парсинга интернета через кейсы мультимодальной разметки; через использование вспомогательных моделей, в том числе LLM; через бизнес-процессы и контроль качества разметки к финальным метрикам моделей.
8) Less is more: как уменьшить отправку пушей и вырастить DAU. Дарья Никанорова
Из доклада вы узнаете о трудностях работы с рассылками, про сложность оценки изменений и о том, как перейти от наивного подхода к более продвинутому. Даша рассказала про то, как получилось преодолеть эти челленджи в Одноклассниках и улучшить бизнес-метрики.
Оставайтесь с нами, уже скоро мы продолжим открывать записи докладов с AiConf 2024 😉
Продуктивного просмотра и отличных выходных 🙌
1) Система управления процессом окомкования железорудных окатышей. Андрей Голов
Чугун, бентонит, шихта, окатыш... Технологи, операторы, датчики... Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Доклад от сталелитейной компании окунает в нюансы реальных физических процессов. И знакомит с парой новых слов 😉
2) Как мы развернули трансформер на событиях интерфейса операторов поддержки. Артём Карасюк
Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. В докладе коллеги расскажут, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.
3) 3D pose estimation объектов фиксированной геометрии для складских роботов. Aлександр Тимофеев-Каракозов
Доклад про end-2-end-пайплайн обучения и работы складских роботов Яндекса от 3D-локализации коробок с товарами для складской робототехники через keypoints estimation и instance segmentation к финальному решению, базирующемуся на active learning в среде активно меняющихся доменов.
4) За рамками сценария: непрерывное тестирование для адаптивных и безопасных LLM-систем. Эмели Драль
Эмели рассказала про failure cases LLM, дообученных на свой домен, ограничения на безопасность и надежность в продакшне. Рассмотрены стратегии повышения робастности, базирующиеся на концепциях LLM judge, а также непрерывном тестировании и мониторинге.
5) Визуальные языковые модели: от разбора архитектуры до запуска. Эмиль Шакиров
LLM обрастает разными модальностями, одной из которых является зрение. Эмиль рассказал об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур. Посмотрите, будет интересно!
6) Превращаем нейросети в SOTA и для табличных задач. Олег Сидоршин
Градиентный бустинг — SOTA для работы с табличными данными. Олег рассказал, какие архитектуры нейронных сетей использовать и как именно их обучать, чтобы догнать по качеству бустинг и впоследствии в режиме end-to-end строить модели одновременно на структурированных и слабоструктурированных данных.
7) Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения. Дмитрий Антипов
Дмитрий провел слушателей через систему подготовки размеченных мультимодальных данных. От парсинга интернета через кейсы мультимодальной разметки; через использование вспомогательных моделей, в том числе LLM; через бизнес-процессы и контроль качества разметки к финальным метрикам моделей.
8) Less is more: как уменьшить отправку пушей и вырастить DAU. Дарья Никанорова
Из доклада вы узнаете о трудностях работы с рассылками, про сложность оценки изменений и о том, как перейти от наивного подхода к более продвинутому. Даша рассказала про то, как получилось преодолеть эти челленджи в Одноклассниках и улучшить бизнес-метрики.
Оставайтесь с нами, уже скоро мы продолжим открывать записи докладов с AiConf 2024 😉
Продуктивного просмотра и отличных выходных 🙌
👍3
Построить собственный магазин фичей — задача не классическая. Такое за пару недель не сделаешь. Нужны исследования, совместимость, обучение.
Евгений Дащенко из Домклик рассказал, как они последовательно внедряли свой Feature Store в существующие пайплайны «на ходу» и параллельно успевали решать бизнес-задачи. Что сделали, чтобы не уйти в долгострой и показать первые результаты: начиная от разбора запросов и источников, заканчивая автогенерацией фич через SDK.
➡️ Эту невероятную историю можно прочитать в статье
Евгений Дащенко из Домклик рассказал, как они последовательно внедряли свой Feature Store в существующие пайплайны «на ходу» и параллельно успевали решать бизнес-задачи. Что сделали, чтобы не уйти в долгострой и показать первые результаты: начиная от разбора запросов и источников, заканчивая автогенерацией фич через SDK.
➡️ Эту невероятную историю можно прочитать в статье
Хабр
Переходим от legacy к построению Feature Store
Невероятная история о том, как внедрить систему Feature Store в проект с огромным legacy и получить профит. Привет, Хабр! Меня зовут Евгений Дащенко, я из компании Домклик, которая решает все вопросы,...
👍2
Событие, которое нельзя пропустить ML- и Data Science-инженерам
💥 26 сентября в Москве пройдет прикладная конференция по Data Science — AiConf X 2025. Программа в стадии формирования, первые принятые доклады уже на сайте и скоро мы начнем знакомить вас со спикерами и их докладами 🖐
А пока расскажем, что ждет участников на площадке:
🟣 25+ прикладных докладов (не только из IT, а также из промышленности, медицины…);
🟣 500+ единомышленников;
🟣 общение со спикерами;
🟣 проработка тем на мастер-классах;
🟣 интерактивная выставка от партнеров;
🟣 возможности для продуктивного нетворкинга;
🟣 кофе-брейки, обеды и фуршеты;
🟣 самое крупное Data Science-сообщество в России.
Ключевые темы конференции:
🟣 RecSys, поиск, табличные данные.
🟣 GenAI & Perception: генерация и распознавание текстов, музыки, изображений, видео и 3D.
🟣 ML Edge — оптимизация обучения и инференса, дистилляция, квантизация, hardware и т.д.
🟣 Automotive, роботы и промышленность.
🟣 Обработка данных и бенчмарки.
✋ Сейчас у вас есть возможность купить билет по минимальной стоимости — чем ближе конференция, тем выше будет цена. Вы можете забронировать билет заранее, а оплатить в течение нескольких дней.
Ждем вас 26 сентября в Москве на AiConf X 2025 — независимой крупнейшей офлайн-конференции по Data Science 🙌
✅ Узнать подробнее о конференции и забронировать билет можно на сайте
💥 26 сентября в Москве пройдет прикладная конференция по Data Science — AiConf X 2025. Программа в стадии формирования, первые принятые доклады уже на сайте и скоро мы начнем знакомить вас со спикерами и их докладами 🖐
А пока расскажем, что ждет участников на площадке:
Ключевые темы конференции:
✋ Сейчас у вас есть возможность купить билет по минимальной стоимости — чем ближе конференция, тем выше будет цена. Вы можете забронировать билет заранее, а оплатить в течение нескольких дней.
Ждем вас 26 сентября в Москве на AiConf X 2025 — независимой крупнейшей офлайн-конференции по Data Science 🙌
✅ Узнать подробнее о конференции и забронировать билет можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Для чего нужно принять участие в AiConf X 2025?
На этот вопрос ответил Дани Эль-Айясс — член Программного комитета конференции AiConf 2024, AI-энтузиаст с 6+ годами в Data Science и машинном обучении. Любит NLP и большие языковые модели. В свободное время делает Open Source-проекты. Послушайте 😉
Встречаемся 26 сентября в Москве, присоединяйтесь к нам 🙌
✅ Узнать подробнее о конференции и забронировать билет по минимальной стоимости можно на сайте
На этот вопрос ответил Дани Эль-Айясс — член Программного комитета конференции AiConf 2024, AI-энтузиаст с 6+ годами в Data Science и машинном обучении. Любит NLP и большие языковые модели. В свободное время делает Open Source-проекты. Послушайте 😉
Встречаемся 26 сентября в Москве, присоединяйтесь к нам 🙌
✅ Узнать подробнее о конференции и забронировать билет по минимальной стоимости можно на сайте
👍1😁1
Процесс сопоставления товаров между собой как в каталогах разных продавцов, так и в каталоге одного продавца очень важен для современной интернет-торговли и эффективной работы маркетплейсов. Но выполнить его по миллионам позиций не так-то просто.
Виталий Кулиев, Data Science Tech Lead из Wildberries&Russ, поделился практическим кейсом использования Llama для мэтчинга товаров. Рассказал, как не заливать проблему деньгами, а найти эффективное решение, которое вы сможете использовать у себя.
➡️ Подробности в статье
Виталий Кулиев, Data Science Tech Lead из Wildberries&Russ, поделился практическим кейсом использования Llama для мэтчинга товаров. Рассказал, как не заливать проблему деньгами, а найти эффективное решение, которое вы сможете использовать у себя.
➡️ Подробности в статье
Хабр
Современные подходы к матчингу товаров с использованием LLM. Опыт в e-commerce
Привет, Хабр! Меня зовут Виталий Кулиев и я Data Science Tech Lead из Wildberries & Russ. На конференции HighLoad++ 2024 поделился опытом своей команды в решении задачи матчинга товаров с помощью...
👍5❤1
AiКвиз 💥 Сколько нолей в 100! (сто факториал)?
Anonymous Quiz
14%
2
29%
24
10%
16
35%
42
10%
20
2%
10
🔥3
Мультимодальные LLM — это реальность!
Руководитель исследовательских ML-команд в Сбере Александр Капитанов рассказал, как ИИ, способный работать с текстом, изображениями и аудио, открывает новые возможности для бизнеса. Какие задачи решают такие модели? Как внедрять их в продукты и оценивать результат?
Подробности в статье ✅
Руководитель исследовательских ML-команд в Сбере Александр Капитанов рассказал, как ИИ, способный работать с текстом, изображениями и аудио, открывает новые возможности для бизнеса. Какие задачи решают такие модели? Как внедрять их в продукты и оценивать результат?
Подробности в статье ✅
Хабр
Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?
Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают здесь и сейчас: анализируют документы, пишут тексты,...
🔥4❤2
Запись доклада Павла Плюснина «Kolmogorov Arnold Networks: новая архитектура нейронных сетей» с конференции AiConf 2024 ⤵️
В докладе подробно рассматривается новый подход в нейронных сетях, а также его приложения в сравнении с современными доминирующими подходами на основе сверток (в случае CV) и трансформернов (в части NLP). Отдельно рассматриваются особенности реализации вычислений KAN на CPU и GPU.
Посмотрите запись в VK Видео, не забывайте делиться с коллегами 😉
Продуктивного просмотра 🙌
В докладе подробно рассматривается новый подход в нейронных сетях, а также его приложения в сравнении с современными доминирующими подходами на основе сверток (в случае CV) и трансформернов (в части NLP). Отдельно рассматриваются особенности реализации вычислений KAN на CPU и GPU.
Посмотрите запись в VK Видео, не забывайте делиться с коллегами 😉
Продуктивного просмотра 🙌
👍4🔥4
Кто был, что вам больше всего понравилось? 💥
Anonymous Poll
16%
Ламповая атмосфера, перезагрузился на 100%
37%
Концентрация информации, мегаполезно
21%
Нетворкинг, познакомился с классными ребятами
11%
Все вышеперечисленное
16%
Другое, напишу в комментариях
Media is too big
VIEW IN TELEGRAM
Давайте вспомним, какой была AiConf 2024! 😎
Будем рады, если поделитесь в комментариях, что взяли с AiConf 2024, удалось ли применить новые фишки/знания на практике, какой результат? 👇🏻
Будем рады, если поделитесь в комментариях, что взяли с AiConf 2024, удалось ли применить новые фишки/знания на практике, какой результат? 👇🏻
Не просто доклады: как AiConf помогает решать реальные задачи бизнеса
А мы напоминаем, что AiConf X 2025 пройдет в Москве 26 сентября! В этом году мы сделали программу еще полезнее🔥
Переходи на сайт — чтобы купить билет до повышения цен
А мы напоминаем, что AiConf X 2025 пройдет в Москве 26 сентября! В этом году мы сделали программу еще полезнее🔥
Переходи на сайт — чтобы купить билет до повышения цен
🔥3👍2