Data Fusion Contest. Издание 2-ое, переработанное и дополненное
Соревнование Data Fusion Contest 2023 в этом году состоялось во второй раз и собрало сильнейшие индустриальные команды и отдельных любителей моделей алгоритмов машинного обучения. Кто-то участвовал впервые, а кто-то, уже умудрённый прошлым опытом был явно настроен только на победу.
В этот раз мы решили принципиально изменить задание и придумали новый формат. Что произойдет, если столкнуть лицом к лицу участников, мотивированных атаковать модели машинного обучения, с другими участниками, мотивированными свои модели защищать? Кто победит, каким окажется тот стек моделей и подходов, который приведет к победе? Что важнее, знания и опыт, или гибкость ума или нестандартные подходы?
Мы задали себе все эти вопросы и решили найти ответы на практике, подготовив для участников Data Fusion Contest 2023 очень нестандартное и по теме и по формату соревнование по Adversarial ML с атаками на модели машинного обучения, а также с их защитой.
Давайте разбираться, что из этого получилось по факту, и какие решения предложили участники, чтобы оказаться в рядах победителей!
Читать: https://habr.com/ru/companies/vtb/articles/741500/
Соревнование Data Fusion Contest 2023 в этом году состоялось во второй раз и собрало сильнейшие индустриальные команды и отдельных любителей моделей алгоритмов машинного обучения. Кто-то участвовал впервые, а кто-то, уже умудрённый прошлым опытом был явно настроен только на победу.
В этот раз мы решили принципиально изменить задание и придумали новый формат. Что произойдет, если столкнуть лицом к лицу участников, мотивированных атаковать модели машинного обучения, с другими участниками, мотивированными свои модели защищать? Кто победит, каким окажется тот стек моделей и подходов, который приведет к победе? Что важнее, знания и опыт, или гибкость ума или нестандартные подходы?
Мы задали себе все эти вопросы и решили найти ответы на практике, подготовив для участников Data Fusion Contest 2023 очень нестандартное и по теме и по формату соревнование по Adversarial ML с атаками на модели машинного обучения, а также с их защитой.
Давайте разбираться, что из этого получилось по факту, и какие решения предложили участники, чтобы оказаться в рядах победителей!
Читать: https://habr.com/ru/companies/vtb/articles/741500/
Построение BI-системы: вы могли об этом забыть…
Привет, Habr! Совсем недавно я опубликовал статью про Self-Service BI: что же это такое и зачем он нужен крупным компаниям. Но теперь хочется немного отойти непосредственно от Self-Service и вернуться в целом к построению BI-систем. В 2021 году я выступал на Analyst Days с одноименным докладом. Запись выступления ниже (казалось бы, причем тут автомобили?):
Читать: https://habr.com/ru/articles/742026/
Привет, Habr! Совсем недавно я опубликовал статью про Self-Service BI: что же это такое и зачем он нужен крупным компаниям. Но теперь хочется немного отойти непосредственно от Self-Service и вернуться в целом к построению BI-систем. В 2021 году я выступал на Analyst Days с одноименным докладом. Запись выступления ниже (казалось бы, причем тут автомобили?):
Читать: https://habr.com/ru/articles/742026/
ТОП-5 мобильных приложений для изучения Python
Собрали несколько популярных мобильных приложений для изучения Python и не только и описали их плюсы и минусы.
Читать: «ТОП-5 мобильных приложений для изучения Python»
Собрали несколько популярных мобильных приложений для изучения Python и не только и описали их плюсы и минусы.
Читать: «ТОП-5 мобильных приложений для изучения Python»
Tproger
ТОП-5 мобильных приложений для изучения Python
Собрали несколько популярных мобильных приложений для изучения Python и не только и описали их плюсы и минусы.
👌2👍1
Подборка актуальных вакансий
— Бизнес-аналитик
Где: удалённо
Опыт: от 1 года
— Системный аналитик
Где: удалённо
Опыт: от 1 года
— Аналитик
Где: удалённо
Опыт: от 1 года
— Аналитик
Где: удалённо
Опыт: от 1 года
— Системный аналитик
Где: удалённо
Опыт: от 2 лет
— Full-stack аналитик
Где: удалённо
Опыт: от 2 лет
— Аналитик
Где: удалённо
Опыт: от 2 лет
— Web-аналитик
Где: Москва, можно удалённо
Опыт: от 2 лет
— Системный аналитик
Где: Москва, можно удалённо
Опыт: от 2 лет
— Аналитик ПО Диасофт FA# (Digital Q)
Где: Москва, можно удалённо
Опыт: от 2 лет
#вакансии #работа
— Бизнес-аналитик
Где: удалённо
Опыт: от 1 года
— Системный аналитик
Где: удалённо
Опыт: от 1 года
— Аналитик
Где: удалённо
Опыт: от 1 года
— Аналитик
Где: удалённо
Опыт: от 1 года
— Системный аналитик
Где: удалённо
Опыт: от 2 лет
— Full-stack аналитик
Где: удалённо
Опыт: от 2 лет
— Аналитик
Где: удалённо
Опыт: от 2 лет
— Web-аналитик
Где: Москва, можно удалённо
Опыт: от 2 лет
— Системный аналитик
Где: Москва, можно удалённо
Опыт: от 2 лет
— Аналитик ПО Диасофт FA# (Digital Q)
Где: Москва, можно удалённо
Опыт: от 2 лет
#вакансии #работа
How to become a valuable data engineer
Read: https://www.startdataengineering.com/post/valuable-de-guide/
Read: https://www.startdataengineering.com/post/valuable-de-guide/
Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки
Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.
Читать: «Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки»
Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.
Читать: «Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки»
Tproger
Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки
Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.
Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки
Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.
Читать: «Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки»
Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.
Читать: «Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки»
Tproger
Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки
Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.
Борьба за открытый исходный код: BI-шоудаун на вебинаре «Open-source vs пропиетарный BI»
Являясь сторонником решений с открытым исходным кодом в области бизнес-аналитики (BI), я был рад принять участие в онлайн-вебинаре Visiology в прошлый четверг. Я присоединился к увлекательной дискуссии не только для того, чтобы предаться интеллектуальному спору, но и для того, чтобы продемонстрировать практичность технологий с открытым исходным кодом на конкретных примерах.
Ландшафт BI меняется, и недоступность традиционных коммерческих решений заставила многие российские компании пересмотреть свои стратегии. Я продемонстрировал потенциал решений с открытым исходным кодом, объясняя, почему они могут быть прагматичным выбором для компаний, стремящихся к экономичности, свободе технической разработки и свободе от привязки к поставщику (вендор-лок).
Однако эта дискуссия не была односторонней. Мне противостоял Евгений Скребанов, опытный профессионал, который твердо поддерживает проприетарное программное обеспечение BI. Евгений, обладающий обширными знаниями в области аналитических систем и не понаслышке знакомый с западным и российским рынками BI, представил иную точку зрения.
Хотя мы понимаем, что в этой дискуссии нет однозначного "победителя" - разные платформы и системы подходят для разных ситуаций, - наша цель - дать вам полное представление об обоих подходах.
Выражаю благодарность всем участникам данного батла за то, что потратили вечернее время на в увлекательную дискуссию о будущем BI-технологий и были активны в чате.
В данной статье, я открою материалы встречи и отвечу на вопросы, которые задавались в чате вебинара (это был самый активный чат из всех последних вебинаров). Если у вас есть вопросы по теме выбора BI или своя точка зрения, буду рад увидеть ее и ответить в комментариях под постом.
Читать: https://habr.com/ru/articles/742762/
Являясь сторонником решений с открытым исходным кодом в области бизнес-аналитики (BI), я был рад принять участие в онлайн-вебинаре Visiology в прошлый четверг. Я присоединился к увлекательной дискуссии не только для того, чтобы предаться интеллектуальному спору, но и для того, чтобы продемонстрировать практичность технологий с открытым исходным кодом на конкретных примерах.
Ландшафт BI меняется, и недоступность традиционных коммерческих решений заставила многие российские компании пересмотреть свои стратегии. Я продемонстрировал потенциал решений с открытым исходным кодом, объясняя, почему они могут быть прагматичным выбором для компаний, стремящихся к экономичности, свободе технической разработки и свободе от привязки к поставщику (вендор-лок).
Однако эта дискуссия не была односторонней. Мне противостоял Евгений Скребанов, опытный профессионал, который твердо поддерживает проприетарное программное обеспечение BI. Евгений, обладающий обширными знаниями в области аналитических систем и не понаслышке знакомый с западным и российским рынками BI, представил иную точку зрения.
Хотя мы понимаем, что в этой дискуссии нет однозначного "победителя" - разные платформы и системы подходят для разных ситуаций, - наша цель - дать вам полное представление об обоих подходах.
Выражаю благодарность всем участникам данного батла за то, что потратили вечернее время на в увлекательную дискуссию о будущем BI-технологий и были активны в чате.
В данной статье, я открою материалы встречи и отвечу на вопросы, которые задавались в чате вебинара (это был самый активный чат из всех последних вебинаров). Если у вас есть вопросы по теме выбора BI или своя точка зрения, буду рад увидеть ее и ответить в комментариях под постом.
Читать: https://habr.com/ru/articles/742762/
Как создать платформу для управления 50 000 сотрудниками в ритейле при помощи частного облака
Как отслеживать эффективность сотрудников по всей стране, хранить терабайты данных и поддерживать доступность сервиса на высоком уровне? Платформа Imredi пять лет назад выбрала в качестве облачного провайдера Selectel и в 2022 году вышла на выручку в 200 млн в год. Рассказываем, какие решения использовались при построении платформы, как организована ее техническая часть и какие преобразования ожидаются в будущем.
Читать: https://habr.com/ru/companies/selectel/articles/740258/
Как отслеживать эффективность сотрудников по всей стране, хранить терабайты данных и поддерживать доступность сервиса на высоком уровне? Платформа Imredi пять лет назад выбрала в качестве облачного провайдера Selectel и в 2022 году вышла на выручку в 200 млн в год. Рассказываем, какие решения использовались при построении платформы, как организована ее техническая часть и какие преобразования ожидаются в будущем.
Читать: https://habr.com/ru/companies/selectel/articles/740258/
КАК ВЫВЕСТИ МИЛЛИАРДЫ ключей из ScyllaDB
Мечтал ли я когда-либо ворочать миллиардами? Честно признаюсь, да. И нельзя сказать, что Вселенная меня не услышала. Вот только я никак не имел в виду миллиарды записей в базе данных...
Ранее я уже писал о нашем опыте использования ScyllaDB в качестве архивного хранилища. Разумеется, исследования и открытия, связанные с новой базой данных, для нас на этом не закончились... Создавая архив для данных, вероятность обращения к которым близка к нулю, мы, конечно, допускали, что время от времени клиенты будут просить вернуть данные обратно в оперативное хранилище. Но запрос на извлечение из архива сразу всех записей стал для нас неожиданностью. Хорошо ещё, что клиента интересовал только ключ записи, а не вся запись целиком. Тем не менее достать 10 млрд. ключей из ScyllaDB за приемлемое время звучало как челлендж. Ну надо так надо.
Читать: https://habr.com/ru/companies/stm_labs/articles/743276/
Мечтал ли я когда-либо ворочать миллиардами? Честно признаюсь, да. И нельзя сказать, что Вселенная меня не услышала. Вот только я никак не имел в виду миллиарды записей в базе данных...
Ранее я уже писал о нашем опыте использования ScyllaDB в качестве архивного хранилища. Разумеется, исследования и открытия, связанные с новой базой данных, для нас на этом не закончились... Создавая архив для данных, вероятность обращения к которым близка к нулю, мы, конечно, допускали, что время от времени клиенты будут просить вернуть данные обратно в оперативное хранилище. Но запрос на извлечение из архива сразу всех записей стал для нас неожиданностью. Хорошо ещё, что клиента интересовал только ключ записи, а не вся запись целиком. Тем не менее достать 10 млрд. ключей из ScyllaDB за приемлемое время звучало как челлендж. Ну надо так надо.
Читать: https://habr.com/ru/companies/stm_labs/articles/743276/
❤1
Как превратить данные в продукт: выжать из данных максимум благодаря принципам продакт-менеджмента
Многие компании хотят, чтобы их технологии были не просто затратами, а конкурентными преимуществами. Это в том числе касается технологий работы с данными. Часто такое стремление выражается словами «Мы хотим воспринимать данные как продукт». Команда VK Cloud перевела статью, которая поможет применить принципы продакт-менеджмента к управлению дата-продуктами компании.
Читать: https://habr.com/ru/companies/vk/articles/742728/
Многие компании хотят, чтобы их технологии были не просто затратами, а конкурентными преимуществами. Это в том числе касается технологий работы с данными. Часто такое стремление выражается словами «Мы хотим воспринимать данные как продукт». Команда VK Cloud перевела статью, которая поможет применить принципы продакт-менеджмента к управлению дата-продуктами компании.
Читать: https://habr.com/ru/companies/vk/articles/742728/
Спиливаем spill-ы
Привет!
Меня зовут Александр Маркачев, я 3,5 года работаю на позиции Data Engineer в билайне и люблю открывать для себя что-то новое и интересное в работе. Так случилось и с темой, которой я сегодня хочу с вами поделиться — со spill-ами.
Под катом мы поговорим о том, что такое Spill-ы в контексте Spark, и почему именно для Spark это не такая уж сильно плохая штука. Рассмотрим, из-за чего Spill-ы в принципе возникают, разберем несколько видов Spill-ов (и даже вызовем их намеренно), а затем будем решать эту проблему.
Что такое spill-ы в Spark
Вообще, Spill — это термин для обозначения процесса перемещения данных из памяти на диск, а затем снова обратно в память. По крайней мере, именно так гласит официальная трактовка. Если проще, то дело вот в чем — когда у Spark не хватает ресурсов для обработки, он перемещает данные на диск.
В процессе обработки существуют разные участки — есть Executor Memory, есть Storage Memory, и когда эти участки оба целиком заполнены, то они начинают переполняться и вызывать утечку данных. Причем в отличие от утечки в C, Java или еще где-то, в Spark это преднамеренное действие для того, чтобы ваша задача не падала. Собственно, именно поэтому при нехватке ресурсов данные и «проливаются».
Можно ещё сильнее упростить аналогию.
Читать: https://habr.com/ru/companies/beeline_tech/articles/743292/
Привет!
Меня зовут Александр Маркачев, я 3,5 года работаю на позиции Data Engineer в билайне и люблю открывать для себя что-то новое и интересное в работе. Так случилось и с темой, которой я сегодня хочу с вами поделиться — со spill-ами.
Под катом мы поговорим о том, что такое Spill-ы в контексте Spark, и почему именно для Spark это не такая уж сильно плохая штука. Рассмотрим, из-за чего Spill-ы в принципе возникают, разберем несколько видов Spill-ов (и даже вызовем их намеренно), а затем будем решать эту проблему.
Что такое spill-ы в Spark
Вообще, Spill — это термин для обозначения процесса перемещения данных из памяти на диск, а затем снова обратно в память. По крайней мере, именно так гласит официальная трактовка. Если проще, то дело вот в чем — когда у Spark не хватает ресурсов для обработки, он перемещает данные на диск.
В процессе обработки существуют разные участки — есть Executor Memory, есть Storage Memory, и когда эти участки оба целиком заполнены, то они начинают переполняться и вызывать утечку данных. Причем в отличие от утечки в C, Java или еще где-то, в Spark это преднамеренное действие для того, чтобы ваша задача не падала. Собственно, именно поэтому при нехватке ресурсов данные и «проливаются».
Можно ещё сильнее упростить аналогию.
Читать: https://habr.com/ru/companies/beeline_tech/articles/743292/
❤1
Как сэкономить свои нервы и деньги компании на перестроении структуры больших таблиц без простоя в PostgreSQL
Привет! Меня зовут Васильев Виктор, я DBA в компании UIS и CoMagic. В этой статье на реальных примерах расскажу, как можно сэкономить время разработчика, администратора баз данных и ресурсы сервера(ов), используя утилиту pg_rebuild_table. Сопровождая большие, высоконагруженные системы, с бо’льшей вероятностью каждый сталкивался с кейсами, о которых будет рассказано дальше. Некоторые технические подробности пройду без детализации, чтобы сильно не усложнять и не делать статью очень громоздкой. Лучше отвечу на вопросы в комментариях.
Читать: https://habr.com/ru/articles/743438/
Привет! Меня зовут Васильев Виктор, я DBA в компании UIS и CoMagic. В этой статье на реальных примерах расскажу, как можно сэкономить время разработчика, администратора баз данных и ресурсы сервера(ов), используя утилиту pg_rebuild_table. Сопровождая большие, высоконагруженные системы, с бо’льшей вероятностью каждый сталкивался с кейсами, о которых будет рассказано дальше. Некоторые технические подробности пройду без детализации, чтобы сильно не усложнять и не делать статью очень громоздкой. Лучше отвечу на вопросы в комментариях.
Читать: https://habr.com/ru/articles/743438/
Анализировать данные — это как варить пиво. Почему дата-анализ и пивоварение — одно и то же с техноизнанки
Анализировать данные — это как варить пиво. Почему data-анализ и пивоварение — одно и то же с техноизнанки
Три года я был эстонским пивоваром: придумывал рецепты и сам варил. Когда начал изучать Python, SQL и анализ данных, понял, что между подготовкой данных и подготовкой сусла много общего: оказывается, в цеху я занимался DS, но не подозревал об этом. Меня зовут Алексей Гаврилов, я сеньор дата-аналитик в ретейле. В этой статье расскажу, чем пивоварение и аналитика данных похожи изнутри.
Читать: https://habr.com/ru/companies/it-guide/articles/741876/
Анализировать данные — это как варить пиво. Почему data-анализ и пивоварение — одно и то же с техноизнанки
Три года я был эстонским пивоваром: придумывал рецепты и сам варил. Когда начал изучать Python, SQL и анализ данных, понял, что между подготовкой данных и подготовкой сусла много общего: оказывается, в цеху я занимался DS, но не подозревал об этом. Меня зовут Алексей Гаврилов, я сеньор дата-аналитик в ретейле. В этой статье расскажу, чем пивоварение и аналитика данных похожи изнутри.
Читать: https://habr.com/ru/companies/it-guide/articles/741876/
👍1
ClickHouse: полезные лайфхаки
Я начала пользоваться ClickHouse до того, как это стало мэйнстримом: первый раз я столкнулась c этой базой данных лет 8 назад. C тех пор я уверена, что это лучшая DB для аналитики. Большинство аналитиков, которых я знаю, в восторге от ClickHouse (иногда чтобы проникнуться, требуется немного времени: разобраться и привыкнуть к синтаксису).
В этой статье я расскажу что такое ClickHouse и почему я считаю его идеально подходящим мощным инструментом для аналитики. А также поделюсь tips & tricks из моего опыта. Поехали.
Поехали
Читать: https://habr.com/ru/articles/743772/
Я начала пользоваться ClickHouse до того, как это стало мэйнстримом: первый раз я столкнулась c этой базой данных лет 8 назад. C тех пор я уверена, что это лучшая DB для аналитики. Большинство аналитиков, которых я знаю, в восторге от ClickHouse (иногда чтобы проникнуться, требуется немного времени: разобраться и привыкнуть к синтаксису).
В этой статье я расскажу что такое ClickHouse и почему я считаю его идеально подходящим мощным инструментом для аналитики. А также поделюсь tips & tricks из моего опыта. Поехали.
Поехали
Читать: https://habr.com/ru/articles/743772/
Mini-ml-stand для бедных
Всем привет! Снова на связи General RJ45 с новым прекрасным решением, но на сей раз по теме ML и аналитики.
На моем счету уже два законченных ML проекта и за это время я достаточно много поработал с аналитиками и ML инженерами, да и вообще над созданием ML и аналитических решений и могу сказать что у меня сформировалось своё представление о данных решения и я вижу какие проблемы возникают в данных процессах и что нужно разработчикам для их более эффективной работы, как пример это прозрачность всего процесса чтобы они могли видеть весь процесс от начала до конца и контролировать его.
В рамках данной статьи хочу рассказать как можно максимально просто поднять ML стенд на котором можно будет вести полноценную разработку и ETL процессов, и различных обучений моделей и их переобучений.
Стек того что мы поднимем в рамках этой статьи, также будут и другие инструменты как Nginx, Postgresql но мы их учитываем как часть компонентов ниже:
Развернем свой стенд с мл и etl?
Читать: https://habr.com/ru/articles/743782/
Всем привет! Снова на связи General RJ45 с новым прекрасным решением, но на сей раз по теме ML и аналитики.
На моем счету уже два законченных ML проекта и за это время я достаточно много поработал с аналитиками и ML инженерами, да и вообще над созданием ML и аналитических решений и могу сказать что у меня сформировалось своё представление о данных решения и я вижу какие проблемы возникают в данных процессах и что нужно разработчикам для их более эффективной работы, как пример это прозрачность всего процесса чтобы они могли видеть весь процесс от начала до конца и контролировать его.
В рамках данной статьи хочу рассказать как можно максимально просто поднять ML стенд на котором можно будет вести полноценную разработку и ETL процессов, и различных обучений моделей и их переобучений.
Стек того что мы поднимем в рамках этой статьи, также будут и другие инструменты как Nginx, Postgresql но мы их учитываем как часть компонентов ниже:
Развернем свой стенд с мл и etl?
Читать: https://habr.com/ru/articles/743782/
❤2
ClickHouse в ритейловом проекте
Всем привет!
Всегда интересно узнавать, как устроено IT в различных сферах и компаниях: какие задачи ставятся и как находятся решения. Да и в целом, делиться опытом полезно!
Меня зовут Илья Панов, я инженер данных в X5 Tech и участвую в развитии продукта CVM (Customer Value Maximization). В этой статье хочу рассказать как живёт и развивается it-продукт в ритейле. Расскажу откуда появилась потребность в инструменте, подобном ClickHouse, и как проходило RnD для его внедрения.
Читать: https://habr.com/ru/companies/X5Tech/articles/743696/
Всем привет!
Всегда интересно узнавать, как устроено IT в различных сферах и компаниях: какие задачи ставятся и как находятся решения. Да и в целом, делиться опытом полезно!
Меня зовут Илья Панов, я инженер данных в X5 Tech и участвую в развитии продукта CVM (Customer Value Maximization). В этой статье хочу рассказать как живёт и развивается it-продукт в ритейле. Расскажу откуда появилась потребность в инструменте, подобном ClickHouse, и как проходило RnD для его внедрения.
Читать: https://habr.com/ru/companies/X5Tech/articles/743696/
CI/CD в Data Science, MLOps в финтехе и тенденции в потоковой передаче данных
Звание текста с лучшими мемами получила статья про антисоветы для работы с ML-экспериментами.
Привет, Хабр! Это уже четвертый выпуск дайджеста по ML и работе с данными для тех, кто тащит эти направления в своих компаниях. Сегодня в программе — антисоветы для работы с ML-экспериментами, обзор библиотеки для Pandas с примесью ChatGPT, очень сложная статья про Ray и многое другое. Еще больше полезных текстов по DataOps и MLOps — в Telegram-сообществе «MLечный путь».
Используйте навигацию, если не хотите полностью:
→ Теория
→ Практика
→ Мнение
→ Инструменты
→ Видео
Читать: https://habr.com/ru/companies/selectel/articles/742788/
Звание текста с лучшими мемами получила статья про антисоветы для работы с ML-экспериментами.
Привет, Хабр! Это уже четвертый выпуск дайджеста по ML и работе с данными для тех, кто тащит эти направления в своих компаниях. Сегодня в программе — антисоветы для работы с ML-экспериментами, обзор библиотеки для Pandas с примесью ChatGPT, очень сложная статья про Ray и многое другое. Еще больше полезных текстов по DataOps и MLOps — в Telegram-сообществе «MLечный путь».
Используйте навигацию, если не хотите полностью:
→ Теория
→ Практика
→ Мнение
→ Инструменты
→ Видео
Читать: https://habr.com/ru/companies/selectel/articles/742788/
Профилирование данных из СУБД Oracle с помощью DataHub и Great Expectations. Часть 1
Всем привет! В данном цикле статей мы поделимся своими результатами исследования по составлению профиля объектов данных, которые хранятся в RDBMS Oracle с помощью DataHub и интеграции с инструментом Great Expectations. В первой части мы поговорим про проблемы, которые возникли в ходе интеграции, а также поделимся найденными решениями для их устранения.
Читать: https://habr.com/ru/companies/neoflex/articles/743832/
Всем привет! В данном цикле статей мы поделимся своими результатами исследования по составлению профиля объектов данных, которые хранятся в RDBMS Oracle с помощью DataHub и интеграции с инструментом Great Expectations. В первой части мы поговорим про проблемы, которые возникли в ходе интеграции, а также поделимся найденными решениями для их устранения.
Читать: https://habr.com/ru/companies/neoflex/articles/743832/
Create Oracle Analytics Cloud custom plug-ins for your dashboard
Oracle Analytics Cloud custom plug-ins are a great way to extend the functionalities of your dashboard. This article aims to get you excited about creating your own plug-ins.
Read: https://blogs.oracle.com/analytics/post/create-oracle-analytics-custom-plugins-for-your-dashboard
Oracle Analytics Cloud custom plug-ins are a great way to extend the functionalities of your dashboard. This article aims to get you excited about creating your own plug-ins.
Read: https://blogs.oracle.com/analytics/post/create-oracle-analytics-custom-plugins-for-your-dashboard
Oracle
Create Oracle Analytics custom plug-ins for your dashboard
Custom plug-ins are a great way to extend the functionalities of your dashboard. This blog is a 'call to action' to make you more excited about creating your own plug-ins.
Медленно меняющиеся измерения (SCDs) в эпоху облачного хранилища данных
Как работать с медленно меняющимися измерениями при использовании облачного хранилища данных?
В этом вопросе скрывается довольно много ответов, поэтому давайте сделаем паузу.
Читать: https://habr.com/ru/companies/southbridge/articles/743962/
Как работать с медленно меняющимися измерениями при использовании облачного хранилища данных?
В этом вопросе скрывается довольно много ответов, поэтому давайте сделаем паузу.
Читать: https://habr.com/ru/companies/southbridge/articles/743962/