Подготовка к собеседованию на позицию Data Scientist. Часть 1: Live Coding
В данной статье разберемся что такое live coding интервью и как к нему готовиться.
Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.
Читать: https://habr.com/ru/companies/megafon/articles/795261/
В данной статье разберемся что такое live coding интервью и как к нему готовиться.
Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.
Читать: https://habr.com/ru/companies/megafon/articles/795261/
Forwarded from Нейроканал
OpenAI запустила форум для исследователей ИИ
На нём будут проводиться различные образовательные вебинары, технические беседы, а также множество возможностей для участников (включая исследователей OpenAI) для общения и генерации новых идей.
А тем, кому удастся себя проявить, будут и предложены и оплачиваемые мероприятия, например: оценки моделей, создание наборов оценок и не только. Для вступления необходимо проходить по некоторым критериям, но попробовать точно стоит!
#openai #нейроновости
На нём будут проводиться различные образовательные вебинары, технические беседы, а также множество возможностей для участников (включая исследователей OpenAI) для общения и генерации новых идей.
А тем, кому удастся себя проявить, будут и предложены и оплачиваемые мероприятия, например: оценки моделей, создание наборов оценок и не только. Для вступления необходимо проходить по некоторым критериям, но попробовать точно стоит!
#openai #нейроновости
❤1
Как связать натуральные ключи с суррогатным в Anchor Modeling
Хранить значения натуральных ключей необходимо, потому что они связывают хранимые данные с реальным миром (внешними классификаторами, реестрами и т.п.), и с ними работают бизнес-пользователи: в выпадающих списках, отчетах и дашбордах. Но в методологии Anchor Modeling для связи таблиц используются только суррогатные ключи, не подверженные изменениям, и это правильно. Поэтому нужно хранить связь натуральных ключей с суррогатным ключом, предпочтительно формата UUIDv7. Как же это сделать в методологии Anchor Modeling?
Получить ответ
Читать: https://habr.com/ru/articles/795689/
Хранить значения натуральных ключей необходимо, потому что они связывают хранимые данные с реальным миром (внешними классификаторами, реестрами и т.п.), и с ними работают бизнес-пользователи: в выпадающих списках, отчетах и дашбордах. Но в методологии Anchor Modeling для связи таблиц используются только суррогатные ключи, не подверженные изменениям, и это правильно. Поэтому нужно хранить связь натуральных ключей с суррогатным ключом, предпочтительно формата UUIDv7. Как же это сделать в методологии Anchor Modeling?
Получить ответ
Читать: https://habr.com/ru/articles/795689/
Oracle Analytics Best Practices: Oracle EPM Cloud as a Data Source for a Repository Subject Area
Read this post to understand how to use Oracle EPM Cloud as a data source within an RPD.
Read: https://blogs.oracle.com/analytics/post/oracle-analytics-best-practices-oracle-epm-cloud-as-a-data-source-for-the-repository
Read this post to understand how to use Oracle EPM Cloud as a data source within an RPD.
Read: https://blogs.oracle.com/analytics/post/oracle-analytics-best-practices-oracle-epm-cloud-as-a-data-source-for-the-repository
Oracle
Oracle Analytics Best Practices: Oracle EPM Cloud as a data source for the repository_Revised
Don't waste your time on me you're already the voice inside my head - Blink-182
❤1
How Banks Can Boost Cross-Selling: The Ultimate Guide
We explore how a central CRM system, mobile banking app and analytics software can help banks to succeed in cross-selling.
Read: https://www.scnsoft.com/finance/cross-selling-in-banking-guide
We explore how a central CRM system, mobile banking app and analytics software can help banks to succeed in cross-selling.
Read: https://www.scnsoft.com/finance/cross-selling-in-banking-guide
Типичные задачи аналитика. Часть 2. А есть ли тренд?
В первой части статьи на Habr мы рассмотрели классические подходы к оценке изменений метрики при условии ее стационарности. В этом контексте статистические критерии, применяемые в A/B тестировании, оказались весьма эффективными.
Однако, если существует стабильный тренд, например, среднемесячная аудитория увеличивается из года в год, оценка разницы средних за два смежных периода времени может быть некорректной. В таком случае среднее значение предыдущего периода всегда будет отличаться от среднего постпериода, и это часто может быть не связано с исследуемым функционалом.
Одна из причин — тренд не всегда зависит от действий компании и часто является следствием внешних условий. Например, рост аудитории может быть связан с увеличением благосостояния населения, масштабированием бизнеса или сезонными факторами.
Таким образом, наличие или отсутствие тренда является важным аспектом анализа данных. Рассмотрим несколько успешных и неудачных подходов, которые можно применять для решения этой задачи.
Читать: https://habr.com/ru/articles/795251/
В первой части статьи на Habr мы рассмотрели классические подходы к оценке изменений метрики при условии ее стационарности. В этом контексте статистические критерии, применяемые в A/B тестировании, оказались весьма эффективными.
Однако, если существует стабильный тренд, например, среднемесячная аудитория увеличивается из года в год, оценка разницы средних за два смежных периода времени может быть некорректной. В таком случае среднее значение предыдущего периода всегда будет отличаться от среднего постпериода, и это часто может быть не связано с исследуемым функционалом.
Одна из причин — тренд не всегда зависит от действий компании и часто является следствием внешних условий. Например, рост аудитории может быть связан с увеличением благосостояния населения, масштабированием бизнеса или сезонными факторами.
Таким образом, наличие или отсутствие тренда является важным аспектом анализа данных. Рассмотрим несколько успешных и неудачных подходов, которые можно применять для решения этой задачи.
Читать: https://habr.com/ru/articles/795251/
❤1
Banks need emotion recognition software to increase customer loyalty
Banking software consultants advice using text, voice and image analysis software to interpret customers’ emotions and boost customer loyalty.
Read: https://www.scnsoft.com/finance/banks-need-emotion-recognition-software-to-increase-customer-loyalty
Banking software consultants advice using text, voice and image analysis software to interpret customers’ emotions and boost customer loyalty.
Read: https://www.scnsoft.com/finance/banks-need-emotion-recognition-software-to-increase-customer-loyalty
👍1
Недвижимость и Big Data: плюсы технологии
Big Data представляет колоссальные массивы информации, собранные с различных платформ — начиная от социальных сетей и заканчивая данными о местоположении. Главное здесь — не сам объем данных, а способность эффективно их анализировать для извлечения значимых выводов.
Как Big Data помогает в работе с данными
Читать: https://habr.com/ru/articles/796923/
Big Data представляет колоссальные массивы информации, собранные с различных платформ — начиная от социальных сетей и заканчивая данными о местоположении. Главное здесь — не сам объем данных, а способность эффективно их анализировать для извлечения значимых выводов.
Как Big Data помогает в работе с данными
Читать: https://habr.com/ru/articles/796923/
❤1
Renaming Subject Areas in Oracle Analytics
This blog describes how to rename an Oracle Analytics subject area.
Read: https://blogs.oracle.com/analytics/post/renaming-subject-area-in-the-catalog
This blog describes how to rename an Oracle Analytics subject area.
Read: https://blogs.oracle.com/analytics/post/renaming-subject-area-in-the-catalog
Oracle
Renaming Subject Areas in Oracle Analytics
This blog talks about renaming the subject Area in the report xml
Кейс: разметка приложение с нуля на конкретном примере
Привет! На связи Сергей Матросов и команда X5 Tech, ответственная за аналитику в “Пятёрочке”. Хотим поделиться с вами тем, как мы внедрили трекер AppMetrica от Яндекса и сделали с помощью него разметку для приложения “Пятёрочки”. Почему мы остановились именно на этом фреймворке, какую мы выбрали архитектуру разметки, как писали правила и словари, а также разберём процесс разметки на живом примере разметки экрана приложения. Очень надеемся, что эта статья поможет вам сэкономить много времени, если перед вами будет стоять аналогичная задача.
Читать: https://habr.com/ru/companies/X5Tech/articles/797185/
Привет! На связи Сергей Матросов и команда X5 Tech, ответственная за аналитику в “Пятёрочке”. Хотим поделиться с вами тем, как мы внедрили трекер AppMetrica от Яндекса и сделали с помощью него разметку для приложения “Пятёрочки”. Почему мы остановились именно на этом фреймворке, какую мы выбрали архитектуру разметки, как писали правила и словари, а также разберём процесс разметки на живом примере разметки экрана приложения. Очень надеемся, что эта статья поможет вам сэкономить много времени, если перед вами будет стоять аналогичная задача.
Читать: https://habr.com/ru/companies/X5Tech/articles/797185/
Куда и как съехать с Qlik Sense
Куда и как съехать с Qlik Sense
Привет, Хабр! Сегодня я расскажу о том, как выбрать российскую BI, чтобы не потерять привычный уровень работы с данными в компании — и с чем придется столкнуться в процессе миграции.
Читать: https://habr.com/ru/companies/navicon/articles/797207/
Куда и как съехать с Qlik Sense
Привет, Хабр! Сегодня я расскажу о том, как выбрать российскую BI, чтобы не потерять привычный уровень работы с данными в компании — и с чем придется столкнуться в процессе миграции.
Читать: https://habr.com/ru/companies/navicon/articles/797207/
Что такое СУБД Greenplum? Зачем она нужна в больших проектах DWH? Чем отличается от ClickHouse?
Ошибки в построении DWH возникают не только в результате того, что первоначально не были учтены возможные изменения в бизнес-процессах, потребностях и целях компании, но и из-за некорректного выбора стека технологий и СУБД.
Порядок хранения данных выбирается в соответствии с разными сценариями работы - запросами, разным объемом данных, количеством транзакций, необходимостью обновлений данных.
В статье читайте о СУБД Greenplum и о том, в каких случаях строить хранилища на ее основе.
Читать: https://habr.com/ru/articles/797361/
Ошибки в построении DWH возникают не только в результате того, что первоначально не были учтены возможные изменения в бизнес-процессах, потребностях и целях компании, но и из-за некорректного выбора стека технологий и СУБД.
Порядок хранения данных выбирается в соответствии с разными сценариями работы - запросами, разным объемом данных, количеством транзакций, необходимостью обновлений данных.
В статье читайте о СУБД Greenplum и о том, в каких случаях строить хранилища на ее основе.
Читать: https://habr.com/ru/articles/797361/
Configuring a Private SMTP Server in Oracle Analytics Cloud using OCI Load Balancers
This post describes how to leverage private SMTP servers with Oracle Analytics Cloud (OAC) while harnessing the power of Oracle Cloud Infrastructure (OCI) load balancers.
Read: https://blogs.oracle.com/analytics/post/oac-private-smtp
This post describes how to leverage private SMTP servers with Oracle Analytics Cloud (OAC) while harnessing the power of Oracle Cloud Infrastructure (OCI) load balancers.
Read: https://blogs.oracle.com/analytics/post/oac-private-smtp
Oracle
Configuring Private Simple Mail Transfer Protocol Server in Oracle Analytics Cloud using OCI Load Balancers
In this blog post, we delve into the intricacies of leveraging private SMTP servers within Oracle Analytics Cloud (OAC) while harnessing the power of Oracle Cloud Infrastructure (OCI) load balancers.
Deploy DNS Components for Oracle Fusion Analytics Service Endpoints Internet Access
Deploy in minutes the DNS components necessary for Internet access to Oracle Fusion Analytics service endpoints using Oracle Private DNS, Oracle Cloud Shell, and the Terraform OCI provider.
Read: https://blogs.oracle.com/analytics/post/deploy-dns-components-for-oracle-fusion-analytics-service-endpoints-internet-access
Deploy in minutes the DNS components necessary for Internet access to Oracle Fusion Analytics service endpoints using Oracle Private DNS, Oracle Cloud Shell, and the Terraform OCI provider.
Read: https://blogs.oracle.com/analytics/post/deploy-dns-components-for-oracle-fusion-analytics-service-endpoints-internet-access
Oracle
Deploy DNS Components for Oracle Fusion Analytics Service Endpoints Internet Access
Deploy in minutes the DNS components necessary for Internet access to Oracle Fusion Analytics service endpoints using Oracle Private DNS, Oracle Cloud Shell, and the Terraform OCI provider.
Системы автоматизации, SGRC
Современная кибербезопасность включает в себя множество различных аспектов, объектов и субъектов защиты: информационные активы компании (ИТ-системы, бизнес-приложения, серверы, рабочие станции, сетевое оборудование), файлы и данные в самых разных форматах (от структурированных в базах данных до "озер данных" и накапливаемых огромных объемов Big Data), процессы компании (основные бизнес-процессы, вспомогательные, ИТ-процессы, процессы кибербезопасности), персонал (от уборщиц до топ-менеджеров), различные используемые технологии (разнообразное программное и аппаратное обеспечение). Все данные сущности подлежат анализу с точки зрения кибербезопасности, которая в современной компании сфокусирована на защите процессов, персонала, технологий, данных. Основными процессами кибербезопасности являются:
Читать: https://habr.com/ru/articles/798233/
@big_data_analysis
Современная кибербезопасность включает в себя множество различных аспектов, объектов и субъектов защиты: информационные активы компании (ИТ-системы, бизнес-приложения, серверы, рабочие станции, сетевое оборудование), файлы и данные в самых разных форматах (от структурированных в базах данных до "озер данных" и накапливаемых огромных объемов Big Data), процессы компании (основные бизнес-процессы, вспомогательные, ИТ-процессы, процессы кибербезопасности), персонал (от уборщиц до топ-менеджеров), различные используемые технологии (разнообразное программное и аппаратное обеспечение). Все данные сущности подлежат анализу с точки зрения кибербезопасности, которая в современной компании сфокусирована на защите процессов, персонала, технологий, данных. Основными процессами кибербезопасности являются:
Читать: https://habr.com/ru/articles/798233/
@big_data_analysis
Ликбез по Data Governance, защита LLM, рейтинг BI-инструментов и другие новинки в мире ML и DA
Привет, Хабр! После перерыва возвращаюсь с новым выпуском полезных материалов, которые помогут лучше разобраться в ML, AI и дата-аналитике. Сегодня в программе — эволюция СУБД, миграция с Apache Druid на ClickHouse и подходы к экономии ресурсов для инфраструктуры. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».
Читать: https://habr.com/ru/companies/selectel/articles/798363/
@big_data_analysis
Привет, Хабр! После перерыва возвращаюсь с новым выпуском полезных материалов, которые помогут лучше разобраться в ML, AI и дата-аналитике. Сегодня в программе — эволюция СУБД, миграция с Apache Druid на ClickHouse и подходы к экономии ресурсов для инфраструктуры. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».
Читать: https://habr.com/ru/companies/selectel/articles/798363/
@big_data_analysis
Подробный гайд: Как собрать дашборд в FineBI за 30 минут
Хабр, привет!
Меня зовут Александр Ларин, я руководитель центра технической поддержки и обучения в GlowByte и лидер самого большого в России сообщества FineBI.
В данной статье я хотел бы показать новичкам основы работы в FineBI: как подключиться к источнику данных, создать на его основе датасет, провести обработку данных, собрать свой первый дашборд – и всё это сделать буквально за 30 минут. А тех, кому этого будет недостаточно, приглашаю на наши курсы.
Читать: https://habr.com/ru/companies/glowbyte/articles/798411/
@big_data_analysis
Хабр, привет!
Меня зовут Александр Ларин, я руководитель центра технической поддержки и обучения в GlowByte и лидер самого большого в России сообщества FineBI.
В данной статье я хотел бы показать новичкам основы работы в FineBI: как подключиться к источнику данных, создать на его основе датасет, провести обработку данных, собрать свой первый дашборд – и всё это сделать буквально за 30 минут. А тех, кому этого будет недостаточно, приглашаю на наши курсы.
Читать: https://habr.com/ru/companies/glowbyte/articles/798411/
@big_data_analysis
Модель глубокого обучения, использующая данные ЭКГ для прогнозирования риска внезапной сердечной смерти
Внезапная сердечная смерть (ВСС) происходит, когда возникают проблемы с электрической активностью в сердце. Это распространенная причина смерти по всему миру, поэтому было бы полезно легко выявлять людей с высоким риском ВСС. Электрокардиограммы - это доступный и широко используемый способ измерения электрической активности сердца. Мы разработали вычислительный метод, который может использовать электрокардиограммы для определения, находится ли человек в повышенном риске ВСС. Наш метод может позволить врачам скрининг больших групп людей и выявление тех, кто находится в повышенном риске ВСС. Это может позволить регулярное наблюдение за этими людьми и, возможно, предотвращение ВСС у некоторых из них.
Читать: https://habr.com/ru/articles/798417/
@big_data_analysis
Внезапная сердечная смерть (ВСС) происходит, когда возникают проблемы с электрической активностью в сердце. Это распространенная причина смерти по всему миру, поэтому было бы полезно легко выявлять людей с высоким риском ВСС. Электрокардиограммы - это доступный и широко используемый способ измерения электрической активности сердца. Мы разработали вычислительный метод, который может использовать электрокардиограммы для определения, находится ли человек в повышенном риске ВСС. Наш метод может позволить врачам скрининг больших групп людей и выявление тех, кто находится в повышенном риске ВСС. Это может позволить регулярное наблюдение за этими людьми и, возможно, предотвращение ВСС у некоторых из них.
Читать: https://habr.com/ru/articles/798417/
@big_data_analysis
❤2👍2
Apache Flink: динамическое определение выходного топика в Kafka
Всем привет, меня зовут Александр Бобряков. Я техлид в команде МТС Аналитики, занимаюсь Real-Time обработкой данных. Мы начали использовать фреймворк Apache Flink, и я решил поделиться на Хабре своим опытом внедрения этой технологии в цикле статей.
В предыдущей статье — «Apache Flink. Как работает дедупликация данных в потоке Kafka-to-Kafka?» — я рассказывал про построение пайплайна Kafka-to-Kafka с промежуточным разделением потока и дедупликацией событий. Также разобрались, что такое состояние оператора и зачем оно нужно.
В этой статье добавим возможность динамического определения топика в Kafka для каждого события, куда его нужно записать.
Читать: https://habr.com/ru/companies/ru_mts/articles/798667/
@big_data_analysis
Всем привет, меня зовут Александр Бобряков. Я техлид в команде МТС Аналитики, занимаюсь Real-Time обработкой данных. Мы начали использовать фреймворк Apache Flink, и я решил поделиться на Хабре своим опытом внедрения этой технологии в цикле статей.
В предыдущей статье — «Apache Flink. Как работает дедупликация данных в потоке Kafka-to-Kafka?» — я рассказывал про построение пайплайна Kafka-to-Kafka с промежуточным разделением потока и дедупликацией событий. Также разобрались, что такое состояние оператора и зачем оно нужно.
В этой статье добавим возможность динамического определения топика в Kafka для каждого события, куда его нужно записать.
Читать: https://habr.com/ru/companies/ru_mts/articles/798667/
@big_data_analysis
Forwarded from Нейроканал
Данные ключ к успеху
Процесс сбора и обработки данных очень важный, так как от их качества зависит практически всё, что будет происходить потом. И встретить этот шаг вы должны во всеоружии. Так что не будем вас томить и дадим этот замечательный плейлист со всем необходимым, чтобы этому научится. А ещё можете глянуть этот доклад по автоматизации разметки с помощью ML-моделей.
#данные @neuro_channel
Процесс сбора и обработки данных очень важный, так как от их качества зависит практически всё, что будет происходить потом. И встретить этот шаг вы должны во всеоружии. Так что не будем вас томить и дадим этот замечательный плейлист со всем необходимым, чтобы этому научится. А ещё можете глянуть этот доклад по автоматизации разметки с помощью ML-моделей.
#данные @neuro_channel
👍3❤2