Миф или реальность? Типовые заблуждения про low-code инструменты анализа данных
Вокруг технологий всегда появляются мифы: фотоаппараты, похищающие душу, подавляющий свободную волю 5G, искусственный интеллект, который захватывает планету и отправляет киборга в прошлое… Всё это - примеры, основанные на страхе неизвестного, который, в свою очередь, является неотъемлемым свойством человеческого мышления.
Анализ данных и машинное обучение, упоминаемые под термином «искусственный интеллект», за последние годы постепенно становятся обыденностью. Использование инструментов продвинутой аналитики для многих организаций стало столь же привычным делом, как автоматизация бухгалтерского учёта или внедрение электронного документооборота.
В этой статье отобраны шесть наиболее популярных мифов вокруг low-code инструментов анализа данных. Насколько они близки к действительности - давайте обсудим.
Поехали!
Читать: https://habr.com/ru/post/707336/
Вокруг технологий всегда появляются мифы: фотоаппараты, похищающие душу, подавляющий свободную волю 5G, искусственный интеллект, который захватывает планету и отправляет киборга в прошлое… Всё это - примеры, основанные на страхе неизвестного, который, в свою очередь, является неотъемлемым свойством человеческого мышления.
Анализ данных и машинное обучение, упоминаемые под термином «искусственный интеллект», за последние годы постепенно становятся обыденностью. Использование инструментов продвинутой аналитики для многих организаций стало столь же привычным делом, как автоматизация бухгалтерского учёта или внедрение электронного документооборота.
В этой статье отобраны шесть наиболее популярных мифов вокруг low-code инструментов анализа данных. Насколько они близки к действительности - давайте обсудим.
Поехали!
Читать: https://habr.com/ru/post/707336/
Как стать дата-сайентистом в МТС и не только
Можно ли научиться Data Science на корпоративных курсах, кому и зачем они полезны, и как устроиться на работу в Big Data МТС.
Читать: «Как стать дата-сайентистом в МТС и не только»
Можно ли научиться Data Science на корпоративных курсах, кому и зачем они полезны, и как устроиться на работу в Big Data МТС.
Читать: «Как стать дата-сайентистом в МТС и не только»
Как стать дата-сайентистом в МТС и не только
Можно ли научиться Data Science на корпоративных курсах, кому и зачем они полезны, и как устроиться на работу в Big Data МТС.
Читать: «Как стать дата-сайентистом в МТС и не только»
Можно ли научиться Data Science на корпоративных курсах, кому и зачем они полезны, и как устроиться на работу в Big Data МТС.
Читать: «Как стать дата-сайентистом в МТС и не только»
Pyspark. Анализ больших данных, когда Pandas не достаточно
Pandas - одна из наиболее используемых библиотек Python с открытым исходным кодом для работы со структурированными табличными данными для анализа. Однако он не поддерживает распределенную обработку, поэтому вам всегда придется увеличивать ресурсы, когда вам понадобится дополнительная мощность для поддержки растущих данных. И всегда наступит момент, когда ресурсов станет недостаточно. В данной статье мы рассмотрим, как PySpark выручает в условиях нехватки мощностей для обработки данных.
Ну что же, приступим...
Читать: https://habr.com/ru/post/708468/
Pandas - одна из наиболее используемых библиотек Python с открытым исходным кодом для работы со структурированными табличными данными для анализа. Однако он не поддерживает распределенную обработку, поэтому вам всегда придется увеличивать ресурсы, когда вам понадобится дополнительная мощность для поддержки растущих данных. И всегда наступит момент, когда ресурсов станет недостаточно. В данной статье мы рассмотрим, как PySpark выручает в условиях нехватки мощностей для обработки данных.
Ну что же, приступим...
Читать: https://habr.com/ru/post/708468/
Делаем фронт на React, а ChatGPT будет нашим Redux редьюсером
Приложение React/Redux представляет собой односторонний цикл потока данных. Пользователь взаимодействует с пользовательским интерфейсом, который производит действия Redux, которые отправляются в функции reducer, которые обновляют объект состояния приложения, который передается обратно в React для повторного отображения пользовательского интерфейса.
Разговор с ChatGPT также представляет собой односторонний цикл. Человек посылает запрос (действие), который передается языковой модели (редуктор), которая обновляет разговор (состояние) своим ответом.
Можем ли мы использовать последнюю модель ChatGPT для этих целей? Спойлер: да, можем!
Читать: https://habr.com/ru/post/708360/
Приложение React/Redux представляет собой односторонний цикл потока данных. Пользователь взаимодействует с пользовательским интерфейсом, который производит действия Redux, которые отправляются в функции reducer, которые обновляют объект состояния приложения, который передается обратно в React для повторного отображения пользовательского интерфейса.
Разговор с ChatGPT также представляет собой односторонний цикл. Человек посылает запрос (действие), который передается языковой модели (редуктор), которая обновляет разговор (состояние) своим ответом.
Можем ли мы использовать последнюю модель ChatGPT для этих целей? Спойлер: да, можем!
Читать: https://habr.com/ru/post/708360/
Data Catalog - A Broken Promise
Read: https://www.dataengineeringweekly.com/p/data-catalog-a-broken-promise
Read: https://www.dataengineeringweekly.com/p/data-catalog-a-broken-promise
👍1
Используем Computer Vision для получения €6,147,455 за ночь во внутриигровой валюте
Последние 10 лет я играл в такие игры, как TownsMen 6, Clash of the Clans, SimCity и мою любимую OpenTTD (с открытым исходным кодом!).
Попробовав City Island 5, я был раздражен от того, что предметы не накапливались, пока я находился вне игры. У меня может быть самый лучший бизнес, стратегия и т.д., но я должен быть в игре, чтобы обеспечить сбор денег/ключей/золота с течением времени. Например, если моя пекарня зарабатывает 100 евро в минуту, я заработаю 100 евро только после того, как выйду из игры и вернусь через 24 часа.
Это стало особенно утомительным, когда я пытался накопить €5 000 000, необходимых для покупки острова, показанного ниже. Это займет у меня примерно две недели игры, если я не буду тратить деньги - оно того не стоит!
Читать: https://habr.com/ru/post/708618/
Последние 10 лет я играл в такие игры, как TownsMen 6, Clash of the Clans, SimCity и мою любимую OpenTTD (с открытым исходным кодом!).
Попробовав City Island 5, я был раздражен от того, что предметы не накапливались, пока я находился вне игры. У меня может быть самый лучший бизнес, стратегия и т.д., но я должен быть в игре, чтобы обеспечить сбор денег/ключей/золота с течением времени. Например, если моя пекарня зарабатывает 100 евро в минуту, я заработаю 100 евро только после того, как выйду из игры и вернусь через 24 часа.
Это стало особенно утомительным, когда я пытался накопить €5 000 000, необходимых для покупки острова, показанного ниже. Это займет у меня примерно две недели игры, если я не буду тратить деньги - оно того не стоит!
Читать: https://habr.com/ru/post/708618/
Разделяй и властвуй, или Зачем управлять данными
Хабр, привет! Сегодня, в предпраздничный день, публикую статью Кирилла Евдокимова, директора практики Data Governance GlowByte. В области данных и аналитики он работает уже около 20 лет, последние 7 лет основной фокус – это Data Governance. Как говорит Кирилл, история с управлением данными всё еще остаётся terra incognita. В статье под катом он разбирает наиболее частые ошибки, проблемы, с которыми приходится сталкиваться компаниям, вступающим на тернистый путь управления данными.
Читать статью Кирилла
Читать: https://habr.com/ru/post/708626/
Хабр, привет! Сегодня, в предпраздничный день, публикую статью Кирилла Евдокимова, директора практики Data Governance GlowByte. В области данных и аналитики он работает уже около 20 лет, последние 7 лет основной фокус – это Data Governance. Как говорит Кирилл, история с управлением данными всё еще остаётся terra incognita. В статье под катом он разбирает наиболее частые ошибки, проблемы, с которыми приходится сталкиваться компаниям, вступающим на тернистый путь управления данными.
Читать статью Кирилла
Читать: https://habr.com/ru/post/708626/
👍4
Математика для Data Science и машинного обучения за 8 месяцев. Подробный план обучения
Беспилотные автомобили, продвинутые голосовые ассистенты, рекомендательные системы – это только малая часть тех классных продуктов, которые создаются с помощью инженеров по машинному обучению и, думаю, не для кого не секрет, что за кулисами сего чуда стоит математика. Именно от ее знания зависит понимание алгоритмов машинного и глубокого обучения.
Машинное обучение держится на трех основных столпах:
Читать: https://habr.com/ru/post/708752/
Беспилотные автомобили, продвинутые голосовые ассистенты, рекомендательные системы – это только малая часть тех классных продуктов, которые создаются с помощью инженеров по машинному обучению и, думаю, не для кого не секрет, что за кулисами сего чуда стоит математика. Именно от ее знания зависит понимание алгоритмов машинного и глубокого обучения.
Машинное обучение держится на трех основных столпах:
Читать: https://habr.com/ru/post/708752/
👍3
Data Pipeline Design Patterns - #1. Data flow patterns
Read: https://www.startdataengineering.com/post/design-patterns/
Read: https://www.startdataengineering.com/post/design-patterns/
👍1
Воссоздаем старую компьютерную графику с помощью генеративных моделей
Могут ли современные алгоритмы создавать улучшенные версии старой графики видеоигр с более высоким разрешением?
Последние несколько дней я использовал ИИ-генерацию изображений для воспроизведения одного из кошмаров моего детства. Я использовал Stable Diffusion, Dall-E и Midjourney, чтобы посмотреть, как эти инструменты генерации изображений могут помочь улучшить старую визуальную историю - вступительный фильм к старой видеоигре (Nemesis 2 на MSX). В этом посте описывается процесс и мой опыт использования этих моделей для улучшения графики.
Читать: https://habr.com/ru/post/708906/
Могут ли современные алгоритмы создавать улучшенные версии старой графики видеоигр с более высоким разрешением?
Последние несколько дней я использовал ИИ-генерацию изображений для воспроизведения одного из кошмаров моего детства. Я использовал Stable Diffusion, Dall-E и Midjourney, чтобы посмотреть, как эти инструменты генерации изображений могут помочь улучшить старую визуальную историю - вступительный фильм к старой видеоигре (Nemesis 2 на MSX). В этом посте описывается процесс и мой опыт использования этих моделей для улучшения графики.
Читать: https://habr.com/ru/post/708906/
Initially Accessing Private Oracle Fusion Analytics Warehouse
This article describes how to access Private Oracle Fusion Analytics after it has been provisioned. It describes architectures, components and deployments with links to reference material
Read: https://blogs.oracle.com/analytics/post/initially-accessing-faw-with-private-endpoints
This article describes how to access Private Oracle Fusion Analytics after it has been provisioned. It describes architectures, components and deployments with links to reference material
Read: https://blogs.oracle.com/analytics/post/initially-accessing-faw-with-private-endpoints
Oracle
Initially Accessing Private Fusion Analytics
Initially Accessing Private Fusion Analytics: Architecture, Components and Links to Reference Material
Как опенсорсные инструменты замедляют разработку моделей для анализа медицинских снимков
Существует множество опенсорсного ПО и инструментов для проектов компьютерного зрения и машинного обучения в сфере медицинских визуализаций.
Иногда может быть выгодно использовать опенсорсные инструменты при тестировании и обучении модели ML на массивах данных медицинских снимков. Вы можете экономить деньги, а многие инструменты, например, 3DSlicer и ITK-Snap, предназначены специально для аннотирования медицинских снимков и обучения моделей ML на массивах данных из сферы здравоохранения.
В здравоохранении критически важны качество массива данных и эффективность инструментов, используемых для аннотирования и обучения моделей ML. Это может стать вопросом жизни и смерти для пациентов, ведь для их диагностирования медицинским специалистам и врачам нужны максимально точные результаты моделей компьютерного зрения и машинного обучения.
Как известно командам клиницистов и обработки данных, слои данных в медицинских снимках сложны и детализированы. Для выполнения работы вам нужны подходящие инструменты. Применение неверного инструмента, например, опенсорсного приложения для аннотирования, может негативно повлиять на разработку модели.
В этой статье мы расскажем об основных опенсорсных инструментах для аннотирования медицинских снимков, сценариях применения таких инструментов и о том, как они препятствуют развитию вашего проекта. Мы перечислим те возможности инструмента аннотирования, которые помогут вам преодолеть эти трудности, в том числе и функции, которые обеспечат нужные вам результаты.
Читать: https://habr.com/ru/post/707874/
Существует множество опенсорсного ПО и инструментов для проектов компьютерного зрения и машинного обучения в сфере медицинских визуализаций.
Иногда может быть выгодно использовать опенсорсные инструменты при тестировании и обучении модели ML на массивах данных медицинских снимков. Вы можете экономить деньги, а многие инструменты, например, 3DSlicer и ITK-Snap, предназначены специально для аннотирования медицинских снимков и обучения моделей ML на массивах данных из сферы здравоохранения.
В здравоохранении критически важны качество массива данных и эффективность инструментов, используемых для аннотирования и обучения моделей ML. Это может стать вопросом жизни и смерти для пациентов, ведь для их диагностирования медицинским специалистам и врачам нужны максимально точные результаты моделей компьютерного зрения и машинного обучения.
Как известно командам клиницистов и обработки данных, слои данных в медицинских снимках сложны и детализированы. Для выполнения работы вам нужны подходящие инструменты. Применение неверного инструмента, например, опенсорсного приложения для аннотирования, может негативно повлиять на разработку модели.
В этой статье мы расскажем об основных опенсорсных инструментах для аннотирования медицинских снимков, сценариях применения таких инструментов и о том, как они препятствуют развитию вашего проекта. Мы перечислим те возможности инструмента аннотирования, которые помогут вам преодолеть эти трудности, в том числе и функции, которые обеспечат нужные вам результаты.
Читать: https://habr.com/ru/post/707874/
👍1
SQL за 2 месяца. Подробный план обучения
То, что данные называют нефтью 21 века известно уже давно: на них учатся нейросети, их мгновенная обработка и передача сильно упростили нашу жизнь, и одной из самых распространенных структур хранения данных является реляционная. Именно с ней знакомы большинство разработчиков и, скорее всего, знания как с ней работать вам тоже понадобятся.
Основным инструментом для взаимодействия с реляционными БД является структурированный язык запросов или же SQL.
Читать: https://habr.com/ru/post/709116/
То, что данные называют нефтью 21 века известно уже давно: на них учатся нейросети, их мгновенная обработка и передача сильно упростили нашу жизнь, и одной из самых распространенных структур хранения данных является реляционная. Именно с ней знакомы большинство разработчиков и, скорее всего, знания как с ней работать вам тоже понадобятся.
Основным инструментом для взаимодействия с реляционными БД является структурированный язык запросов или же SQL.
Читать: https://habr.com/ru/post/709116/
👍3
How to Build a People Analytics Foundation to Create a Healthy, High-performing Company that Scales
People Analytics contributes to healthy, high-performing, scalable companies through rich insights about the most crucial element - people.
Read: https://blogs.oracle.com/analytics/post/how-to-build-a-people-analytics-foundation-to-create-a-healthy-high-performing-company-that-scales
People Analytics contributes to healthy, high-performing, scalable companies through rich insights about the most crucial element - people.
Read: https://blogs.oracle.com/analytics/post/how-to-build-a-people-analytics-foundation-to-create-a-healthy-high-performing-company-that-scales
Oracle
How to Build a People Analytics Foundation to Create a Healthy, High-performing Company that Scales
People Analytics contributes to healthy, high-performing, scalable companies through rich insights about the most crucial element - people.
Enhance Oracle Analytics with a tiled web map background
Enhance your workbooks with additional tiled web map backgrounds such as Mapbox, Esri, Stamen and others.
Read: https://blogs.oracle.com/analytics/post/enhance-oracle-analytics-with-tiled-web-map-background
Enhance your workbooks with additional tiled web map backgrounds such as Mapbox, Esri, Stamen and others.
Read: https://blogs.oracle.com/analytics/post/enhance-oracle-analytics-with-tiled-web-map-background
Oracle
Enhance Oracle Analytics with tiled web map background
Enhance your workbooks with additional tiled web map background like Mapbox, Esri, Stamen and others!
Системы для работы с данными: зачем нужны и как их построить
Рассказываем, как построить качественную инфраструктуру для работы с данными, какие нужны специалисты и как выйти с решением на рынок.
Читать: «Системы для работы с данными: зачем нужны и как их построить»
Рассказываем, как построить качественную инфраструктуру для работы с данными, какие нужны специалисты и как выйти с решением на рынок.
Читать: «Системы для работы с данными: зачем нужны и как их построить»
👍1
Best Practices for Initialization Blocks and Usage Tracking in Oracle Analytics
This article describes best practices for initialization blocks and usage tracking in Oracle Analytics. It's part of a series of best practices for Oracle Analytics.
Read: https://blogs.oracle.com/analytics/post/dc-oracle-analytics-best-practices-initialization-blocks-and-usage-tracking
This article describes best practices for initialization blocks and usage tracking in Oracle Analytics. It's part of a series of best practices for Oracle Analytics.
Read: https://blogs.oracle.com/analytics/post/dc-oracle-analytics-best-practices-initialization-blocks-and-usage-tracking
Oracle
Best Practices for Initialization Blocks and Usage Tracking in Oracle Analytics
This article describes best practices for initialization blocks and usage tracking in Oracle Analytics. It's part of a series of best practices for Oracle Analytics.
Extending Fusion Analytics - Part 1 of 4
Welcome to part one, "Starting your Fusion Analytics extensibility journey", of this four-part blog series sharing insight into exploiting Fusion data with Fusion Analytics (FAW) and how to utilise FAW’s power to deliver greater insights beyond those based on Fusion data alone. We will follow an analytics path that many Fusion customers take, exploring the various scenarios they encounter and evaluate on their analytics journey.
Read: https://blogs.oracle.com/analytics/post/extending-fusion-analytics---part-1
Welcome to part one, "Starting your Fusion Analytics extensibility journey", of this four-part blog series sharing insight into exploiting Fusion data with Fusion Analytics (FAW) and how to utilise FAW’s power to deliver greater insights beyond those based on Fusion data alone. We will follow an analytics path that many Fusion customers take, exploring the various scenarios they encounter and evaluate on their analytics journey.
Read: https://blogs.oracle.com/analytics/post/extending-fusion-analytics---part-1
The traffic accidents study exposes the lamentable state of Covid-19 science
Read: https://junkcharts.typepad.com/numbersruleyourworld/2023/01/the-traffic-accidents-study-exposes-the-terrible-state-of-covid-19-science.html
Read: https://junkcharts.typepad.com/numbersruleyourworld/2023/01/the-traffic-accidents-study-exposes-the-terrible-state-of-covid-19-science.html