Big data world – Telegram

Big data world

2.34K subscribers

412 photos

64 videos

18 files

1.25K links

Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime

Download Telegram

About

Blog

Apps

Platform

2.34K subscribers

Разница между алгоритмом и искусственным интеллектом Слова «искусственный интеллект» (ИИ) и алгоритмы чаще всего используются неправильно. Часто используются как взаимозаменяемые, хотя и не должны. Это приводит к ненужной путанице. В этой статье давайте разберемся, что такое ИИ и алгоритмы, и в чем их разница. https://clck.ru/W73Ny Как отличить себя от сотен других кандидатов в области науки о данных? Несколько простых (и не очень простых) способов доказать работодателям, что ваши навыки и отношение ставят вас в более высокую категорию. https://clck.ru/W7cxn

Datasciencecentral

Difference Between Algorithm and Artificial Intelligence

By 2035 AI could boost average profitability rates by 38 percent and lead to an economic increase of $14 Trillion.

Accenture

The words Artificial Intellige…

352 views12:44

This media is not supported in your browser

VIEW IN TELEGRAM

5 лучших книг по машинному обучению для начинающих Чтение книг важно, потому что оно дает бесконечные знания. Если вы планируете стать специалистом по анализу данных или инженером по машинному обучению, чтение книг по машинному обучению поможет вам получить знания и навыки, необходимые в этой области. https://clck.ru/W7dhJ

414 views07:08

Выбор функций для машинного обучения Желательно уменьшить количество входных переменных как для уменьшения вычислительных затрат на моделирование, так и, в некоторых случаях, для повышения производительности модели. https://clck.ru/W8iP8

Machine Learning Mastery

How to Choose a Feature Selection Method For Machine Learning - Machine Learning Mastery

Feature selection is the process of reducing the number of input variables when developing a predictive model.

It is desirable to reduce the number of input variables to both reduce the computational cost of modeling and, in some cases, to improve the…

453 views08:16

Распознавание речевых эмоций с помощью сверточных нейронных сетей Изучение человеческих эмоций всегда было увлекательным занятием для dаtа sсientists. В последнее время я работаю над экспериментальным проектом «Знание эмоций» (SER), чтобы изучить его потенциальные возможности. https://clck.ru/W9F6d Генераторы и итераторы Python за 2 минуты для новичков в области науки о данных Мы продолжаем нашу серию « Python: понимание за 2 минуты », в которой мы рассмотрим темы среднего уровня, которые также часто задают в собеседованиях по Python и Data Science. В прошлый раз мы говорили о важной теме под названием * args и ** kwargs за 2 минуты . Эта серия предназначена для начинающих специалистов по обработке данных, которые хотят сделать «следующий шаг» в Python после изучения основ. Сегодня мы продолжим обсуждение еще одной важной темой под названием «Генератор и итератор». https://clck.ru/WARmT

Analytics Vidhya

Speech Emotions Recognition with Convolutional Neural Networks -

In this article, we are going to explain a project on how to perform speech emotions recognition using convolutional neural network.

581 views12:36

Объяснение искусственного интеллекта и машинного обучения Искусственный интеллект - это быстро меняющаяся область, и уследить за терминами и сокращениями может быть непросто. Эта страница с объяснениями искусственного интеллекта и машинного обучения - ваш начальный путеводитель по новейшему жаргону. https://clck.ru/WASpP

AI explained | Machine learning explained | Glossary

This artificial intelligence (AI) and machine learning explainer page is your starter guide to the latest lingo.

657 views08:02

Инструменты для анализа данных: понимание мультивселенной В мультивселенной науки о данных возможности инструментов продолжают расширяться и развиваться. Хотя, безусловно, есть инженеры и ученые, которые могут закрепиться в том или ином лагере (например, лагерь R против Python или SAS против MATLAB), наблюдается растущая тенденция к распространению инструментов науки о данных. https://clck.ru/WBkNg

Data Science Tools: Understanding the Multiverse

Data scientists have a wide array of data science tools to choose from to do their jobs, both open source and proprietary, as well as gui based or code based. Organizations should choose tools that ca

765 views11:44

23 лучших общедоступных набора данных для практики машинного обучения https://clck.ru/WF9Fk Как выбрать функции потерь при обучении нейронных сетей с глубоким обучением https://clck.ru/WF9KW Глубокое понимание дискриминативных и генеративных моделей в машинном обучении https://clck.ru/WFJY6 Пошаговое руководство по классификации изображений в пользовательских наборах данных https://clck.ru/WFJg2

Top 23 Best Public Datasets for Practicing Machine Learning

Find out which public real-world datasets are best for practicing applied machine learning, deep learning and data science.

642 views12:39

Поиск лучшего языка программирования для науки о данных
Язык программирования - это практически основа науки о данных, и в связи с развитием современных технологий у нас есть много доступных языков. Но вопрос в том, какой из них больше всего подходит для специалиста по данным. В настоящее время группа языков программирования, которые используют специалисты по данным, - это Python, Julia и R. Все эти языки имеют свои уникальные особенности, а также области знаний. Например, экосистема Python загружена библиотеками, инструментами и приложениями, которые делают работу по научным вычислениям и анализу данных быстрой и удобной, но Джулия стремится дать ученым и аналитикам данных не только быструю и удобную разработку, но и невероятную скорость выполнения. С другой стороны, язык R, как никакой другой, увеличивает скорость статистических вычислений.
Преимущества Python
Выпущенный в 1991 году Python - это язык программирования, который используется для веб-разработки, разработки программного обеспечения, математики и систематического написания сценариев. В Python доступ к первому элементу массива осуществляется с помощью нуля, например string [0] в Python для первого символа в строке. Это помогает в использовании более широкой аудиторией с укоренившимися навыками программирования. У Python более быстрый запуск, что позволяет ему опережать Джулию и Р. Помимо улучшений интерпретатора Python (включая улучшения многоядерной и параллельной обработки), Python стало легче ускорять. Проект mypyc переводит Python с аннотациями типов на родной C, гораздо менее громоздко, чем Cython.
Преимущества Julia
Julia, впервые появившаяся в 2012 году, представляет собой высокоуровневый высокопроизводительный динамический язык программирования. Хотя это язык общего назначения и может использоваться для написания любых приложений, многие из его функций хорошо подходят для численного анализа и вычислений. JIT-компиляция и объявления типов Джулии означают, что она может на порядки превзойти «чистый» неоптимизированный Python. Python можно сделать быстрее с помощью внешних библиотек, сторонних JIT-компиляторов (PyPy) и оптимизации с помощью таких инструментов, как Cython, но Julia спроектирована так, чтобы быть быстрее сразу. Основная целевая аудитория Джулии - пользователи языков и сред для научных вычислений, таких как Matlab, R, Mathematica и Octave. Синтаксис Джулии для математических операций больше похож на способ написания математических формул за пределами компьютерного мира, что упрощает понимание непрограммистами. Flux - это библиотека машинного обучения для Джулии, в которой есть множество существующих шаблонов моделей для распространенных случаев использования. Поскольку он полностью написан на Julia, он может быть изменен по мере необходимости пользователем, и он использует встроенную JIT-компиляцию Julia для оптимизации проектов изнутри.
Преимущества R
Впервые выпущенный в 1993 году, R - это язык программирования и бесплатная программная среда для статистических вычислений и графики, поддерживаемая R Core Team и R Foundation for Statistical Computing. Язык R широко используется статистиками и специалистами по добыче данных для разработки статистического программного обеспечения и анализа данных. R доступен по лицензии с открытым исходным кодом, что означает, что любой может загрузить и изменить код. Эту свободу часто называют «свободой слова». R также доступен бесплатно. Кто угодно может получить доступ к исходному коду, изменить его и улучшить. В результате многие отличные программисты внесли улучшения и исправления в код R. По этой причине R очень стабилен и надежен. R выполняет широкий спектр функций, таких как обработка данных, статистическое моделирование и графика. Одно действительно большое преимущество R, однако это его расширяемость. Разработчики могут легко писать свое программное обеспечение и распространять его в виде дополнительных пакетов.

703 views08:55

Беседы о Data Science

https://www.youtube.com/playlist?list=PLVlY_7IJCMJcym_TSmUIHvjplq6OjiFx9

674 views06:23

6 классных библиотек Python для машинного обучения Python - неотъемлемая часть машинного обучения, а библиотеки упрощают нашу жизнь. Недавно я наткнулся на 6 замечательных библиотек, работая над своими проектами машинного обучения. Они помогли мне сэкономить много времени, и я собираюсь обсудить их в этом блоге.
https://clck.ru/WKVwE

6 Cool Python Libraries That I Came Across Recently

Awesome Python libraries for Machine Learning

742 viewsedited 08:17

Руководство по нейронным сетям для новичков (Часть-1) Это первая из трех статей в серии, в которой объясняются некоторые из основных теорий, которые вы должны знать при реализации нейронной сети. В следующих блогах вы узнаете, как применить изученную теорию для кодирования вашей пользовательской модели нейронной сети. Было приложено максимум усилий, чтобы сделать эту статью интерактивной и простой, чтобы ее мог понять каждый. Надеюсь, вам это понравится. Удачного обучения !! https://clck.ru/WM7a3 ColabCode: развертывание моделей машинного обучения из Google Colab Впервые в ColabCode? Узнайте, как использовать его для запуска VS Code Server, Jupyter Lab или FastAPI. Google colab - самая удобная онлайн-среда IDE для энтузиастов Python и Data Science. Выпущенный в 2017 году для широкой публики, изначально это был внутренний проект, используемый исследовательской группой Google для совместной работы над различными проектами искусственного интеллекта. https://clck.ru/WMRJK

Analytics Vidhya

Neural Networks | Beginner's Guide to Neural Networks (Part 1)

Neural networks has become a buzzword these days because of their ability to do an amazing amount of work in various domains.

847 views11:01

17 статистических проверок гипотез на Python (шпаргалка) Краткое справочное руководство по 17 тестам статистических гипотез, которые вам нужны в
прикладном машинном обучении, с примером кода на Python. https://clck.ru/WPErn

698 views06:31

Mava: масштабируемая исследовательская платформа для многоагентного обучения

Платформа интегрируется с популярными средами MARL, такими как PettingZoo, SMAC, RoboCup, OpenSpiel, Flatland, а также с несколькими пользовательскими средами.

Mava включает распределенные реализации мультиагентных версий ddpg, d4pg, dqn, ppo, а также DIAL, VDN и QMIX.
ArXiV: https://arxiv.org/pdf/2107.01460.pdf
GitHub: https://github.com/instadeepai/Mava

GitHub - instadeepai/Mava: 🦁 A research-friendly codebase for fast experimentation of multi-agent reinforcement learning in JAX

🦁 A research-friendly codebase for fast experimentation of multi-agent reinforcement learning in JAX - instadeepai/Mava

643 viewsedited 08:27

Прогноз цен на автомобили - машинное обучение против глубокого обучения. В этой статье мы будем прогнозировать цены на подержанные автомобили. Мы будем создавать различные модели машинного обучения и модели глубокого обучения с разными архитектурами. В конце мы увидим, как модели машинного обучения работают по сравнению с моделями глубокого обучения.
https://clck.ru/WS6o6 Проверка гипотез стала проще для новичков в области науки о данных!. В этой статье мы будем изучать теорию, типы проверки гипотез. И мы возьмем примерные постановки задач и решим их с помощью проверки гипотез.
https://clck.ru/WS6oA
Не только для глубокого обучения: как графические процессоры ускоряют науку о данных и аналитику данных. Успех современных систем искусственного интеллекта / машинного обучения в значительной степени зависел от их способности обрабатывать огромные объемы необработанных данных параллельно с использованием оптимизированного для задач оборудования. Можем ли мы использовать возможности графического процессора и распределенных вычислений для регулярной обработки данных?
https://clck.ru/WS6pb
5 ошибок, которых я хотел бы избежать в моей карьере в области науки о данных. Каждый совершает ошибки, и это может быть хорошо, если со временем они приводят к обучению и совершенствованию. Но мы также можем сначала попытаться поучиться у других, чтобы ускорить наш личностный рост. Для начала рассмотрите эти уроки, усвоенные на собственном горьком опыте, чтобы вам не приходилось делать это.
https://clck.ru/WS6pd

Analytics Vidhya

Car Price Prediction - Machine Learning vs Deep Learning

In this article, we will perform car price prediction. For that we will build various ML and DL models with different architectures.

708 views08:19

Мягкое введение в процедуру градиентного спуска Процедура градиентного спуска - метод, который имеет первостепенное значение в машинном обучении. Он также используется при обучении нейронных сетей и архитектур глубокого обучения. https://clck.ru/WUCaW Основные тенденции развития науки о данных в 2021 году https://clck.ru/WUCfF

Machine Learning Mastery

A Gentle Introduction To Gradient Descent Procedure - Machine Learning Mastery

Gradient descent procedure is a method that holds paramount importance in machine learning. It is often used for minimizing error functions in classification and regression problems. It is also used in training neural networks, and deep learning architectures.…

698 views11:14

Создание системы рекомендаций рецептов
Использование Word2Vec, Scikit-Learn и Streamlit В предыдущем сообщении блога ( Создание API рекомендаций рецептов с использованием Scikit-Learn, N LTK, Docker, Flask и Heroku ) я писал о том, как я приступил к созданию системы рекомендаций рецептов. Подводя итог: сначала я очистил и проанализировал ингредиенты для каждого рецепта, затем я закодировал список ингредиентов каждого рецепта с помощью TF-IDF. Отсюда я применил функцию подобия, чтобы найти сходство между ингредиентами для известных рецептов и ингредиентами, указанными конечным пользователем. Наконец, мы можем получить самые рекомендуемые рецепты в соответствии с оценкой сходства. https://clck.ru/WVDCc Все о машинном обучении с открытым исходным кодом
Концепции машинного обучения с открытым исходным кодом Этот проект был создан для тех, кто интересуется машинным обучением. Он содержит объяснения общих концепций машинного обучения, таких как контролируемое обучение, неконтролируемое обучение, обучение с подкреплением, временные ряды, компьютерное зрение, НЛП и т. Д. https://clck.ru/WVDHm Определение возраста и пола с помощью глубокого обучения Основная цель этой статьи - определить возраст и пол по заданному набору данных. Мы будем использовать простые методы Python и Keras для определения возраста и пола. https://clck.ru/WVDRF

Building a Recipe Recommendation API using Scikit-Learn, NLTK, Docker, Flask, and Heroku

The journey to my first ‘full-stack’ data science project (part 2) — building and deployment

749 views08:40

Запускайте модели машинного обучения в своем браузере с помощью TensorFlow.js (ReactJS) TensorFlow.js (или, короче, tfjs) - это библиотека, которая позволяет создавать, обучать и использовать обученные модели машинного обучения в Javascript!
Основное внимание уделяется тому, чтобы позволить разработчикам Javascript войти в мир машинного обучения и глубокого обучения, создав классные и интеллектуальные веб-приложения, которые могут работать в любом крупном браузере или на серверах Node.js с использованием Javascript. https://clck.ru/WWkuB Что такое нейронный поиск? TL; DR: нейронный поиск - это новый подход к поиску информации с помощью нейронных сетей. Традиционные методы поиска обычно означали написание правил для «понимания» искомых данных и получения наилучших результатов. Но с нейронным поиском разработчикам не нужно ломать голову над этими правилами; Система сама изучает правила и по мере продвижения становится лучше. Даже разработчики, не знакомые с машинным обучением, могут быстро создать поисковую систему, используя фреймворки с открытым исходным кодом, такие как Jina . https://clck.ru/WTscW Топологии Data Mesh Рекомендации по проектированию для построения архитектуры сетки данных https://clck.ru/WVDcv Приложениям машинного обучения требуется меньше данных, чем предполагалось Объединенная группа исследователей из Университета Британской Колумбии и Университета Альберты обнаружила, что по крайней мере некоторые приложения машинного обучения могут учиться на гораздо меньшем количестве примеров, чем предполагалось. В своей статье, опубликованной в журнале Nature Machine Intelligence , группа описывает тестирование, которое они проводили с приложениями машинного обучения, созданными для предсказания определенных типов молекулярных структур. https://clck.ru/WViHa

Run Machine Learning models in your browser with TensorFlow.js (ReactJS)

TensorFlow.js (or, in short, tfjs) is a library that lets you create, train, and use trained Machine...

716 views07:35

23 распространенных вопроса на собеседовании по науке о данных для начинающих Во время интервью интервьюер может задавать вопросы по различным темам науки о данных, таким как статистика, программирование, анализ данных, предварительная обработка данных и моделирование. Ваши навыки будут проверены, и вам нужно подготовиться, если вы хотите сделать карьеру в области науки о данных. https://clck.ru/WWpwq

23 Common Data Science Interview Questions for Beginners | Hacker Noon

In 2012, Harvard Business Review called data scientists the sexiest job of the 21st century. However, correctly answering data science interview questions to get a job as a data scientist is very tricky.

800 views07:55

🖥Нежное введение в частные производные и векторы градиента Частные производные и векторы градиента очень часто используются в алгоритмах машинного обучения для поиска минимума или максимума функции. https://clck.ru/WYnHV 🖥 Использование графических процессоров для обработки и анализа данных. Как графические процессоры ускоряют науку о данных и аналитику данных https://clck.ru/WYfqG
🖥Визуальное понимание модели глубокого обучения. JittorVis - это библиотека с открытым исходным кодом для понимания внутренней работы моделей
https://clck.ru/WYfqz
🖥10 ошибок при обучении модели машинного обучения. В этой статье я расскажу о десяти смертных грехах во время обучения модели машинного обучения - это самые распространенные, а также их легче всего упустить из виду.
https://clck.ru/WXsZH

MachineLearningMastery.com

A Gentle Introduction To Partial Derivatives and Gradient Vectors - MachineLearningMastery.com

Partial derivatives and gradient vectors are used very often in machine learning algorithms for finding the minimum or maximum of a function. Gradient vectors are used in the training of neural networks, logistic regression, and many other classification…

773 views09:58

🖥 Как наука о данных и машинное обучение работают для противодействия кибератакам Все мы знаем об ужасной кибератаке, в результате которой всего за несколько дней в мае 2017 года было уничтожено более 200 000 систем в 150 странах. Оно было обнаружено Агентством национальной безопасности (АНБ) и получило прозвище «WannaCry», использовавшее уязвимость и кража важных ресурсов перед распространением в сети.

После успешного доступа к компьютеру он зашифровал содержимое машины и сделал его нечитаемым. Затем жертвы нападения были проинформированы, что им необходимо приобрести специальное программное обеспечение для дешифрования, чтобы вернуть украденные материалы. Кроме того, злоумышленники продавали это программное обеспечение. https://clck.ru/WavLk 🖥 10 лучших статей по большим данным за июнь '21, которые стоит прочитать сейчас Просмотрите 10 самых популярных статей из области Big Data, посвященными Kafka, полезным запросам в Elasticsearch, объединениям PySpark, командам оболочки Hadoop и многому другому! https://clck.ru/Wamb8

Data Science Central

How Data Science And Machine Learning Works To Counter Cyber Attacks

We are all aware of the heinous cyber-attack that took down more than 200,000 systems in 150 countries in only a few days in May 2017. This was found by the National Security Agency (NSA) and was nicknamed “WannaCry,” which exploited a vulnerability and stole…

866 views08:46

🖥Ответы на 30 наиболее часто задаваемых вопросов по машинному обучению.
В машинном обучении всегда есть чему поучиться. Независимо от того, являетесь ли вы новичком в этой области или опытным специалистом и готовы к переподготовке, понимание этих ключевых концепций поможет вам отточить свои навыки в правильном направлении. https://clck.ru/WchVY

30 Most Asked Machine Learning Questions Answered - KDnuggets

There is always a lot to learn in machine learning. Whether you are new to the field or a seasoned practitioner and ready for a refresher, understanding these key concepts will keep your skills honed in the right direction.

907 views08:06