DATApedia | Data science
3.54K subscribers
166 photos
89 videos
2 files
811 links
Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи.

Сотрудничество: @Seyfme
Download Telegram
​​Ансамблевое обучение для самых маленьких

В данной статье рассматривается несколько популярных методов ансамблевого обучения. Автор постарался облегчить текст насколько это возможно)

Читать | DATApedia | #DS_AI
🔥1
​​Заставляем машинное обучение делать «брррр» через понимание базовых принципов компьютерных систем

Читать | DATApedia | #DS_AI
​​Большие языковые модели гораздо линейнее, чем мы думали

Автор рассказывает об удивительной линейности языковых моделей. Линейность считается свойством самых слабых моделей, ведь они могут решать только простейшие задачи, для которых зачастую и ML-то особо не нужен.

Читать | DATApedia | #DS_AI
👍1
​​Машинное обучение: мост между бизнесом и Data Science

Цель этой статьи — практические ответы, а не подготовка видения или продвижение тренда. Мы поговорим о зонтичном термине data science, о взаимосвязи его отраслей, основных задачах, которые может решать машинное обучение, а также о том, как эти задачи можно перевести на язык бизнеса. Также мы обсудим основные решения, которые нужно принять при найме специалистов, и выделим сложности, которые нужно учесть заранее.

Читать | DATApedia
​​Вопросы и задачи по SQL на собеседованиях 2024: готовьтесь эффективно

В 2024 году вопросы и тестовые задания на собеседованиях не потеряли своей актуальности и продолжают вызывать огромный интерес у соискателей. Если вы сейчас погружены в процесс прохождения интервью, то наверняка сталкиваетесь с множеством непростых, но захватывающих задач.

Читать | DATApedia
👍1
​​Apache Airflow: преимущества и недостатки

Одним из популярных оркестратором задач является Apache Airflow. Он, как и все инструменты, имеет свои преимущества и недостатки, о которых пойдет речь в данной статье

Читать | DATApedia
​​Миграция Big Data на практике: как мы готовили напильники

Сейчас многие сталкиваются с похожими проблемами импортозамещения продуктов. Так что авторы решили написать эту статью, чтобы подсказать решения и предупредить о трудностях.

Читать | DATApedia
👍3
​​Что такое Data science? Простыми словами о сложном

Впервые услышав о Data science, вам, скорее всего покажется это чем-то невероятно сложным и недоступным. Но стоит лишь немного разобраться в этой теме, вы откроете для себя эту дисциплину совершенно с другой стороны.

Перейти к статье | DATApedia
👍1
​​Облегчают анализ данных: 7 бесплатных сервисов на базе ИИ

В этой статье представлены инструменты на основе искусственного интеллекта, которые облегчают анализ данных. По мнению разработчиков данных сервисов, они подходят не только для новичков в анализе данных, но и для профессионалов. А также в качестве так называемой “аналитики самообслуживания”.

Перейти к статье | DATApedia | #DS_AI
​​Разработка системы отчётности и BI: вопросы производительности

Мы в компании «Магнит» много лет строим и эксплуатируем корпоративное хранилище данных и занимаемся различными задачами, связанными с этим. В частности, разрабатываем инструмент для конечного пользователя – систему отчётности и BI, о которой в статье речь и пойдёт.

Читать | BApedia
​​Enbeddrus — обучение независящей от языка эмбеддинг-модели

Сегодня я хочу рассказать вам историю о том, как я обучил простую и компактную независящую от языка (language agnostic) модель-эмбеддер, которая умеет работать с техническими текстами о PHP и способна извлекать схожие эмбеддинги для параллельных текстов на английском и русском языках.

Читать | DATApedia | #DS_AI
👍1
​​Рынок вакансий для аналитиков данных в 2024 году

Автор статьи проанализировала 1 239 вакансий аналитиков данных, размещённых на сайте hh.ru с февраля по май 2024 года включительно, и делится с вами полученными результатами.

Читать | DATApedia
👍3
​​Книга: «Антипаттерны SQL. Как избежать ловушек при работе с базами данных»

Язык SQL необходим для работы со структурированными данными. Программисты, прекрасно знающие свой любимый язык (Java, Python или Go), не могут разбираться во всем, и часто не являются экспертами в SQL. Это приводит к появлению антипаттернов — решений, которые на первый взгляд кажутся правильными, но со временем создают все больше проблем.

Читать | DATApedia
This media is not supported in your browser
VIEW IN TELEGRAM
Как выглядит типичный тимлид на созвоне:
😁13
​​Простыми словами про метрики в ИИ. Регрессия. MSE, RMSE, MAE, R-квадрат, MAPE

Читать | DATApedia | #DS_AI
👍5
​​Революционный подход к нейросетям: рассказываем про KAN (Kolmogorov-Arnold Networks)

В основе этой новаторской концепции лежит теорема представления Колмогорова-Арнольда, математическая теория, разработанная Владимиром Арнольдом и Андреем Колмогоровым. Причем достаточно давно, вот только исследователи разработали архитектуру и небольшую библиотеку под работу недавно.

Читать | DATApedia
​​Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

В этой статье я расскажу про свой опыт решения рабочей задачи — анализ отзывов пользователей о компании. Мы разберем возможные ошибки и посмотрим на пример кода и реальных данных. Гайд будет полезен всем, у кого нет большого опыта в анализе данных или работе с LLM через API.

Читать | DATApedia | #DS_AI
​​Автопереобучение моделей в Production

В этой статье мы рассмотрим процесс автоматического переобучения моделей ML в продакшене, используя инструменты MLOps. Обсудим интеграцию таких инструментов, как AirFlow и Spark, с CI/CD пайплайнами, а также создание конфигурационного модуля, позволяющего разработчикам сосредоточиться на моделях, не углубляясь в инфраструктурные детали.

Читать | DATApedia
👍5