DATApedia | Data science
3.54K subscribers
166 photos
89 videos
2 files
811 links
Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи.

Сотрудничество: @Seyfme
Download Telegram
​​Midjourney до сих пор не умеет рисовать пальцы, но научилась писать тексты: обзор шестой версии модели

В этой статье рассказано о том, что нового в Midjourney v6 и почему она лучше предшественников. Также разобраны примеры генераций и протестированы новые функции.

Перейти к статье | DATApedia | #DS_AI
​​Подготовка к собеседованию на позицию Data Scientist. Часть 1: Live Coding

В данной статье разберемся что такое live coding интервью и как к нему готовиться. Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам.

Перейти к статье | DATApedia
​​Бесплатные курсы для изучения искусственного интеллекта в 2024 году

В статье каждый, кого интересует область ИИ, может найти что-то для себя, от простых вводных материалов, в которых рассказывается что такое ИИ, до практических курсов с формулами и кодом.

Перейти кстатье | DATApedia | #DS_AI
🔥32👍1
😁14🤩3
​​Конец программирования, как мы его знаем, или Что нас ждёт с LLM

«Большие языковые модели и конец программирования». Под таким заголовком в прошлом году прошла серия лекций доктора Уэлша, профессора информатики в Гарварде. В этом посте мы раскроем основные тезисы выступления, и в заключение попробуем взглянуть на будущее так же воодушевлённо, как автор.

Перейти к статье | DATApedia | #DS_AI
👍1
АБ тесты и подводные камни при их автоматизации

Статья обсуждает проблемы, связанные с автоматизацией A/B-тестирования. Здесь подчеркивается важность правильного выбора статистических критериев, равномерного деления на группы и исключения ненадежных критериев для достоверных результатов

Перейти к статье | BApedia
👍2
​​Типичные задачи аналитика данных. Часть 1. Упала метрика

Статья обсуждает типичные задачи, с которыми сталкиваются аналитики данных, включая оценку эффективности нововведений, проведение анализа при ухудшении метрик, выбор релевантных метрик для анализа, и методы статистического анализа данных для определения значимости изменений в метриках. Особое внимание уделяется использованию теста Стьюдента для сравнения средних значений и тесту Манна-Уитни для сравнения распределений.

Перейти к статье | DATApedia
​​Как мы научили YandexGPT пересказывать видео

Сегодня я расскажу про модель, которая быстро перескажет видео любой длины и покажет таймкоды для каждой части. Под катом — история о том, как мы смогли выйти за лимиты контекста модели и научить её пересказывать даже очень длинные видео.

Перейти к статье | DATApedia | #DS_AI
👍1
​​Азы больших языковых моделей и трансформеров: декодер

В этом материале мы поговорим об устройстве компонента‑декодера в системах машинного обучения, построенных по архитектуре «трансформер», уделив особое внимание отличию декодера от энкодера.

Перейти к статье | DATApedia
👍1
​​Что такое СУБД Greenplum? Зачем она нужна в больших проектах DWH? Чем отличается от ClickHouse?

В статье читайте о СУБД Greenplum и о том, в каких случаях строить хранилища на ее основе.

Перейти к статье | DATApedia
😱3😢1
​​Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python

В данной статье описан не только принцип работы популярных алгоритмов кластеризации от простых к более продвинутым, но а также представлены их упрощённые реализации с нуля на Python, отражающие основную идею. Помимо этого, в конце каждого раздела указаны дополнительные источники для более глубокого ознакомления.

Перейти к статье | DATApedia
👍3
​​Как AI помогает побороть монополию в спортивной рекламе и при чем тут GPU и выделенные серверы

Статья описывает, как использование искусственного интеллекта и облачных GPU-серверов помогает в борьбе с монополией в спортивной рекламе. Рассматривается технология внедрения виртуальной рекламы и интеграции цифрового контента в спортивные соревнования с использованием ИИ и AR-технологий. Проект PTF Lab разработал технологию для интеграции рекламы в видеопотоки спортивных мероприятий, обращаясь за облачными мощностями к компании HOSTKEY.

Перейти к статье | DATApedia | #DS_AI
​​Apache Flink: динамическое определение выходного топика в Kafka

В данной статье обсуждается возможность динамического определения топика в Kafka для каждого события, куда его нужно записать.

Перейти к статье | DATApedia
👍3
​​Голодные игры начались. Развитие ИИ приведёт к естественному отбору населения

Статья обсуждает влияние развития искусственного интеллекта на будущее профессий, особенно программистов. Поднимаются вопросы о возможной автоматизации работы, сокращении рабочих мест и необходимости адаптации к изменениям, предполагая, что часть работы программистов может быть заменена ИИ в будущем

Перейти к статье | DATApedia
This media is not supported in your browser
VIEW IN TELEGRAM
Главное делать вид, что ничего не происходит)
😁8
​​Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 2: Классическое машинное обучение

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по классическому машинному обучению.

Перейти к статье | DATApedia
👍1
​​Теория вероятностей в разработке: где применяется и что можно изучить для более глубокого понимания темы

Часто приходится слышать, что математика, включая статистику и теорию вероятностей с комбинаторикой, не слишком нужна разработчику. Что ж, в некоторых случаях это действительно так. Но для представителей ряда направлений всё это нужно. Кому именно требуется теория вероятностей с сопутствующими дисциплинами и зачем? Об этом поговорим в статье

Перейти к статье | DATApedia
1
​​Как провести unit-тестирование Flink-операторов: TestHarness

В данной статье мы рассмотрим, как протестировать stateless- и stateful-операторы Flink с помощью абстракций TestHarness.

Перейти к статье | Bapedia
И восстали машины из пепла ядерного огня
🔥7😁2