Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
190 проектов Python с исходным кодом
______

В этой статье я познакомлю вас с более чем 190 проектами Python с исходным кодом.
https://shly.link/wdooL
Пять убийственных методов оптимизации, которые должен знать каждый пользователь Pandas
______
Шаг к оптимизации времени выполнения анализа данных
https://shly.link/z03bm
Vacancies for Data Scientists are already in the channel!

Subscribe not to miss new ones.
👍1
7 шагов для успешного проекта глубокого обучения
______
Руководство по разработке эффективных проектов глубокого обучения
https://shly.link/mdms0s3
✏️Обзор и применение больших языковых моделей (LLM)
______

https://shly.link/NETr1

✏️Трансформеры в компьютерном зрении: архитектуры ViT, советы, хитрости и улучшения
______

https://shly.link/iZBom

✏️Модели трансформеров: введение и каталог
______

https://shly.link/tM2jM
Приглашаем всех желающих бесплатно онлайн получить востребованную техническую специальность. За 2-3 месяца вы получите надежную базу теории и практики, гарантирующую быстрый карьерный старт.

Обучение проводит официальный партнер Томского государственного университета. Выдается удостоверение о повышении квалификации или диплом о проф. переподготовке. Обязательно наличие высшего или среднего профессионального образования.

Наши программы:

— Системный аналитик

— Аналитик данных

— Разработчик сайтов на Тильде

— Дизайнер мобильных приложений

— Тестировщик ПО

и другие. Полный список: https://bit.do/fUWyz

Бесплатно обучиться и получить помощь в трудоустройстве могут:

— неработающие выпускники и студенты последнего курса

— женщины в декрете и неработающие мамы детей до 7 лет

— безработные

— граждане 50+

— граждане под риском увольнения / сокращения

Регистрируйтесь на курс прямо сейчас!

https://bit.do/fUWyz
👍1
Как я построил модель машинного обучения для автоматизированного переобучения
______
Руководство по развертыванию системы, которая постоянно собирает данные и непрерывно переобучает модели машинного обучения.
https://shly.link/b7ztN
Анализ главных компонентов (PCA) с нуля
______

Как выполнить шаг за шагом PCA, используя R и основные функции и операции линейной алгебры.

https://shly.link/DHH7F
Fairseq(-py) — это набор инструментов для моделирования последовательностей, который позволяет исследователям и разработчикам обучать пользовательские модели переводу, резюмированию, языковому моделированию и другим задачам генерации текста.

https://shly.link/ghX94d
This media is not supported in your browser
VIEW IN TELEGRAM
Очень долговременная и точная сегментация видеообъектов; код и демонстрация доступны

https://shly.link/gh71Sp
Краткая хронология глубокого обучения для табличных данных
______

Время от времени я делюсь исследовательскими работами, предлагающими новые подходы к глубокому обучению для табличных данных, в социальных сетях, что обычно является отличным началом обсуждения. Часто люди просят о дополнительных методах или контрпримерах. Итак, в этом коротком посте я стремлюсь кратко обобщить основные работы по глубокому табличному обучению, о которых я в настоящее время знаю.
https://shly.link/2ZRSP
✏️PaddleSpeech

это набор инструментов с открытым исходным кодом на платформе PaddlePaddle для решения множества критических задач в области речи и аудио

https://github.com/PaddlePaddle/PaddleSpeech

✏️PyGOD

это библиотека Python для обнаружения выбросов на графике, которая включает более 10 новейших алгоритмов обнаружения на основе графов, таких как DOMINANT (SDM'19) и GUIDE (BigData'21).

https://github.com/pygod-team/pygod/
Хотите стать аналитиком, но не уверены, что вам подойдёт эта специальность? Сомневаетесь в своих силах и что сможете освоить материал?

У нас есть для вас решение.

В GeekBrains начинается курс для будущих аналитиков. За 7 дней вы погрузитесь в направление «Аналитика», пройдёте мастер-класс от ведущих специалистов и выберите себе специализацию.

Начните учиться бесплатно прямо сейчас вместе с GeekBrains. Переходите по ссылке, регистрируйтесь, обязательно заполняйте анкету и переходите сразу к обучению — https://clc.to/hzqpyg

Ждём вас на занятиях.
Генеративно-состязательные сети со сверхвысоким разрешением (SRGAN)

SRGAN достигают лучших результатов сверхвысокого разрешения изображения за счет объединения традиционных элементов GAN с рецептами, предназначенными для повышения визуальной производительности. Узнайте больше о них в этом руководстве!

https://pyimagesearch.com/2022/06/06/super-resolution-generative-adversarial-networks-srgan/
This media is not supported in your browser
VIEW IN TELEGRAM
Multiface: набор данных для нейрорендеринга лица
______

https://shly.link/ghcv2W
Автоматизированное тестирование в проектах машинного обучения [Лучшие практики для MLOps]
__________________________________

Автоматизированное тестирование в машинном обучении — очень полезный сегмент проекта машинного обучения, который может иметь некоторые долгосрочные последствия. Вероятно, недооцененный на ранних стадиях разработки, он привлекает внимание только на поздних стадиях, когда система начинает разваливаться из-за надоедливых ошибок, которые со временем только растут. Чтобы облегчить эти проблемы и уменьшить количество ошибок, рекомендуется добавить в проект несколько автоматических тестов.

В этой статье мы попробуем разобраться:

—что такое автоматизированное тестирование
—и как с их помощью улучшить проекты машинного обучения.

https://shly.link/wfAPo
This media is not supported in your browser
VIEW IN TELEGRAM
Безусловно, наиболее точное представление конвейеров машинного обучения в реальном мире.😁
😁9
Как Uber предсказывает время прибытия с помощью глубокого обучения
____________________________

https://shly.link/zubTg
Классификация изображений на Android с помощью TensorFlow Lite и CameraX
______________________________

TensorFlow Lite — это облегченная версия TensorFlow Mobile. Он здесь, чтобы раскрыть возможности машинного обучения на ваших смартфонах, гарантируя, что размер двоичного файла модели не слишком велик, а задержка будет низкой. Кроме того, он также поддерживает аппаратное ускорение с использованием API нейронных сетей и предназначен для работы в 4 раза быстрее с поддержкой графического процессора.

CameraX — это новейший API камеры, выпущенный с библиотекой поддержки Jetpack. Он создан для того, чтобы упростить разработку с помощью камеры, а благодаря автоматизированному лабораторному тестированию Google стремится обеспечить единообразие на всех устройствах Android, которых существует множество. CameraX представляет собой значительное улучшение по сравнению с Camera 2 API с точки зрения простоты и простоты использования.

Цель этой статьи — объединить миры камеры и машинного обучения путем обработки кадров CameraX для классификации изображений с использованием модели TensorFlow Lite. Мы будем создавать Android-приложение с использованием Kotlin, которое использует мощность графических процессоров ваших смартфонов.

https://shly.link/SDzbv
👍3
20% функций NumPy, которые специалисты по данным используют 80% времени
______
Кто сказал, что вы должны знать все?

NumPy (или Numeric Python) лежит в основе каждого проекта по науке о данных и машинному обучению. Это, несомненно, одна из самых важных библиотек, когда-либо созданных для Python. Более того, вся управляемая данными экосистема так или иначе зависит от NumPy и его основных функций.

Учитывая, что библиотека имеет широкое применение в промышленности и научных кругах благодаря своему беспрецедентному потенциалу, знакомство с ее функциями и синтаксисом стало крайней необходимостью для начинающих специалистов по данным. Однако изучение всей библиотеки Python, такой как NumPy , может быть сложным и непосильным для всех.
https://shly.link/x8rx4
👍6