Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Media is too big
VIEW IN TELEGRAM
Преобразование речи в речь для реального бесписьменного языка

Мы изучаем преобразование речи в речь (S2ST), которое переводит речь с одного языка на другой, и фокусируемся на создании систем для поддержки языков без стандартных систем написания текста. Мы используем англо-тайваньский язык Hokkien в качестве примера и представляем комплексное решение от сбора данных для обучения, вариантов моделирования до выпуска тестового набора данных.

демо: https://huggingface.co/spaces/facebook/Hokkien_Translation

гитхаб: https://github.com/facebookresearch/fairseq/tree/ust/examples/hokkien

страница проекта: https://research.facebook.com/publications/hokkien-direct-speech-to-speech-translation/
OpenAI Gym и ряд наиболее часто используемых сред RL с открытым исходным кодом были объединены в единую новую некоммерческую организацию (The Farama Foundation).

https://farama.org/Announcing-The-Farama-Foundation
This media is not supported in your browser
VIEW IN TELEGRAM
Runway Stable Diffusion Inpainting: стирание и замена, добавление маски и текстовой подсказки для замены объектов на изображении.

Runway demo: https://app.runwayml.com/ai-tools/erase-and-replace

Runway gradio demo: https://huggingface.co/spaces/runwayml/stable-diffusion-inpainting

Runway model: https://huggingface.co/runwayml/stable-diffusion-inpainting
👍4
Почему я выбираю Data Engineering, а не Data Science?

Наука о данных — это увлекательно, но инженерия данных приносит больше пользы.

https://shly.link/mdmYE0K
Если вы хотите проникнуть в область машинного обучения, вы не можете пропустить лучший курс по линейной алгебре. И это БЕСПЛАТНО! Профессор Массачусетского технологического института Гилберт Стрэнг, вероятно, один из лучших педагогов, которых вы когда-либо встречали.

https://ocw.mit.edu/courses/18-06-linear-algebra-spring-2010/
2
✏️Примените 100 моделей машинного обучения с настройкой гиперпараметров, используя 3 строки кода

Библиотека Auto-sklearn дает вам возможность применять массовые модели ML к вашему набору данных, а также изменять и находить лучшие гиперпараметры для этой модели.
https://shly.link/mdmxjf7

📚Сколько математики мне нужно в науке о данных?
Математические навыки необходимы в науке о данных и машинном обучении
https://shly.link/TMUqa
Что такое TensorFlow? Как это работает? Введение и архитектура

В настоящее время самой известной библиотекой глубокого обучения в мире является TensorFlow от Google. Продукт Google использует машинное обучение во всех своих продуктах для улучшения поисковой системы, перевода, подписей к изображениям или рекомендаций.

https://shly.link/R06Lp
15 бесплатных книг по машинному обучению и глубокому обучению

Если вы хотите сделать карьеру в области машинного обучения или стать специалистом по данным, который хочет перейти в мир машинного обучения, приведен список БЕСПЛАТНЫХ электронных книг, которые помогут вам в этом.
https://shly.link/mxVcd
📚365 курсов Data Science бесплатно до 21 ноября

Образовательная онлайн-платформа 365 Data Science запускает кампанию #21DaysFREE и предоставляет 100% бесплатный неограниченный доступ ко всему контенту на три недели. С 1 по 21 ноября вы можете пройти курсы у известных инструкторов и получить признанные в отрасли сертификаты.
https://shly.link/rnAk2
Нашел этот удивительный веб-сайт по науке о данных, содержащий учебные пособия по:
- Поиску данных (SQL)
- Обработке данных ( Python , R)
- Визуализации данных ( Python , R).
https://shly.link/92kqD
👍1
✏️Альтернатива Pandas без кода, которую ждали специалисты по данным

Шаг к упрощению анализа данных для всех
https://shly.link/AkJDC

✏️Temporal Fusion Transformer: прогнозирование временных рядов с помощью глубокого обучения — полное руководство

Создавайте точные и интерпретируемые прогнозы
https://shly.link/rGjEM

✏️Генерация естественного языка (то есть генерация текста) является одной из основных задач обработки естественного языка (NLP). В этом блоге мы представляем современный современный метод декодирования Contrastive Search для генерации нейронного текста.
https://shly.link/YYdUg
1👍1
#вакансия #удалённо #job #remote #parttime #преподаватель #Spark

Компания: OTUS – образовательная платформа🦉
Мы 5 лет специализируемся на курсах для IT-специалистов разного уровня: от junior до senior. У нас более 130 авторских курсов. Мы подходим к обучению прагматично: программа ориентируется на требования работодателей и последние тренды разработки. Копаем глубоко в практику, чтобы дать то, чего не найти в открытом доступе.

Вакансия: преподаватель онлайн-курса по Spark

👨‍🏫 Преподаватель использует презентацию с теорией и практические примеры, чтобы раскрыть тему урока. Наши методисты помогут Вам освоить лучшие инструменты и практики преподавания.

Локация: удаленно; сами определяете нагрузку и выбираете, на какие темы преподавать. Занятия проходят в вечернее время.

Вознаграждение:
Ставка за 1 урок (полтора часа) – от 4000 до 6000 руб.
Дополнительные активности на Ваше усмотрение, которые оплачиваются отдельно: разработка и переработка материалов вебинара, проверка домашних заданий, менторство.

У нас классная команда 600+ экспертов с уникальными компетенциями из различных компаний. Мы учимся друг у друга, советуемся, помогаем, делимся опытом, обсуждаем новости как в преподавании, так и по проектам.

Научим:
работать с аудиторией;
давать обратную связь;
публично выступать;
структурировать свои знания.

Вы сможете:
🎁 проходить наши курсы со скидкой;
💪 набирать себе команду из лучших студентов;
💸 совмещать с текущей фулл-тайм загрузкой.

Хотите узнать больше? @yu_grin
IBM предлагает БЕСПЛАТНЫЕ онлайн-курсы по науке о данных. Прекрасная возможность работать над реальными проектами, накапливать опыт и добавлять проекты и сертификаты в свое резюме. Вот 5 БЕСПЛАТНЫХ курсов от IBM, которые вы не захотите пропустить:
1. Python для науки о данных
https://t.co/EomIwpRrPV
2. Анализ данных с помощью Python
https://t.co/J0MJSEcWjD
3. Визуализация данных с помощью Python
https://t.co/0nYSxIjruf
4. Большие данные 101
https://t.co/huvPofHd7v
5. Наука о данных 101
https://t.co/ZZATfOUPOq
5
asyncio — недооцененное оружие для машинного обучения


Независимо от того, находитесь ли вы на стороне разработчика, когда пишете код для обслуживания модели, или вы на стороне потребителя, пишете скрипты для интеграции стороннего сервиса в свое приложение, вы можете получить огромную пользу, если понимаете использование asyncio в python. . В следующем разделе мы рассмотрим основные концепции асинхронного программирования в Python, представляя asyncioвам фантастический пакет и его функциональные возможности.

https://shly.link/mdmPXTi
Finetuned Diffusion: несколько точно настроенных моделей Stable Diffusion, обученных различным стилям.

демо: https://huggingface.co/spaces/anzorq/finetuned_diffusion

colab: https://colab.research.google.com/gist/qunash/42112fb104509c24fd3aa6d1c11dd6e0/copy-of-fine-tuned-diffusion-gradio.ipynb
🧐Какие SQL-задачи нужно уметь решать веб-разработчикам на собеседовании?

⚡️Разберем типовые задачи 16 ноября в 20:00 с Дмитрием Кирилловым, техническим директором 1С-Старт.

📚 В OTUS пройдет открытый урок, на котором мы:
- обсудим, какие знания SQL требуются от веб-разработчиков
- вспомним базовые приёмы для работы с данными
- совместно разберём несколько несложных задач
После вебинара вы сможете продолжить осваивать новые навыки на онлайн-курсе «Базы данных».

👉🏻Для регистрации на занятия пройдите вступительный тест: https://otus.pw/NXI0/

Это занятие является частью онлайн-курса «Базы данных» от OTUS.
👍2👌1
#Python Machine Learning Projects

https://shly.link/yzyye
Два убийственных лайфхака Jupyter, которые гарантированно сэкономят вам часы рабочего времени
В тот момент, когда вы начинаете их использовать

https://shly.link/WnFcq
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомство с Галактикой. Большая языковая модель для науки. Может обобщать академическую литературу, решать математические задачи, создавать статьи для Wiki, писать научный код, аннотировать молекулы и белки и многое другое.
galactica.org
На бесплатном вебинаре расскажем, чем аналитики данных и продуктовые аналитики отличаются от системных и бизнес-аналитиков. Разберём, что каждому из них нужно уметь на старте.

Вы узнаете, как выбрать направление по душе и в каких компаниях искать работу. А эксперты ответят на вопросы.

→ Бесплатный вебинар Яндекс Практикума, 21 ноября в 15:00
→ Зарегистрироваться на вебинар