Big data world
2.35K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Машинное обучение 😁
😁4
Что такое Байесовское А/B-тестирование и как его провести?

Подробно обсудим 18 апреля в 20:00 мск на открытом уроке в OTUS. Занятие приурочено к старту онлайн-курса «Machine Learning. Advanced».

На вебинаре мы разберем, какие преимущества дают Байесовские A/B тесты по сравнению с обычными, как проводить Байесовские A/B тесты и как работать с Байесовскми моделями в PyMC3.

В результате урока вы:

- Познакомитесь с основами A/B тестирования

- Научитесь делать дизайн эксперимента для A/B теста

- Узнаете, как определить, что тест шел достаточно времени

- Познакомитесь с критериями принятия решения по эксперименту

- Получите новый простой и эффективный инструмент для A/B тестирования

⚠️ Урок будет полезен специалистам в области аналитики данных или аналитики продукта, а также тем, кто уже знаком с A/B тестированием, но хочет углубить свои знания.

🖌 Для участия пройдите вступительный тест

https://otus.pw/cGB1/
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Чат-бот, который позволяет вам общаться с любым репозиторием Github.

https://useadrenaline.com/app
#вакансия #удалённо #job#remote #parttime #руководитель #преподаватель #ML #reinforcementlearning #MLOps

Компания: OTUS – образовательная платформа🦉
Мы 5 лет специализируемся на курсах для IT-специалистов разного уровня: от junior до senior. У нас более 130 авторских курсов. Мы подходим к обучению прагматично: программа ориентируется на требования работодателей и последние тренды разработки. Копаем глубоко в практику, чтобы дать то, чего не найти в открытом доступе.

Вакансия: руководитель и преподаватели курса Reinforcement Learning

Преподаватель курса MLOps.
Преподаватель
курса ML Advanced.

Руководитель - это эксперт в своей области, который играет ключевую роль на курсе:

- разрабатывает/обновляет программу курса;
- координирует работу команды;
- ведёт на курсе часть занятий и работает с материалами занятий.

Преподаватель использует презентацию с теорией и практические примеры, чтобы раскрыть тему урока.

Вы выбираете, на какие темы преподавать. Мы предлагаем удалённое сотрудничество, занятость частичная, нагрузку Вы определяете сами.

Занятия проходят в интерактивном формате в zoom с 20:00 до 21:30 по мск. Наши методисты помогают освоить лучшие инструменты и практики преподавания.

Вознаграждение💰
Ставка за 1 урок (1.5 часа) – от 4000 до 6000 руб;
За проверку 1 домашнего задания мы платим от 300 до 400 руб.

Дополнительные активности на ваше усмотрение, которые оплачиваются отдельно: разработка и переработка материалов вебинара, проверка домашних заданий, менторство.

У руководителя дополнительно оплачивается: разработка и актуализация программы, руководство учебным месяцем, проверка проектных работ и многое другое!

У нас классная команда 450+ экспертов с уникальными компетенциями из различных компаний. Мы учимся друг у друга, советуемся, помогаем, делимся опытом, обсуждаем новости как в преподавании, так и по проектам.

Научим:
работать с аудиторией;
давать обратную связь;
публично выступать;
структурировать свои знания.

Вы сможете:
🎁 проходить наши курсы со скидкой;
💪 набирать себе команду из лучших студентов;
💸 совмещать с текущей фулл-тайм загрузкой.

Хотите узнать больше? @anna_phoenix7
👍1
Что нужно знать разработчикам о генеративном ИИ

В последнее время в новостях доминирует генеративный ИИ, но что это такое? Вот что вам нужно знать и что это значит для разработчиков.
https://github.blog/2023-04-07-what-developers-need-to-know-about-generative-ai/
Dolly 2.0, управляемая LLM с открытым исходным кодом для исследований и коммерческого использования.

«Сегодня мы выпускаем Dolly 2.0, первую LLM с открытым исходным кодом, выполняющую инструкции, точно настроенную на созданном человеком наборе данных инструкций, лицензированном для исследований и коммерческого использования», — Databricks

https://www.databricks.com/blog/2023/04/12/dolly-first-open-commercially-viable-instruction-tuned-llm

https://huggingface.co/databricks

Модель: https://huggingface.co/databricks/dolly-v2-12b

Набор данных: https://github.com/databrickslabs/dolly/tree/master/data
Media is too big
VIEW IN TELEGRAM
Нейронная объемная память для передвижения ногами, CVPR23 Highlight

Робот поднимается по лестнице🏯, перешагивает через камни🧗‍♀️ и бегает в дикой природе🏞 без всякого пульта! В нашей статье #CVPR2023 Highlight это достигается за счет использования RL + трехмерной нейронной объемной памяти (NVM), обученной с помощью синтеза представлений!

Веб-сайт: https://rchalyang.github.io/NVM/

статья: https://arxiv.org/abs/2304.01201
👍2
Бесплатный курс MLOps. Узнайте, как сочетать машинное обучение с разработкой программного обеспечения для разработки, развертывания и обслуживания производственных приложений машинного обучения.
https://madewithml.com/
6 аутсайдеров библиотек Data Science, которые заслуживают гораздо большего внимания

Пора выходить из тени
https://towardsdatascience.com/6-underdog-data-science-libraries-that-deserve-much-more-attention-ef64187b562a
Мы написали обо всем, что вам нужно знать для обучения LLM (технология, лежащая в основе ChatGPT).

Большие языковые модели, такие как GPT-4 от OpenAI или PaLM от Google, штурмом захватили мир искусственного интеллекта. Тем не менее, большинство компаний в настоящее время не имеют возможности обучать эти модели и полностью полагаются лишь на горстку крупных технологических фирм как на поставщиков технологий.

В Replit мы вложили значительные средства в инфраструктуру, необходимую для обучения наших собственных больших языковых моделей с нуля.
https://blog.replit.com/llm-training
Bark: приложение для клонирования голоса с помощью искусственного интеллекта и текстовое генеративное аудио.

Bark может генерировать очень реалистичную многоязычную речь, а также другие аудиофайлы, включая музыку, фоновый шум и простые звуковые эффекты. Модель также может производить невербальные коммуникации, такие как смех, вздохи и плач.
https://github.com/serp-ai/bark-with-voice-clone
👍4
Как использовать ChatGPT — подсказки для специалистов по данным

В этой статье я поделюсь некоторыми полезными и важными подсказками, которые могут использовать специалисты по данным. Мы рассмотрим такие области, как машинное обучение, визуализация данных и многое другое.
https://www.freecodecamp.org/news/how-to-use-chatgpt-for-data-scientists/
65 шпаргалок по Python, Linux, AWS, ML, AI, SQL, Git, GCP, Azure

"Думаю, это вам очень поможет. Наслаждаться!!"

https://medium.com/@saurabhdahibhate50/65-cheatsheets-carefully-curated-you-will-ever-need-c6a3de85195b
Автоматическое удаление объектов с изображений — сложная задача, требующая сочетания компьютерного зрения и методов глубокого обучения. Этот код использует возможности рисования OpenCV, восстановления изображений на основе глубокого обучения и методов смешивания для автоматического выполнения этой задачи без необходимости подсказок пользователя.

https://github.com/vijishmadhavan/UnpromptedControl
1
This media is not supported in your browser
VIEW IN TELEGRAM
Adaptive — это библиотека Python с открытым исходным кодом, которая упрощает вычисления адаптивных параллельных функций. Вместо того, чтобы вычислять все точки в плотной сетке, он разумно выбирает «лучшие» точки в пространстве параметров на основе предоставленной вами функции и границ.
https://github.com/python-adaptive/adaptive/
Понимание больших языковых моделей

Срез самой актуальной литературы, чтобы быть в курсе
https://magazine.sebastianraschka.com/p/understanding-large-language-models
Крис Латтнер из LLVM и Swift только что объявил о новом языке программирования для ML, который отличается высокой производительностью и обратной совместимостью с Python (работает с библиотеками Python). Может изменить правила игры.

https://docs.modular.com/mojo/why-mojo.html
Как я превратил документы своей компании в базу данных с возможностью поиска с помощью OpenAI

И как вы можете сделать то же самое с вашими документами
https://towardsdatascience.com/how-i-turned-my-companys-docs-into-a-searchable-database-with-openai-4f2d34bd8736
Очень нежное введение в большие языковые модели без шумихи

Эта статья предназначена для того, чтобы дать людям, не имеющим знаний в области информатики, некоторое представление о том, как работают ChatGPT и аналогичные системы искусственного интеллекта (GPT-3, GPT-4, Bing Chat, Bard и т. д.). https://shly.link/yCvEX
Hugging Face выпускает новаторского агента-трансформера

Агент Transformers предоставляет API-интерфейс естественного языка поверх трансформаторов с набором специально подобранных инструментов и агентом, предназначенным для интерпретации естественного языка и использования этих инструментов.
https://huggingface.co/docs/transformers/transformers_agents