Big data world

Парадокс Симпсона и его значение в науке о данных

Специалисты по данным, инженеры данных и инженеры по машинному обучению тратят много времени на изучение данных и поиск статистических рисунков или выводов из них. Но важная вещь, которая является обязательным навыком для этих профессионалов и всех, кто смотрит на данные, — это хорошая интуиция для реального мира.

Данные имеют несколько переменных, которые вы можете принять во внимание, однако следует отметить, что они создают конечномерное представление. Здесь вам придется заглянуть за пределы данных и выяснить, что такое скрытая реальность и как ее можно применить к набору данных.

Парадокс Симпсона доказывает нам важность скептицизма при интерпретации ваших данных и гарантии того, что вы применяете реальный мир, не ограничивая себя в том, чтобы смотреть на него с точки зрения данных.

https://www.kdnuggets.com/2023/03/simpson-paradox-implications-data-science.html?utm_source=rss&utm_medium=rss&utm_campaign=simpsons-paradox-and-its-implications-in-data-science

746 views09:51

Big data world

GPT-4, последняя веха в усилиях OpenAI по расширению масштабов глубокого обучения. GPT-4 — это крупная мультимодальная модель (принимающая входные изображения и текст и выдающая текстовые выходные данные), которая, хотя и менее эффективна, чем люди, во многих реальных сценариях, демонстрирует производительность на уровне человека в различных профессиональных и академических тестах.

https://openai.com/research/gpt-4

Openai

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits…

👍1

763 views15:02

Big data world

GPT-4 - захватывающий и пугающий (2 минуты чтения)

В статье описывается опыт автора по тестированию GPT-4, когда он задавал ему различные вопросы - помочь с налоговой проблемой, придумать новое слово, спланировать вечеринку по случаю дня рождения. Автор обнаружил, что GPT-4 способен решать более широкий круг задач, более подвижен в своих ответах . GPT-4 также показал высокие результаты в различных тестах, включая Единый экзамен по адвокатуре и олимпиаду по биологии. Хотя в статье признается положительный потенциал GPT-4, в ней также обсуждается и негативная сторона - мысль о том, что ИИ может быть умнее человека, этические последствия такой технологии и возможность злоупотреблений.
https://archive.ph/UDPRi

Google Cloud предлагает генеративный ИИ разработчикам, предприятиям и правительствам (7 минут чтения)

Google Cloud запустил поддержку генеративного ИИ в Vertex AI и Generative AI App Builder, что позволяет предприятиям и правительствам получить доступ к технологии генеративного ИИ и настроить ее под себя. Эти инструменты позволяют разработчикам быстро и легко создавать генеративные приложения ИИ, используя готовые шаблоны и API-доступ к базовым моделям Google, с полным контролем над использованием данных. Этот шаг отражает стремление Google Cloud расширить возможности команд и преобразовать отрасли с помощью технологий ИИ.
https://cloud.google.com/blog/products/ai-machine-learning/generative-ai-for-businesses-and-governments

Pip install pytorch 2.0 (5 минут чтения)

Анонсированная в декабре, новая версия pytorch теперь стабильна и доступна для простой установки. Благодаря множеству новых функций, улучшению скорости и интерфейсов - сейчас самое интересное время для использования самого популярного фреймворка глубокого обучения.
https://pytorch.org/blog/pytorch-2.0-release/

Edit-A-Video: Подход к редактированию видео с помощью преобразования текста в видео (Github Repo)

В данной статье представлена Edit-A-Video, структура для редактирования видео, основанная на моделях "текст-видео" (TTV), адаптированных из моделей "текст-изображение" (TTI), основанных на диффузии.
https://edit-a-video.github.io/

archive.ph

GPT-4 Is Exciting and Scary - The New York Times

archived 15 Mar 2023 20:30:47 UTC

742 views13:24

Big data world

#вакансия #удалённо #job #remote #parttime #преподаватель #spark #рекомендательныесистемы #recommendersystems

Компания: OTUS – образовательная платформа 🦉 5 лет специализируемся на авторских курсах для IT-специалистов разного уровня: от junior до senior. У нас есть вступительное тестирование для студентов и 600+ преподавателей-практиков из крупнейших компаний. Мы учимся друг у друга, советуемся, помогаем, делимся опытом и обсуждаем новости как в преподавании, так и в IT.

Вакансия: преподаватель онлайн-курсов:
▶️ Spark developer
▶️ Рекомендательные системы

Локация: удаленно; сами определяете нагрузку и выбираете темы занятий. Вебинары проходят в вечернее время.

Преподаватель использует презентацию с теорией и практические примеры, чтобы раскрыть тему урока. Наши методисты помогут вам освоить лучшие инструменты и практики преподавания.

✅ Это отличная возможность, чтобы:
- структурировать знания;
- публично выступать и работать с аудиторией;
- внести свой вклад в развитие IT.

Оплата💰
- от 4000 до 6000 руб. за одно занятие (полтора часа);
- 5000 за разработку материалов к одному занятию$
- от 300 до 400 руб за проверку одного ДЗ.

Бонусы 🎁
- наши курсы со скидкой/бесплатно;
- возможность приглашать в свою команду на работу лучших выпускников;
- воркшопы и конференции для наших преподавателей.

Обсудить подробнее @yu_grin

otus.ru

Spark Developer. Углубленный курс по самым мощным инструментам обработки больших данных

Вы получите глубовое понимание инструментов и возможностей Spark, оркестрацию, тестирование и мониторинг приложений. Научитесь интегрировать Spark с различными источниками данных: SparkML, Работу с графами, Spark в Hadoop, Spark в Kubernetes, Hive. И изучите…

783 views14:01

Big data world

Pandas 2.0: более быстрая версия Pandas с серверной частью Apache Arrow

Панды 2.0 были недавно выпущены. Эта версия в основном включает исправления ошибок, улучшения производительности и добавление серверной части Apache Arrow.

Если вы являетесь пользователем pandas, вероятно, вы знаете, что pandas годами использовала Numpy для представления массивов и выполнения над ними операций. Однако когда дело доходит до работы с фреймами данных, у Arrow есть много преимуществ по сравнению с Numpy.

В этой статье мы увидим, каковы эти преимущества, почему pandas выбирает Arrow для своего бэкэнда и как вы можете начать использовать Arrow в Pandas 2.0 (это все еще не вариант по умолчанию).

https://artificialcorner.com/pandas-2-0-a-faster-version-of-pandas-with-apache-arrow-backend-57d13b838a97

863 views12:06

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Выпущена первая модель распространения текста в видео с открытым исходным кодом с 1,7 миллиардами параметров

демо: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis
модель: https://huggingface.co/damo-vilab/modelscope-damo-text-to-video-synthesis/tree/main

👍3

758 views07:44

Big data world

6 лучших книг по науке о данных для начинающих — 2023 г.

Область науки о данных быстро растет, и у этой области есть огромный потенциал, чтобы революционизировать то, как люди живут и работают. С увеличением объема производимых данных для специалистов по науке о данных становится все более важным понимать инструменты и методы прерывания данных. Если вы новичок или опытный специалист по данным, чтение последних книг по этому вопросу поможет вам оставаться впереди конкурентов и быть в курсе последних тенденций и разработок в этой области.

В этом блоге мы расскажем о лучших книгах по науке о данных, которые вам следует прочитать в 2023 году. Книга охватывает различные темы, включая машинное обучение, визуализацию больших данных и многое другое. Таким образом, книги предоставят ценную информацию и информацию, если вы хотите быть в курсе последних тенденций и новых навыков.

https://www.datasciencecentral.com/top-6-data-science-books-for-beginners-and-experienced-2023/

771 views07:33

Big data world

31 марта МТС собирает крупнейшую в России IT-конференцию TRUE TECH DAY. Почему сейчас? Потому что давно пора показать, что скрывают «под капотом» топовые продукты продвинутых технологичных компаний. Каждый участник конференции протестит на себе true-технологии и испытает новые впечатления, меняющие мир пользователей.

Что будет:
→ 7 треков: AI, Main Track, Big Data, Architecture, Cybersecurity, Leading Change, Product Manager.
→ 50+ мировых спикеров с топовыми темами без воды и лирики
→ 10 часов нетворкинга и обмена опытом в Москве, Дубае, Тбилиси и Астане
→ много интерактивных и цифровых зон
→ а после — грандиозная вечеринка со звездным лайн-апом

Все спикеры и темы уже на сайте.
Регистрируйся на True Tech Day по ссылке.
Участие бесплатно

830 views08:01

Big data world

OpenChatKit: альтернатива ChatGPT с открытым исходным кодом

OpenChatKit позволяет разработчикам настраивать модель, поддерживать контекст в диалогах, модерировать ответы и без особых усилий создавать собственные приложения для чат-ботов.

https://www.kdnuggets.com/2023/03/openchatkit-opensource-chatgpt-alternative.html

952 viewsedited 12:04

Big data world

Дорожная карта машинного обучения для НАЧИНАЮЩИХ с ресурсами!!

A) Linear Algebra
🔗 https://khanacademy.org/math/linear-algebra

B) Calculus
🔗 https://youtube.com/playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr

C) Probability
🔗 https://edx.org/course/probability-the-science-of-uncertainty-and-data

D) Statistics
🔗 Notes: https://mathsbox.org.uk/twi/astats.pdf

E) Python
🔗 https://datacamp.com/courses/intro-to-python-for-data-science

F) Machine Learning
🔗 https://developers.google.com/machine-learning/crash-course

G) Projects
🔗https://www.kaggle.com/

1.44K views10:16

«Интерфейс ChatGPT» для изучения ваших наборов данных машинного обучения

app.activeloop.ai

👍2

981 views13:40

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Демонстрация, данные и код для обучения большой языковой модели в стиле помощника с ~800 тыс. GPT-3.5-Turbo Generations на основе LLaMa

https://github.com/nomic-ai/gpt4all

868 views06:33

Big data world

Forwarded from Daily Dev Jokes. Юмор.

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

Будьте осторожны с процессом машинного обучения

849 views14:14

Big data world

[БЕСПЛАТНЫЙ 533-страничный PDF] #DataScience and#Машинное обучение— Математические и статистические методы: https://people.smp.uq.edu.au/DirkKroese/DSML/DSML.pdf

1.11K views14:35

Big data world

3:09

This media is not supported in your browser

VIEW IN TELEGRAM

Финансовый аналитик GPT-4 «Уоррен Баффет», чтобы «общаться» и анализировать несколько PDF-файлов (~ 1000 страниц).
Годовые отчеты Tesla 10-k (2020-2022)

Учебное видео на Youtube: https://youtube.com/watch?v=Ix9WIZpArm0

Репозиторий Github : https://github.com/mayooear/gpt4-pdf-chatbot-langchain

👏1

1.02K views06:46

Big data world

Машинное обучение в три шага

В этой статье я разделю алгоритмы машинного обучения на три категории и выскажу свое скромное мнение о том, с чего начать, а что можно пропустить.

https://towardsdatascience.com/machine-learning-in-three-steps-how-to-efficiently-learn-it-aefcf423a9e1

Medium

Machine Learning in Three Steps: How to Efficiently Learn It

Prioritizing the Essentials for Predictive Modeling without Overwhelming Yourself

860 views06:22

Big data world

Набор данных с разнообразными диалогами между двумя экземплярами ChatGPT (gpt-3.5-turbo) с системными сообщениями, написанными GPT-4. Охватывая различные контексты и задачи (системы диалогов, ориентированных на задачу, абстрактное рассуждение, мозговой штурм).

https://github.com/radi-cho/botbots/

863 views17:17

Big data world

Машинное обучение 😁

😁4

977 views10:05

Big data world

Что такое Байесовское А/B-тестирование и как его провести?

✅ Подробно обсудим 18 апреля в 20:00 мск на открытом уроке в OTUS. Занятие приурочено к старту онлайн-курса «Machine Learning. Advanced».

На вебинаре мы разберем, какие преимущества дают Байесовские A/B тесты по сравнению с обычными, как проводить Байесовские A/B тесты и как работать с Байесовскми моделями в PyMC3.

В результате урока вы:

- Познакомитесь с основами A/B тестирования

- Научитесь делать дизайн эксперимента для A/B теста

- Узнаете, как определить, что тест шел достаточно времени

- Познакомитесь с критериями принятия решения по эксперименту

- Получите новый простой и эффективный инструмент для A/B тестирования

⚠️ Урок будет полезен специалистам в области аналитики данных или аналитики продукта, а также тем, кто уже знаком с A/B тестированием, но хочет углубить свои знания.

🖌 Для участия пройдите вступительный тест

https://otus.pw/cGB1/

👍1

852 views05:54

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Чат-бот, который позволяет вам общаться с любым репозиторием Github.

https://useadrenaline.com/app

806 views14:44

Big data world

#вакансия #удалённо #job #remote #parttime #руководитель #преподаватель #ML #reinforcementlearning #MLOps

Компания: OTUS – образовательная платформа🦉
Мы 5 лет специализируемся на курсах для IT-специалистов разного уровня: от junior до senior. У нас более 130 авторских курсов. Мы подходим к обучению прагматично: программа ориентируется на требования работодателей и последние тренды разработки. Копаем глубоко в практику, чтобы дать то, чего не найти в открытом доступе.

Вакансия: руководитель и преподаватели курса Reinforcement Learning

Преподаватель курса MLOps.
Преподаватель курса ML Advanced.

Руководитель - это эксперт в своей области, который играет ключевую роль на курсе:

- разрабатывает/обновляет программу курса;
- координирует работу команды;
- ведёт на курсе часть занятий и работает с материалами занятий.

Преподаватель использует презентацию с теорией и практические примеры, чтобы раскрыть тему урока.

Вы выбираете, на какие темы преподавать. Мы предлагаем удалённое сотрудничество, занятость частичная, нагрузку Вы определяете сами.

Занятия проходят в интерактивном формате в zoom с 20:00 до 21:30 по мск. Наши методисты помогают освоить лучшие инструменты и практики преподавания.

Вознаграждение💰
Ставка за 1 урок (1.5 часа) – от 4000 до 6000 руб;
За проверку 1 домашнего задания мы платим от 300 до 400 руб.

Дополнительные активности на ваше усмотрение, которые оплачиваются отдельно: разработка и переработка материалов вебинара, проверка домашних заданий, менторство.

У руководителя дополнительно оплачивается: разработка и актуализация программы, руководство учебным месяцем, проверка проектных работ и многое другое!

У нас классная команда 450+ экспертов с уникальными компетенциями из различных компаний. Мы учимся друг у друга, советуемся, помогаем, делимся опытом, обсуждаем новости как в преподавании, так и по проектам.

Научим:
✅ работать с аудиторией;
✅ давать обратную связь;
✅ публично выступать;
✅ структурировать свои знания.

Вы сможете:
🎁 проходить наши курсы со скидкой;
💪 набирать себе команду из лучших студентов;
💸 совмещать с текущей фулл-тайм загрузкой.

Хотите узнать больше? @anna_phoenix7

otus.ru

Reinforcement Learning (Обучение с подкреплением). Научим внедрять RL-алгоритмы на практике в играх, робототехнике, энергетике…

3 месяца обучения и финальный проект. Курс предназначен для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением. После прохождения курса студенты научатся применять алгоритмы RL для решения разнообразных задач в реальном…

👍1

823 views08:59

About

Blog

Apps

Platform