В этой статье представлена новая методология самоконтролируемого обучения на изображения
I-JEPA предсказывает особенности различных частей изображения на основе одного контекстного блока. Подход I-JEPA оказался хорошо масштабируемым, особенно при использовании с Vision Transformers (ViT). Например, модель ViT-Huge/14 прошла обучение в ImageNet с использованием 16 графических процессоров A100 менее чем за 72 часа и продемонстрировала высокую производительность в различных задачах.
Ссылка на статью: https://arxiv.org/abs/2301.08243
Ссылка на код: https://github.com/facebookresearch/ijepa
Ссылка на блог: https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/
Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-ijepa
I-JEPA предсказывает особенности различных частей изображения на основе одного контекстного блока. Подход I-JEPA оказался хорошо масштабируемым, особенно при использовании с Vision Transformers (ViT). Например, модель ViT-Huge/14 прошла обучение в ImageNet с использованием 16 графических процессоров A100 менее чем за 72 часа и продемонстрировала высокую производительность в различных задачах.
Ссылка на статью: https://arxiv.org/abs/2301.08243
Ссылка на код: https://github.com/facebookresearch/ijepa
Ссылка на блог: https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/
Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-ijepa
GitHub
GitHub - facebookresearch/ijepa: Official codebase for I-JEPA, the Image-based Joint-Embedding Predictive Architecture. First outlined…
Official codebase for I-JEPA, the Image-based Joint-Embedding Predictive Architecture. First outlined in the CVPR paper, "Self-supervised learning from images with a joint-embedding predic...
UnderstandingDeepLearning_08_05_23_C.pdf
21.1 MB
Понимание глубокого обучения — Это отличный учебник по глубокому обучению. Охватывает почти все основные методы и алгоритмы нейронных сетей.
👍3
Forwarded from Добро пожаловать в мир Python
Вам не нужно 20 графических процессоров для точной настройки большой языковой модели. Lit-Parrot — это библиотека Python, которая позволяет точно настроить последнюю модель 7B Falcon с помощью 1 gpu https://github.com/Lightning-AI/lit-parrot
GitHub
GitHub - Lightning-AI/litgpt: 20+ high-performance LLMs with recipes to pretrain, finetune and deploy at scale.
20+ high-performance LLMs with recipes to pretrain, finetune and deploy at scale. - Lightning-AI/litgpt
Представляем Voicebox: первую генеративную модель искусственного интеллекта для речи, позволяющую обобщать задачи с высочайшей производительностью.
Крупномасштабные генеративные модели, такие как GPT и DALL-E, произвели революцию в области обработки естественного языка и исследований компьютерного зрения. Эти модели не только генерируют высококачественный текст или изображения, но также являются универсальными, которые могут решать задачи, которым явно не обучают. Напротив, речевые генеративные модели все еще примитивны с точки зрения масштаба и обобщения задач. В этой статье мы представляем Voicebox, наиболее универсальную генеративную модель речи с текстовым управлением в масштабе.
https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/
Крупномасштабные генеративные модели, такие как GPT и DALL-E, произвели революцию в области обработки естественного языка и исследований компьютерного зрения. Эти модели не только генерируют высококачественный текст или изображения, но также являются универсальными, которые могут решать задачи, которым явно не обучают. Напротив, речевые генеративные модели все еще примитивны с точки зрения масштаба и обобщения задач. В этой статье мы представляем Voicebox, наиболее универсальную генеративную модель речи с текстовым управлением в масштабе.
https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/
Meta AI
Introducing Voicebox: The first generative AI model for speech to generalize across tasks with state-of-the-art performance
Voicebox is a state-of-the-art speech generative model based on a new method proposed by Meta AI called Flow Matching. By learning to solve a text-guided speech infilling task with a large scale of data, Voicebox outperforms single-purpose AI models across…
Как настроить компьютер с Windows для машинного обучения/глубокого обучения с использованием графической карты Nvidia (CUDA)
https://www.freecodecamp.org/news/how-to-setup-windows-machine-for-ml-dl-using-nvidia-graphics-card-cuda/
https://www.freecodecamp.org/news/how-to-setup-windows-machine-for-ml-dl-using-nvidia-graphics-card-cuda/
10 плагинов ChatGPT для обработки и анализа данных.
ChatGPT помогает всем нам, даже специалистам по данным, стать более продуктивными за более короткий период времени. Первоначальные варианты использования и возможности ChatGPT были ошеломляющими, и со временем ситуация только улучшилась. Поскольку плагины теперь широко доступны для пользователей ChatGPT, мы подумали, что сейчас самое время указать, какие плагины будут хорошими кандидатами для специалистов по данным, которые можно проверить и использовать в своих интересах.
https://www.kdnuggets.com/2023/06/10-chatgpt-plugins-data-science-cheat-sheet.html?utm_source=rss&utm_medium=rss&utm_campaign=10-chatgpt-plugins-for-data-science-cheat-sheet
ChatGPT помогает всем нам, даже специалистам по данным, стать более продуктивными за более короткий период времени. Первоначальные варианты использования и возможности ChatGPT были ошеломляющими, и со временем ситуация только улучшилась. Поскольку плагины теперь широко доступны для пользователей ChatGPT, мы подумали, что сейчас самое время указать, какие плагины будут хорошими кандидатами для специалистов по данным, которые можно проверить и использовать в своих интересах.
https://www.kdnuggets.com/2023/06/10-chatgpt-plugins-data-science-cheat-sheet.html?utm_source=rss&utm_medium=rss&utm_campaign=10-chatgpt-plugins-for-data-science-cheat-sheet
👍1
Агенты-помощники ИИ, такие как ChatGPT, в значительной степени зависели от контролируемой тонкой настройки и обучения с подкреплением на основе отзывов людей. Но у этого метода есть свой набор проблем — высокая стоимость, потенциальные предубеждения и ограничения на истинный потенциал этих агентов ИИ. Что, если бы существовал более эффективный и самодостаточный способ согласования результатов ИИ с человеческими намерениями?
Self-ALIGN — это многоэтапный процесс, который работает путем создания синтетических подсказок из большой языковой модели, увеличения разнообразия подсказок и использования краткого набора написанных человеком принципов для управления моделями ИИ. Применительно к базовой языковой модели LLaMA-65b это привело к созданию нового помощника ИИ, Dromedary, использующего менее 300 строк человеческих аннотаций. Dromedary не только затмевает несколько современных систем искусственного интеллекта, таких как Text-Davinci-003 и Alpaca, но и делает это на множестве тестовых наборов данных.
Ссылка на документ: https://arxiv.org/abs/2305.03047
Ссылка на код: https://mitibmdemos.draco.res.ibm.com/dromedary
Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-dromedary.
Self-ALIGN — это многоэтапный процесс, который работает путем создания синтетических подсказок из большой языковой модели, увеличения разнообразия подсказок и использования краткого набора написанных человеком принципов для управления моделями ИИ. Применительно к базовой языковой модели LLaMA-65b это привело к созданию нового помощника ИИ, Dromedary, использующего менее 300 строк человеческих аннотаций. Dromedary не только затмевает несколько современных систем искусственного интеллекта, таких как Text-Davinci-003 и Alpaca, но и делает это на множестве тестовых наборов данных.
Ссылка на документ: https://arxiv.org/abs/2305.03047
Ссылка на код: https://mitibmdemos.draco.res.ibm.com/dromedary
Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-dromedary.
GitHub
GitHub - IBM/Dromedary: Dromedary: towards helpful, ethical and reliable LLMs.
Dromedary: towards helpful, ethical and reliable LLMs. - GitHub - IBM/Dromedary: Dromedary: towards helpful, ethical and reliable LLMs.
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы хотите изучать науку о данных и машинное обучение, этот веб-сайт — настоящая золотая жила. Это объясняет большинство технических и теоретических концепций Data Science & ML с интерактивными визуальными эффектами.
https://brilliant.org/
https://brilliant.org/
Выпуск исходного кода Draggan: интерактивные манипуляции с изображениями на основе точек.
https://github.com/XingangPan/DragGAN
https://github.com/XingangPan/DragGAN
GitHub
GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023)
Official Code for DragGAN (SIGGRAPH 2023). Contribute to XingangPan/DragGAN development by creating an account on GitHub.
Сравнение алгоритмов машинного обучения в Python и R
Этот список наиболее часто используемых алгоритмов машинного обучения в Python и R предназначен для того, чтобы помочь начинающим инженерам и энтузиастам ознакомиться с наиболее часто используемыми алгоритмами.
https://www.kdnuggets.com/2023/06/machine-learning-algorithms-python-r.html
Этот список наиболее часто используемых алгоритмов машинного обучения в Python и R предназначен для того, чтобы помочь начинающим инженерам и энтузиастам ознакомиться с наиболее часто используемыми алгоритмами.
https://www.kdnuggets.com/2023/06/machine-learning-algorithms-python-r.html
KDnuggets
A Comparison of Machine Learning Algorithms in Python and R - KDnuggets
This list of the most commonly used machine learning algorithms in Python and R is intended to help novice engineers and enthusiasts get familiar with the most commonly used algorithms.
Forwarded from Добро пожаловать в мир Python
1_MLqq6tvQNmQlGpQyIbxwyw.gif
11.3 MB
Более 250 советов по Python и науке о данных, включая Pandas, NumPy, основы машинного обучения, Sklearn, Jupyter и другие.
https://medium.datadriveninvestor.com/250-python-and-data-science-tips-covering-pandas-numpy-ml-basics-sklearn-jupyter-and-more-e33074b92d58
👉 Весь PDF-архив вы можете найти здесь .
https://medium.datadriveninvestor.com/250-python-and-data-science-tips-covering-pandas-numpy-ml-basics-sklearn-jupyter-and-more-e33074b92d58
👉 Весь PDF-архив вы можете найти здесь .
Многоязычное связывание сущностей от конца до конца
Представляем BELA, беспрецедентное решение с открытым исходным кодом, которое должно произвести революцию в области обработки естественного языка (NLP)! BELA решает сложную задачу связывания сущностей - задачу, распространенную во многих практических приложениях, - предлагая самую первую полностью сквозную многоязычную модель. Поразительно, но она может эффективно идентифицировать и связывать сущности в текстах на 97 языках, что является невиданной до сих пор способностью. Это знаменует собой значительный скачок в направлении оптимизации сложных стеков моделей, которые были распространенной проблемой в данной области.
Ссылка на статью: https://arxiv.org/abs/2306.08896
Ссылка на код: https://github.com/facebookresearch/BELA
Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-bela
Представляем BELA, беспрецедентное решение с открытым исходным кодом, которое должно произвести революцию в области обработки естественного языка (NLP)! BELA решает сложную задачу связывания сущностей - задачу, распространенную во многих практических приложениях, - предлагая самую первую полностью сквозную многоязычную модель. Поразительно, но она может эффективно идентифицировать и связывать сущности в текстах на 97 языках, что является невиданной до сих пор способностью. Это знаменует собой значительный скачок в направлении оптимизации сложных стеков моделей, которые были распространенной проблемой в данной области.
Ссылка на статью: https://arxiv.org/abs/2306.08896
Ссылка на код: https://github.com/facebookresearch/BELA
Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-bela
GitHub
GitHub - facebookresearch/BELA: Bi-encoder entity linking architecture
Bi-encoder entity linking architecture. Contribute to facebookresearch/BELA development by creating an account on GitHub.
Pandas 2.0: меняет правила игры для специалистов по данным?
5 лучших функций для эффективной обработки данных https://towardsdatascience.com/pandas-2-0-a-game-changer-for-data-scientists-3cd281fcc4b4
5 лучших функций для эффективной обработки данных https://towardsdatascience.com/pandas-2-0-a-game-changer-for-data-scientists-3cd281fcc4b4
Medium
Pandas 2.0: A Game-Changer for Data Scientists?
The Top 5 Features for Efficient Data Manipulation
Meta только что выпустила промежуточную графическую библиотеку
Промежуточная графическая библиотека (IGL) — это кроссплатформенная библиотека, которая управляет графическим процессором.
https://github.com/facebook/igl/
Промежуточная графическая библиотека (IGL) — это кроссплатформенная библиотека, которая управляет графическим процессором.
https://github.com/facebook/igl/
GitHub
GitHub - facebook/igl: Intermediate Graphics Library (IGL) is a cross-platform library that commands the GPU. It provides a single…
Intermediate Graphics Library (IGL) is a cross-platform library that commands the GPU. It provides a single low-level cross-platform interface on top of various graphics APIs (e.g. OpenGL, Metal an...
👍1
Новое издание одного из самых популярных учебников по машинному обучению выйдет летом 2023 года но доступно бесплатно в виде книги в формате PDF. https://hastie.su.domains/ISLP/ISLP_website.pdf
👍1
Откажитесь от жесткого кодирования в проекте по науке о данных — вместо этого используйте файлы конфигурации
Как эффективно взаимодействовать с файлами конфигурации в Python.
https://www.kdnuggets.com/2023/06/stop-hard-coding-data-science-project-config-files-instead.html
Как эффективно взаимодействовать с файлами конфигурации в Python.
https://www.kdnuggets.com/2023/06/stop-hard-coding-data-science-project-config-files-instead.html
KDnuggets
Stop Hard Coding in a Data Science Project – Use Config Files Instead
How to efficiently interact with config files in Python.
Секреты RLHF в LLM Интересный отчет, в котором более подробно рассматривается RLHF и изучается внутренняя работа PPO. Полезно прочитать, если вы заинтересованы в LLM RLHF. Репозиторий кода тоже включен!
статья : https://arxiv.org/abs/2307.04964
код : https://github.com/OpenLMLab/MOSS-RLHF
статья : https://arxiv.org/abs/2307.04964
код : https://github.com/OpenLMLab/MOSS-RLHF
Мы запускаем Keras Core, новую библиотеку, которая объединяет Keras API с JAX и PyTorch в дополнение к TensorFlow. Это позволяет вам писать компоненты глубокого обучения для разных платформ и извлекать выгоду из лучшего, что может предложить каждая платформа. Подробнее: https://keras.io/keras_core/announcement/