Media is too big
VIEW IN TELEGRAM
✨ Визуализация эмбеддингов в браузере
У TensorFlow есть онлайн-инструмент, который позволяет изучить пространство эмбеддингов (векторных представлений). Это не только залипательно, но и может быть полезно.Для пространств высокой размерности инструмент предварительно использует методы сокращения размерности (например, PCA).
На странице доступны предобученные эмбеддинги — Word2Vec, Mnist (в виде картинок!) и Iris. Кроме того, есть возможность загрузить собственные.
🔗 Ссылка на инструмент TensorFlow
У TensorFlow есть онлайн-инструмент, который позволяет изучить пространство эмбеддингов (векторных представлений). Это не только залипательно, но и может быть полезно.
На странице доступны предобученные эмбеддинги — Word2Vec, Mnist (в виде картинок!) и Iris. Кроме того, есть возможность загрузить собственные.
🔗 Ссылка на инструмент TensorFlow
❤4👍1
🛠️ NLP по-русски: подборка инструментов
🔹 Natasha
Набор инструментов Natasha позволяет решать базовые NLP-задачи: токенизацию, сегментацию на предложения, морфологический и синтаксический анализ, лемматизацию, извлечение именованных сущностей.
🔹 DeepPavlov
Это библиотека, созданная на базе PyTorch. Позволяет создавать чат-ботов и сложные диалоговые системы. Включает предобученные модели для русского языка.
🔹pymorphy2
Морфологический анализатор для русского и украинского языков. Может приводить слово к начальной форме и возвращать грамматическую информацию о нём. Также можно использовать форк pymorphy3, который сейчас развивается.
🔹SpaCy
Библиотека для обработки естественного языка, поддерживающая 75+ языков, а также включающая предобученные векторы слов.
NLP — Natural Language Processing, обработка естественного языка
🔹 Natasha
Набор инструментов Natasha позволяет решать базовые NLP-задачи: токенизацию, сегментацию на предложения, морфологический и синтаксический анализ, лемматизацию, извлечение именованных сущностей.
🔹 DeepPavlov
Это библиотека, созданная на базе PyTorch. Позволяет создавать чат-ботов и сложные диалоговые системы. Включает предобученные модели для русского языка.
🔹pymorphy2
Морфологический анализатор для русского и украинского языков. Может приводить слово к начальной форме и возвращать грамматическую информацию о нём. Также можно использовать форк pymorphy3, который сейчас развивается.
🔹SpaCy
Библиотека для обработки естественного языка, поддерживающая 75+ языков, а также включающая предобученные векторы слов.
👍6❤1
💬 А вы используете в своей работе Jupyter Notebook?
❤️ — использую постоянно
👍 — иногда использую
🤔 — нет
#интерактив
❤️ — использую постоянно
👍 — иногда использую
🤔 — нет
#интерактив
❤114👍31🤔12👾3😁1
🧑💻 Статьи для IT: как объяснять и распространять значимые идеи
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
👍4❤1
🚀 Awesome Machine Learning — фреймворки и библиотеки для ML
Этот репозиторий был вдохновлён другим — awesome-php. Включает в себя библиотеки, фреймворки и инструменты для машинного обучения на всех языках программирования: от С до Julia (Python, конечно, тоже есть).
Вот темы, которые есть в списке, на примере Python:
🔸 Компьютерное зрение
— SimpleCV
— pytessarct
🔸 Обработка естественного языка
— NLTK
— Transformers
🔸 Анализ данных/визуализация
— plotly
— DataComPy
🔸 Код соревнований Kaggle
🔸 Обучение с подкреплением
— DeepMind Lab
— ViZDoom
🔗 Ссылка на репозиторий Awesome Machine Learning
Этот репозиторий был вдохновлён другим — awesome-php. Включает в себя библиотеки, фреймворки и инструменты для машинного обучения на всех языках программирования: от С до Julia (Python, конечно, тоже есть).
Вот темы, которые есть в списке, на примере Python:
🔸 Компьютерное зрение
— SimpleCV
— pytessarct
🔸 Обработка естественного языка
— NLTK
— Transformers
🔸 Анализ данных/визуализация
— plotly
— DataComPy
🔸 Код соревнований Kaggle
🔸 Обучение с подкреплением
— DeepMind Lab
— ViZDoom
🔗 Ссылка на репозиторий Awesome Machine Learning
👍5
Forwarded from Библиотека нейросетей | ChatGPT, Midjourney, DeepSeek, Sora
This media is not supported in your browser
VIEW IN TELEGRAM
У нас вышла новая статья на
Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈
🛠 Инструменты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
⚡️ Вышел PyTorch 2.3
Основное нововведение — поддержка пользовательских ядер Triton в torch.compile. Их можно переносить без снижения производительности или сбоев в графике.
Triton — языковой компилятор для создания сильно оптимизированных ядер CUDA.
Помимо этого в PyTorch 2.3:
▫️Tensor Parallel API, который позволяет реализовать распределённые вычисления. API был специально адаптирован для обучения трансформеров с очень большим количеством параметров.
▫️Подкласс
🔗 Прочесть о релизе подробнее можно здесь
Основное нововведение — поддержка пользовательских ядер Triton в torch.compile. Их можно переносить без снижения производительности или сбоев в графике.
Помимо этого в PyTorch 2.3:
▫️Tensor Parallel API, который позволяет реализовать распределённые вычисления. API был специально адаптирован для обучения трансформеров с очень большим количеством параметров.
▫️Подкласс
torch.sparse.SparseSemiStructuredTensor
, который реализует полуструктурированную разреженность и позволяет добиться ускорения вычислений до 1.6 раза по сравнению с умножениями плотных (dense) матриц.🔗 Прочесть о релизе подробнее можно здесь
👍4🔥1
🦾🧠🏋Качаем мозги к лету!
Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации?
Тогда наш полугодовой курс «Математика для Data Science» от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40%
➡️ Математика для Data Science 29 990 ₽ 17 994 ₽
Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы.
У вас не будет шансов не усвоить какие-то темы курса👌
⭐️ Переходите и активируйте бесплатные вводные занятия курса – https://proglib.io/w/b1ca6fe9
Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации?
Тогда наш полугодовой курс «Математика для Data Science» от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40%
Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы.
У вас не будет шансов не усвоить какие-то темы курса👌
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Forwarded from Библиотека питониста | Python, Django, Flask
🐍🤔 «Задумчивый» код: временная сложность операций со структурами данных в Python
Вы когда-нибудь задумывались, почему некоторые операции в Python выполняются мгновенно, а другие заставляют ваш код «задумчиво» работать? В новой статье разбираемся во временной сложности и узнаём, как писать быстрый и эффективный код.
🔗 Читать статью
🔗 Зеркало
Вы когда-нибудь задумывались, почему некоторые операции в Python выполняются мгновенно, а другие заставляют ваш код «задумчиво» работать? В новой статье разбираемся во временной сложности и узнаём, как писать быстрый и эффективный код.
🔗 Читать статью
🔗 Зеркало
👍3
💬 Итак, настало время расшифровать аббревиатуры. На выбор:
🔹AI/ИИ
🔹ML
🔹DL
🔹GPT
🔹DS
👇Только неправильные ответы👇
🔹AI/ИИ
🔹ML
🔹DL
🔹GPT
🔹DS
👇Только неправильные ответы👇
😁8❤2
PySpark_SQL_Cheat_Sheet.pdf
5.1 MB
⭐ PySpark: небольшой гайд по библиотеке
PySpark — это Python API для Apache Spark. А Apache Spark, в свою очередь, представляет собой движок для распределённой обработки задач, связанных с большими данными. Так, PySpark позволяет работать с данными любого размера.
Библиотека поддерживает все функции Spark, включая Spark SQL и DataFrames.
🔸Spark SQL предназначен для работы со структурированными данными и позволяет сочетать SQL-запросы с программами Spark.
🔸PySpark DataFrames позволяет читать, записывать, трансформировать и анализировать данные.
👆К посту мы прикрепили небольшую шпаргалку по этим двум основным инструментам PySpark
PySpark — это Python API для Apache Spark. А Apache Spark, в свою очередь, представляет собой движок для распределённой обработки задач, связанных с большими данными. Так, PySpark позволяет работать с данными любого размера.
Библиотека поддерживает все функции Spark, включая Spark SQL и DataFrames.
🔸Spark SQL предназначен для работы со структурированными данными и позволяет сочетать SQL-запросы с программами Spark.
🔸PySpark DataFrames позволяет читать, записывать, трансформировать и анализировать данные.
👆К посту мы прикрепили небольшую шпаргалку по этим двум основным инструментам PySpark
👍5
🎓 Небольшая подборка бесплатных курсов по классическому машинному обучению
▫️Stanford CS229: Machine Learning by Andrew Ng
Культовый курс по основам машинного обучения с Эндрю Ыном, американским учёным-информатиком. Представляет собой набор видеолекций.
▫️Алгоритмы Машинного обучения с нуля
Курс на Stepik, на котором подробно разбираются основные алгоритмы классического ML: линейная и логистическая регрессии, метод k-ближайших соседей, случайный лес, метод главных компонент и др.
▫️HarvardX: CS50's Introduction to Artificial Intelligence with Python
Курс, рассказывающий о концептах и алгоритмах, лежащих в основе современного ML. Также в программе есть теория вероятностей, нейросети, NLP и др.
▫️Машинное обучение (курс лекций, К.В. Воронцов)
В курсе делается упор на глубокое понимание математических основ. Автор — зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ.
▫️Stanford CS229: Machine Learning by Andrew Ng
Культовый курс по основам машинного обучения с Эндрю Ыном, американским учёным-информатиком. Представляет собой набор видеолекций.
▫️Алгоритмы Машинного обучения с нуля
Курс на Stepik, на котором подробно разбираются основные алгоритмы классического ML: линейная и логистическая регрессии, метод k-ближайших соседей, случайный лес, метод главных компонент и др.
▫️HarvardX: CS50's Introduction to Artificial Intelligence with Python
Курс, рассказывающий о концептах и алгоритмах, лежащих в основе современного ML. Также в программе есть теория вероятностей, нейросети, NLP и др.
▫️Машинное обучение (курс лекций, К.В. Воронцов)
В курсе делается упор на глубокое понимание математических основ. Автор — зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ.
👍6❤5
Новая статья на «Хабре» посвящена анализу и прогнозированию валютных курсов с помощью такого подхода. Автор привёл примеры кода на Python и объяснил каждую используемую функцию.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍6
🤖🖼️ Как работают визуальные трансформеры: магия превращения пикселей в знания
Визуальные трансформеры (Vision Transformers, ViTs) — класс моделей глубокого обучения, которые достигли выдающихся результатов в задачах классификации изображений. В основе ViTs лежит архитектура трансформеров, изначально разработанная для обработки естественного языка.
В новой статье подробно рассказываем(с картинками) , как работают такие модели компьютерного зрения.
🔗 Читать статью
🔗 Зеркало
Визуальные трансформеры (Vision Transformers, ViTs) — класс моделей глубокого обучения, которые достигли выдающихся результатов в задачах классификации изображений. В основе ViTs лежит архитектура трансформеров, изначально разработанная для обработки естественного языка.
В новой статье подробно рассказываем
🔗 Читать статью
🔗 Зеркало
👍5❤2😁1
🤖 Машинное обучение для людей: Разбираемся простыми словами
Этот блогпост представляет собой большое введение для тех, кто хочет разобраться в машинном обучении без формул и теорем. Автор даёт много примеров реальных задач и их решений, а также старается писать об этом простым языком.
Вот темы, которые охватывает блогпост:
🔹составляющие машинного обучения;
🔹алгоритмы обучения с учителем;
🔹алгоритмы обучения без учителя;
🔹уменьшение размерности;
🔹обучение с подкреплением;
🔹ансамбли;
🔹глубокое обучение и нейросети.
🔗 Ссылка на материал
Этот блогпост представляет собой большое введение для тех, кто хочет разобраться в машинном обучении без формул и теорем. Автор даёт много примеров реальных задач и их решений, а также старается писать об этом простым языком.
Вот темы, которые охватывает блогпост:
🔹составляющие машинного обучения;
🔹алгоритмы обучения с учителем;
🔹алгоритмы обучения без учителя;
🔹уменьшение размерности;
🔹обучение с подкреплением;
🔹ансамбли;
🔹глубокое обучение и нейросети.
🔗 Ссылка на материал
vas3k.blog
Машинное обучение для людей
None
👍8🔥4❤1
✍️ Правила внедрения машинного обучения от Google
У Google есть целый документ, в котором перечислены лучшие практики для специалистов по машинному обучению. Мы приведём избранные правила.
✅ Не бойтесь запускать продукт без машинного обучения
Для машинного обучения всегда нужны данные. Если с этим есть проблема, то стоит попробовать использовать для своего продукта нечто другое, какую-нибудь простую эвристику. Иными словами, если ML не является абсолютно необходимым для вашего продукта, не применяйте его, пока у вас не будет достаточно данных.
✅ Сначала придумайте метрики
Прежде чем определиться, что будет делать ваша система машинного обучения, попробуйте отследить как можно больше показателей в вашей текущей системе.
✅ Между сложной эвристикой и машинным обучением выбирайте второе
Простая эвристика может помочь быстро запустить продукт. Сложную эвристику трудно поддерживать. Как только у вас появятся данные и базовое представление о том, чего вы пытаетесь достичь, переходите к машинному обучению.
✅ Сделайте первую модель простой и правильно настройте инфраструктуру
Прежде чем кто-либо сможет использовать вашу новую продвинутую систему машинного обучения, вам необходимо будет определить:
- Как давать примеры на вход алгоритму.
- Что такое «хорошо» и «плохо» для вашей системы.
- Как интегрировать модель в ваше приложение.
Специалисты Google также советуют выбирать простые признаки для модели.
✅ Постарайтесь обнаружить проблемы перед экспортом моделей
В частности, убедитесь, что производительность модели на отложенных данных находится на разумном уровне. Если у вас остаются опасения по поводу данных, не экспортируйте модель.
✅ Не зацикливайтесь на выборе оптимизируемой цели
На ранних этапах процесса машинного обучения можно заметить, что улучшаются все показатели, даже те, которые вы не оптимизируете напрямую. Например, вам важно количество кликов и время, проведённое на сайте. Если вы оптимизируете количество кликов, скорее всего, вы увидите и увеличение времени на сайте. Старайтесь сохранять процесс простым и не перегружайте себя размышлениями о балансе различных метрик.
✅ Выберите простую метрику для вашей первой цели
Проще всего моделировать поведение пользователя, которое можно наблюдать непосредственно. Например, факт клика по ссылке, оценки чего-либо и т.д. Избегайте моделирования косвенных эффектов вначале: не стоит пытаться отследить посетил ли пользователь сайт на следующий день и как долго он находился на сайте. Наконец, не нужно пытаться заставить машинное обучение выяснить, счастлив ли пользователь.
✅ Логируйте
Стоит сохранять набор признаков, используемых во время применения модели, а затем использовать их во время обучения. Даже если вы не можете сделать это для каждого примера, сделайте хотя бы для небольшой части.
✅ Не тратьте время на новые признаки, если проблемой стали несогласованные цели
Если цели, поставленные перед алгоритмом или системой машинного обучения, не соответствуют общим целям продукта или бизнеса, то не стоит пытаться решить их примитивным добавлением новых признаков.
У Google есть целый документ, в котором перечислены лучшие практики для специалистов по машинному обучению. Мы приведём избранные правила.
✅ Не бойтесь запускать продукт без машинного обучения
Для машинного обучения всегда нужны данные. Если с этим есть проблема, то стоит попробовать использовать для своего продукта нечто другое, какую-нибудь простую эвристику. Иными словами, если ML не является абсолютно необходимым для вашего продукта, не применяйте его, пока у вас не будет достаточно данных.
✅ Сначала придумайте метрики
Прежде чем определиться, что будет делать ваша система машинного обучения, попробуйте отследить как можно больше показателей в вашей текущей системе.
✅ Между сложной эвристикой и машинным обучением выбирайте второе
Простая эвристика может помочь быстро запустить продукт. Сложную эвристику трудно поддерживать. Как только у вас появятся данные и базовое представление о том, чего вы пытаетесь достичь, переходите к машинному обучению.
✅ Сделайте первую модель простой и правильно настройте инфраструктуру
Прежде чем кто-либо сможет использовать вашу новую продвинутую систему машинного обучения, вам необходимо будет определить:
- Как давать примеры на вход алгоритму.
- Что такое «хорошо» и «плохо» для вашей системы.
- Как интегрировать модель в ваше приложение.
Специалисты Google также советуют выбирать простые признаки для модели.
✅ Постарайтесь обнаружить проблемы перед экспортом моделей
В частности, убедитесь, что производительность модели на отложенных данных находится на разумном уровне. Если у вас остаются опасения по поводу данных, не экспортируйте модель.
✅ Не зацикливайтесь на выборе оптимизируемой цели
На ранних этапах процесса машинного обучения можно заметить, что улучшаются все показатели, даже те, которые вы не оптимизируете напрямую. Например, вам важно количество кликов и время, проведённое на сайте. Если вы оптимизируете количество кликов, скорее всего, вы увидите и увеличение времени на сайте. Старайтесь сохранять процесс простым и не перегружайте себя размышлениями о балансе различных метрик.
✅ Выберите простую метрику для вашей первой цели
Проще всего моделировать поведение пользователя, которое можно наблюдать непосредственно. Например, факт клика по ссылке, оценки чего-либо и т.д. Избегайте моделирования косвенных эффектов вначале: не стоит пытаться отследить посетил ли пользователь сайт на следующий день и как долго он находился на сайте. Наконец, не нужно пытаться заставить машинное обучение выяснить, счастлив ли пользователь.
✅ Логируйте
Стоит сохранять набор признаков, используемых во время применения модели, а затем использовать их во время обучения. Даже если вы не можете сделать это для каждого примера, сделайте хотя бы для небольшой части.
✅ Не тратьте время на новые признаки, если проблемой стали несогласованные цели
Если цели, поставленные перед алгоритмом или системой машинного обучения, не соответствуют общим целям продукта или бизнеса, то не стоит пытаться решить их примитивным добавлением новых признаков.
👍8👏4❤3
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
😢1
Python — гибкий язык, позволяющий писать некоторые куски кода в одну строку. Эта особенность, конечно, распространяется и на популярные библиотеки для Data Science.
## Качество воздуха по городам
X = np.array(
[[ 42, 40, 41, 43, 44, 43 ], # Hong Kong
[ 30, 31, 29, 29, 29, 30 ], # New York
[ 8, 13, 31, 11, 11, 9 ], # Berlin
[ 11, 11, 12, 13, 11, 12 ]]) # Montreal
cities = np.array(["Hong Kong", "New York", "Berlin", "Montreal"])
polluted = set(cities[np.nonzero(X > np.average(X))[0]])
print(polluted) # ->
'''
{'Berlin', 'Hong Kong', 'New York'}
'''
## Каждая строка представляет собой корзину покупателя
## row = [course 1, course 2, ebook 1, ebook 2]
## Значение 1 говорит о том, что предмет был куплен.
basket = np.array([[0, 1, 1, 0],
[0, 0, 0, 1],
[1, 1, 0, 0],
[0, 1, 1, 1],
[1, 1, 1, 0],
[0, 1, 1, 0],
[1, 1, 0, 1],
[1, 1, 1, 1]])
copurchases = np.sum(np.all(basket[:,2:], axis = 1)) / basket.shape[0]
print(copurchases) # Выводит долю случаев, когда два конкретных товара (ebook 1 и ebook 2) были куплены вместе
## Годовая зарплата в $1000 [2017, 2018, 2019]
alice = [99, 101, 103]
bob = [110, 108, 105]
tim = [90, 88, 85]
salaries = np.array([alice, bob, tim])
taxation = np.array([[0.2, 0.25, 0.22],
[0.4, 0.5, 0.5],
[0.1, 0.2, 0.1]])
max_income = np.max(salaries - salaries * taxation)
print(max_income)
from sklearn.linear_model import LogisticRegression
import numpy as np
## [Количество сигарет, наличие рака]
X = np.array([[0, "No"],
[10, "No"],
[60, "Yes"],
[90, "Yes"]])
model = LogisticRegression().fit(X[:,0].reshape(-1,1), X[:,1])
print(model.predict([[2],[12],[13],[40],[90]])) # -> ['No' 'No' 'No' 'Yes' 'Yes']
## Ежедневные цены на акции 5 компаний
x = np.array([[8, 9, 11, 12],
[1, 2, 2, 1],
[2, 8, 9, 9],
[9, 6, 6, 3],
[3, 3, 3, 3]])
avg, var, std = np.average(x, axis=1), np.var(x, axis=1), np.std(x, axis=1)
print("Averages: " + str(avg))
print("Variances: " + str(var))
print("Standard Deviations: " + str(std))
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤7🔥3
🚀 Продвинутые курсы от Google по решению задач машинного обучения
Это подборка небольших курсов от Google, каждый из которых рассматривает конкретную задачу или подход.
🔹Леса решений
Рассказывает о том, что такое деревья решений, и как работают их ансамбли.
🔹Рекомендательные системы
Охватывает коллаборативную фильтрацию, user-based и item-based алгоритмы, а также нейросети.
🔹Кластеризация
Рассказывает о подготовке данных, использовании алгоритмов (k-means) и оценке результатов.
🔹Генеративно-состязательные сети (GAN)
Формирует понимание того, как устроены такие сети.
🔹Классификация изображений
Курс рассматривает в основном свёрточные нейронные сети.
Это подборка небольших курсов от Google, каждый из которых рассматривает конкретную задачу или подход.
🔹Леса решений
Рассказывает о том, что такое деревья решений, и как работают их ансамбли.
🔹Рекомендательные системы
Охватывает коллаборативную фильтрацию, user-based и item-based алгоритмы, а также нейросети.
🔹Кластеризация
Рассказывает о подготовке данных, использовании алгоритмов (k-means) и оценке результатов.
🔹Генеративно-состязательные сети (GAN)
Формирует понимание того, как устроены такие сети.
🔹Классификация изображений
Курс рассматривает в основном свёрточные нейронные сети.
👏6❤1
🔥 Коллекция датасетов для больших языковых моделей (LLM)
ML-инженер под ником Maxime Labonne поделился в X своим репозиторием с набором датасетов. Все они подходят для файн-тюнинга языковых моделей, то есть могут сделать их более специализированными и подходящими для решения конкретных задач.
Датасеты разделены на категории в зависимости от того, какие задачи будет решать LLM:
▫️общего назначения;
▫️математические;
▫️генерации кода;
▫️диалоговые;
▫️выполнения роли агентов с возможностью вызова функций.
🔗 Ссылка на репозиторий
ML-инженер под ником Maxime Labonne поделился в X своим репозиторием с набором датасетов. Все они подходят для файн-тюнинга языковых моделей, то есть могут сделать их более специализированными и подходящими для решения конкретных задач.
Датасеты разделены на категории в зависимости от того, какие задачи будет решать LLM:
▫️общего назначения;
▫️математические;
▫️генерации кода;
▫️диалоговые;
▫️выполнения роли агентов с возможностью вызова функций.
🔗 Ссылка на репозиторий
👍4
🎓 Подборка бесплатных курсов по глубокому машинному обучению
▪️Deep Learning School
Это образовательный проект Физтех-школы прикладной математики и информатики МФТИ. Обучение идёт бесплатно. Нужно просто зарегистрироваться на курс на сайте, заполнив форму. За новым набором можно следить в группе VK. Кроме того, лекции и семинары DLS доступны в любое время на Stepik.
▪️Нейронные сети
Курс от Института биоинформатики. Делает упор на математической базе нейросетей, содержит много практических заданий и тестов.
▪️MIT 6.S191. Introduction to Deep Learning
Это вводный курс Массачусетского технологического института по методам глубокого обучения. Затрагивает обработку естественного языка, компьютерное зрение и др. В свободном доступе уже есть лекции, слайды и код программы 2022 года. Вот здесь можно подписаться на уведомления о выходе более свежих лекций.
▪️Practical Deep Learning for Coders
Это курс для людей, у которых уже есть опыт разработки. Затрагивает следующие темы: обучение DL моделей для компьютерного зрения, обработки естественного языка, развёртывание моделей, использование PyTorch, fastai и Hugging Face.
▪️Learn PyTorch for Deep Learning: Zero to Mastery book
Онлайн-книга, посвящённая конкретно PyTorch. Начинает с основ и заканчивает внедрением моделей.
▪️Deep Learning School
Это образовательный проект Физтех-школы прикладной математики и информатики МФТИ. Обучение идёт бесплатно. Нужно просто зарегистрироваться на курс на сайте, заполнив форму. За новым набором можно следить в группе VK. Кроме того, лекции и семинары DLS доступны в любое время на Stepik.
▪️Нейронные сети
Курс от Института биоинформатики. Делает упор на математической базе нейросетей, содержит много практических заданий и тестов.
▪️MIT 6.S191. Introduction to Deep Learning
Это вводный курс Массачусетского технологического института по методам глубокого обучения. Затрагивает обработку естественного языка, компьютерное зрение и др. В свободном доступе уже есть лекции, слайды и код программы 2022 года. Вот здесь можно подписаться на уведомления о выходе более свежих лекций.
▪️Practical Deep Learning for Coders
Это курс для людей, у которых уже есть опыт разработки. Затрагивает следующие темы: обучение DL моделей для компьютерного зрения, обработки естественного языка, развёртывание моделей, использование PyTorch, fastai и Hugging Face.
▪️Learn PyTorch for Deep Learning: Zero to Mastery book
Онлайн-книга, посвящённая конкретно PyTorch. Начинает с основ и заканчивает внедрением моделей.
❤5👍2🔥1