Шаблоны Langchain-самый быстрый способ создать готовое к производству приложение LLM.
https://github.com/langchain-ai/langchain/tree/master/templates
https://github.com/langchain-ai/langchain/tree/master/templates
👍2
10 основных навыков использования Jupyter Notebook для специалистов по обработке данных
Jupyter Notebook, веб-приложение с открытым исходным кодом, стало популярным инструментом для специалистов по данным во всем мире. Его интерактивный и удобный интерфейс делает его отличным выбором для анализа данных, визуализации и обмена информацией. Если вы занимаетесь анализом данных или стремитесь им стать, вам необходимо освоить Jupyter Notebook. В этой статье мы рассмотрим десять важнейших навыков, которые помогут повысить ваш уровень владения Jupyter Notebook https://www.analyticsinsight.net/10-essential-jupyter-notebook-skills-for-data-scientists
Jupyter Notebook, веб-приложение с открытым исходным кодом, стало популярным инструментом для специалистов по данным во всем мире. Его интерактивный и удобный интерфейс делает его отличным выбором для анализа данных, визуализации и обмена информацией. Если вы занимаетесь анализом данных или стремитесь им стать, вам необходимо освоить Jupyter Notebook. В этой статье мы рассмотрим десять важнейших навыков, которые помогут повысить ваш уровень владения Jupyter Notebook https://www.analyticsinsight.net/10-essential-jupyter-notebook-skills-for-data-scientists
Analytics Insight
10 Essential Jupyter Notebook Skills for Data Scientists
Unlock the full potential of Jupyter Notebook with these 10 essential skills for data scientists. Elevate your capabilities and become a proficient data scientist today. “Read more here”.
🚂 Онлайн-хакатон DataWagon с призовым фондом 900 000 рублей от Первой грузовой компании!
🛤 Треки:
1. ПГК Оракул - Прогнозирование спроса на грузовые ЖД перевозки
2. Чек-ап вагона - Прогнозирование отправления вагонов в ремонт
3. ЖД карта желаний - Создание карты движения поездов
🔝 Тебя ждут:
- Прокачка в решении практических задач на основе реальных данных
- Поддержка опытных экспертов ПГК Диджитал
- Погружение в атмосферу кодинга и фана
Если нет своей команды — поможем ее собрать!
Регистрируйся и вступай в чат участников, получи ответы на волнующие вопросы, найди команду или создай свою.
▶️ Регистрация уже идет, успевай подать заявку по ссылке
Реклама. ООО "ФИЗТЕХ ДЖЕНЕЗИС". ИНН 7735184156. erid: LjN8KYtZV
🛤 Треки:
1. ПГК Оракул - Прогнозирование спроса на грузовые ЖД перевозки
2. Чек-ап вагона - Прогнозирование отправления вагонов в ремонт
3. ЖД карта желаний - Создание карты движения поездов
🔝 Тебя ждут:
- Прокачка в решении практических задач на основе реальных данных
- Поддержка опытных экспертов ПГК Диджитал
- Погружение в атмосферу кодинга и фана
Если нет своей команды — поможем ее собрать!
Регистрируйся и вступай в чат участников, получи ответы на волнующие вопросы, найди команду или создай свою.
▶️ Регистрация уже идет, успевай подать заявку по ссылке
Реклама. ООО "ФИЗТЕХ ДЖЕНЕЗИС". ИНН 7735184156. erid: LjN8KYtZV
Forwarded from Добро пожаловать в мир Python
This media is not supported in your browser
VIEW IN TELEGRAM
Фундаментальные понятия статистики и строительные блоки #DataAnalytics и #MachineLearning.
Набор Python matplotlib интерактивных приборных панелей, чтобы помочь вам понять эти фундаментальные концепции
https://github.com/GeostatsGuy/PythonNumericalDemos/blob/master/Interactive_MarginalJointConditional.ipynb
Набор Python matplotlib интерактивных приборных панелей, чтобы помочь вам понять эти фундаментальные концепции
https://github.com/GeostatsGuy/PythonNumericalDemos/blob/master/Interactive_MarginalJointConditional.ipynb
Математика для глубокого обучения 🧑🎓
Лучший ресурс для изучения математических концепций и лучшего понимания концепций машинного обучения и глубокого обучения:
https://d2l.ai/chapter_appendix-mathematics-for-deep-learning/index.html
Лучший ресурс для изучения математических концепций и лучшего понимания концепций машинного обучения и глубокого обучения:
https://d2l.ai/chapter_appendix-mathematics-for-deep-learning/index.html
Mimesis: идеальное решение для генерации данных.
Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является дорогостоящим или затрудненным из-за внешних условий. Кроме того, правила конфиденциальности влияют на способы использования или распространения набора данных. По всем этим причинам использование синтетических данных является хорошей альтернативой, поскольку с их помощью можно удовлетворить те же потребности без особых усилий.
В этой статье мы рассмотрим один из лучших пакетов для генерации синтетических данных.
Читать далее https://habr.com/ru/articles/771950/
Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является дорогостоящим или затрудненным из-за внешних условий. Кроме того, правила конфиденциальности влияют на способы использования или распространения набора данных. По всем этим причинам использование синтетических данных является хорошей альтернативой, поскольку с их помощью можно удовлетворить те же потребности без особых усилий.
В этой статье мы рассмотрим один из лучших пакетов для генерации синтетических данных.
Читать далее https://habr.com/ru/articles/771950/
Хабр
Mimesis: идеальное решение для генерации данных
Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является...
Lazy Predict помогает создавать множество базовых моделей без большого количества кода и помогает понять, какие модели работают лучше без какой-либо настройки параметров.
Библиотека Python, которая позволяет обучать, тестировать и оценивать несколько моделей машинного обучения одновременно, используя всего несколько строк кода. https://github.com/shankarpandala/lazypredict
Библиотека Python, которая позволяет обучать, тестировать и оценивать несколько моделей машинного обучения одновременно, используя всего несколько строк кода. https://github.com/shankarpandala/lazypredict
101 упражнение Pandas для анализа данных
101 упражнение Python Pandas предназначены для того, чтобы бросить вызов вашим логическим мышцам и помочь усвоить манипулирование данными с помощью любимого пакета Python для анализа данных.
https://www.machinelearningplus.com/python/101-pandas-exercises-python/
101 упражнение Python Pandas предназначены для того, чтобы бросить вызов вашим логическим мышцам и помочь усвоить манипулирование данными с помощью любимого пакета Python для анализа данных.
https://www.machinelearningplus.com/python/101-pandas-exercises-python/
Примеры, показывающие, как использовать API-интерфейс OpenAI Vision для обработки изображений, видеофайлов и потоков веб-камеры. Полностью автоматизированная маркировка изображений с помощью кода API GroundingDINO + SAM + OpenAI Vision: https://github.com/roboflow/awesome-openai-vision-api-experiments
Создание поиска в видео
Сегодня мы собираемся взглянуть на закулисную технологию, лежащую в основе того, как Netflix создает великолепные трейлеры, ролики для Instagram, короткометражные видеоролики и другие рекламные видеоролики.
Предположим, вы пытаетесь создать трейлер к боевику «Серый человек» и знаете, что хотите использовать кадр взрывающейся машины. Вы не знаете, существует ли этот кадр и где он находится в фильме, и вам приходится искать его, просматривая весь фильм.
Мы создали внутреннюю систему, которая позволяет кому-то выполнять поиск внутри видео по всему видеокаталогу Netflix, и мы хотели быподелиться своим опытом создания этой системы.
https://netflixtechblog.com/building-in-video-search-936766f0017c
Сегодня мы собираемся взглянуть на закулисную технологию, лежащую в основе того, как Netflix создает великолепные трейлеры, ролики для Instagram, короткометражные видеоролики и другие рекламные видеоролики.
Предположим, вы пытаетесь создать трейлер к боевику «Серый человек» и знаете, что хотите использовать кадр взрывающейся машины. Вы не знаете, существует ли этот кадр и где он находится в фильме, и вам приходится искать его, просматривая весь фильм.
Мы создали внутреннюю систему, которая позволяет кому-то выполнять поиск внутри видео по всему видеокаталогу Netflix, и мы хотели быподелиться своим опытом создания этой системы.
https://netflixtechblog.com/building-in-video-search-936766f0017c
Medium
Building In-Video Search
Empowering video editors with multimodal machine learning to discover perfect moments across the entire Netflix catalog
👍2
Бесплатный практический вебинар: Рабочий день аналитика данных.
⏰ Когда: 15 ноября в 19:00 по мск.
✔️Погружаемся в профессию и составляем отчет о продажах интернет-магазина.
✔️Покажем, какие задачи решают аналитики данных, какие проекты реализуют и как помогают бизнесу принимать решения и расти.
✔️Расскажем, как пройти собеседование, найти удаленную работу и начать менять свою жизнь уже сегодня.
🎁 Дарим скидку 100 000 рублей на курс «Аналитик данных» и 20 000 рублей депозит до 19 ноября, а еще + 6 месяцев сопровождения наставника и карьерного трека после обучения!
Реклама. АНПОО "ХЕКСЛЕТ КОЛЛЕДЖ". ИНН 7839056670. erid: LjN8JycWu
⏰ Когда: 15 ноября в 19:00 по мск.
✔️Погружаемся в профессию и составляем отчет о продажах интернет-магазина.
✔️Покажем, какие задачи решают аналитики данных, какие проекты реализуют и как помогают бизнесу принимать решения и расти.
✔️Расскажем, как пройти собеседование, найти удаленную работу и начать менять свою жизнь уже сегодня.
🎁 Дарим скидку 100 000 рублей на курс «Аналитик данных» и 20 000 рублей депозит до 19 ноября, а еще + 6 месяцев сопровождения наставника и карьерного трека после обучения!
Реклама. АНПОО "ХЕКСЛЕТ КОЛЛЕДЖ". ИНН 7839056670. erid: LjN8JycWu
Выпустив недавно отличную языковую модель Zephyr, команда HuggingFace демонстрирует, как можно обучать персонализированные модели, построенные на основе нескольких мощных предварительно обученных моделей с открытым исходным кодом. подробнее→ https://github.com/huggingface/alignment-handbook
Суперразрешение аудио (GitHub Repo) Сверхразрешение звука - это процесс повышения качества и достоверности любого звука, реального или синтетического. Большинство систем суперразрешения ориентированы на конкретные задачи, при этом отдельные модели обучаются для отдельных типов аудиоданных. Эта новая работа - удивительный шаг вперед, когда одна модель может служить для повышения качества звука в разных задачах. подробнее→ https://github.com/haoheliu/versatile_audio_super_resolution
Суперразрешение аудио (GitHub Repo) Сверхразрешение звука - это процесс повышения качества и достоверности любого звука, реального или синтетического. Большинство систем суперразрешения ориентированы на конкретные задачи, при этом отдельные модели обучаются для отдельных типов аудиоданных. Эта новая работа - удивительный шаг вперед, когда одна модель может служить для повышения качества звука в разных задачах. подробнее→ https://github.com/haoheliu/versatile_audio_super_resolution
GitHub
GitHub - huggingface/alignment-handbook: Robust recipes to align language models with human and AI preferences
Robust recipes to align language models with human and AI preferences - huggingface/alignment-handbook
This media is not supported in your browser
VIEW IN TELEGRAM
Итак, Генеративный ИИ в РЕАЛЬНОМ ВРЕМЕНИ уже здесь. 🔥
Все инструменты проектирования, все рабочие процессы — ВСЕ изменится.
💡Вот все, что вам нужно знать о LCM-LoRA.
https://arxiv.org/abs/2311.05556
https://latent-consistency-models.github.io/
Все инструменты проектирования, все рабочие процессы — ВСЕ изменится.
💡Вот все, что вам нужно знать о LCM-LoRA.
https://arxiv.org/abs/2311.05556
https://latent-consistency-models.github.io/
Сегментация дорог с помощью лидара (GitHub Repo) Исследователи разработали для самоуправляемых автомобилей более интеллектуальный метод распознавания дорог с помощью технологии лидара, который требует меньше ручной работы, но при этом сохраняет точность системы. подробнее→ https://github.com/evocargo/lidar-annotation-is-all-you-need
GitHub
GitHub - Evocargo/Lidar-Annotation-is-All-You-Need: 2D road segmentation using lidar data during training
2D road segmentation using lidar data during training - GitHub - Evocargo/Lidar-Annotation-is-All-You-Need: 2D road segmentation using lidar data during training
👍5
Представляем Mirasol, мультимодальную модель для обучения через аудио, видео и текст, которая разделяет моделирование на отдельные авторегрессионные модели для обработки входных данных в соответствии с характеристиками их модальностей, обеспечивая высочайшую производительность
https://blog.research.google/2023/11/scaling-multimodal-understanding-to.html
https://blog.research.google/2023/11/scaling-multimodal-understanding-to.html
research.google
Scaling multimodal understanding to long videos
Posted by Isaac Noble, Software Engineer, Google Research, and Anelia Angelova, Research Scientist, Google DeepMind When building machine learning...
🙌Топ-10 🐍 Библиотек Python для любых проектов машинного обучения 🚀
https://dev.to/taipy/top-10-python-libraries-for-any-ml-projects-3gfp
https://dev.to/taipy/top-10-python-libraries-for-any-ml-projects-3gfp
DEV Community
🙌Top 10 🐍 Python libraries for any ML projects 🚀
TL;DR In this article, I’ll give you the ultimate Python libraries for any Machine...
Ускорение генеративного искусственного интеллекта с помощью PyTorch: сегментируйте что угодно быстро
Этот пост является первой частью многосерийного блога, посвященного тому, как ускорить генеративные модели ИИ с помощью чистого, нативного PyTorch. Мы рады поделиться множеством недавно выпущенных функций производительности PyTorch, а также практическими примерами того, как эти функции можно комбинировать, чтобы увидеть, насколько далеко мы можем повысить производительность PyTorch. https://pytorch.org/blog/accelerating-generative-ai/
Этот пост является первой частью многосерийного блога, посвященного тому, как ускорить генеративные модели ИИ с помощью чистого, нативного PyTorch. Мы рады поделиться множеством недавно выпущенных функций производительности PyTorch, а также практическими примерами того, как эти функции можно комбинировать, чтобы увидеть, насколько далеко мы можем повысить производительность PyTorch. https://pytorch.org/blog/accelerating-generative-ai/
Практические советы по точной настройке LLM с использованием LoRA
https://magazine.sebastianraschka.com/p/practical-tips-for-finetuning-llms
https://magazine.sebastianraschka.com/p/practical-tips-for-finetuning-llms
Sebastianraschka
Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation)
Things I Learned From Hundreds of Experiments
Модель прогнозирования погоды DeepMind (репозиторий GitHub)
DeepMind уже несколько лет работает над прогнозированием погоды. Последняя модель, построенная на графовых нейронных сетях, чрезвычайно точна для 10-дневных прогнозов. https://github.com/google-deepmind/graphcast
Интерполяция видеокадров с индексацией расстояния
Существующие методы интерполяции видеокадров (VFI) слепо предсказывают, где находится каждый объект в определенный момент времени t («индексация времени»), что затрудняет предсказание точных движений объекта. Учитывая два изображения ⚾️, существует бесконечно много возможных траекторий: ускоряющихся или замедляющихся, прямых или изогнутых. Это часто приводит к размытым кадрам, поскольку метод усредняет эти возможности. Вместо того, чтобы заставлять сеть неявно изучать это сложное сопоставление времени и местоположения вместе с прогнозированием кадров, мы предоставляем сети явную подсказку о том, как далеко объект прошел между начальным и конечным кадрами. Новый подход получил название «индексация расстояния». https://zzh-tech.github.io/InterpAny-Clearer
DeepMind уже несколько лет работает над прогнозированием погоды. Последняя модель, построенная на графовых нейронных сетях, чрезвычайно точна для 10-дневных прогнозов. https://github.com/google-deepmind/graphcast
Интерполяция видеокадров с индексацией расстояния
Существующие методы интерполяции видеокадров (VFI) слепо предсказывают, где находится каждый объект в определенный момент времени t («индексация времени»), что затрудняет предсказание точных движений объекта. Учитывая два изображения ⚾️, существует бесконечно много возможных траекторий: ускоряющихся или замедляющихся, прямых или изогнутых. Это часто приводит к размытым кадрам, поскольку метод усредняет эти возможности. Вместо того, чтобы заставлять сеть неявно изучать это сложное сопоставление времени и местоположения вместе с прогнозированием кадров, мы предоставляем сети явную подсказку о том, как далеко объект прошел между начальным и конечным кадрами. Новый подход получил название «индексация расстояния». https://zzh-tech.github.io/InterpAny-Clearer
GitHub
GitHub - google-deepmind/graphcast
Contribute to google-deepmind/graphcast development by creating an account on GitHub.
Microsoft запустила лучший курс по генеративному искусственному интеллекту. Бесплатный курс из 12 уроков доступен на Github и научит вас всему, что вам нужно знать, чтобы начать создавать приложения генеративного ИИ.
https://github.com/microsoft/generative-ai-for-beginners
https://github.com/microsoft/generative-ai-for-beginners
GitHub
GitHub - microsoft/generative-ai-for-beginners: 21 Lessons, Get Started Building with Generative AI
21 Lessons, Get Started Building with Generative AI - GitHub - microsoft/generative-ai-for-beginners: 21 Lessons, Get Started Building with Generative AI
👍3