Создайте языковую модель в своих чатах WhatsApp
Визуальное руководство по архитектуре GPT с приложением
В этой статье я расскажу вам о своем пути создания (маленькой) языковой модели, которая генерирует синтетические разговоры, используя мои сообщения чата WhatsApp в качестве входных данных. https://towardsdatascience.com/build-a-language-model-on-your-whatsapp-chats-31264a9ced90
Визуальное руководство по архитектуре GPT с приложением
В этой статье я расскажу вам о своем пути создания (маленькой) языковой модели, которая генерирует синтетические разговоры, используя мои сообщения чата WhatsApp в качестве входных данных. https://towardsdatascience.com/build-a-language-model-on-your-whatsapp-chats-31264a9ced90
Medium
Build a Language Model on Your WhatsApp Chats
A visual guide through the GPT architecture with an application
🏆Как освоить 📊 конвейеры больших данных с помощью Taipy и PySpark 🐍
В этой статье будет использован простой пример, чтобы продемонстрировать, как мы можем интегрировать PySpark с Taipy , чтобы соединить ваши потребности в обработке больших данных с интеллектуальным выполнением заданий . https://dev.to/taipy/how-to-master-big-data-pipelines-with-taipy-and-pyspark-14oe
В этой статье будет использован простой пример, чтобы продемонстрировать, как мы можем интегрировать PySpark с Taipy , чтобы соединить ваши потребности в обработке больших данных с интеллектуальным выполнением заданий . https://dev.to/taipy/how-to-master-big-data-pipelines-with-taipy-and-pyspark-14oe
DEV Community
🏆How to master 📊 Big Data pipelines with Taipy and PySpark 🐍
This article will employ a simple example to demonstrate how we can integrate PySpark with Taipy to...
👍1
Ускорение генеративного ИИ с Pytorch II: GPT, быстро.
https://pytorch.org/blog/accelerating-generative-ai-2/
https://pytorch.org/blog/accelerating-generative-ai-2/
llamafile - это комбинация llama.cpp и Cosmopolitan libc. Это означает, что вы можете использовать практически любой процессор на любой ОС и упаковать свою модель в один исполняемый файл.
больше→ https://github.com/Mozilla-Ocho/llamafile
больше→ https://github.com/Mozilla-Ocho/llamafile
GitHub
GitHub - mozilla-ai/llamafile: Distribute and run LLMs with a single file.
Distribute and run LLMs with a single file. Contribute to mozilla-ai/llamafile development by creating an account on GitHub.
Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT
Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.
Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.
И бонусом затронем новую модель для качественного подробного описания фото.
UPD: Добавлена информация для запуска на Windows с ускорением на AMD. https://habr.com/ru/articles/776314/
Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.
Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.
И бонусом затронем новую модель для качественного подробного описания фото.
UPD: Добавлена информация для запуска на Windows с ускорением на AMD. https://habr.com/ru/articles/776314/
Хабр
Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT
OpenChat 7B запущенный локально через text-generation-webui Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я...
Mimesis: идеальное решение для генерации данных.
Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является дорогостоящим или затрудненным из-за внешних условий. Кроме того, правила конфиденциальности влияют на способы использования или распространения набора данных. По всем этим причинам использование синтетических данных является хорошей альтернативой, поскольку с их помощью можно удовлетворить те же потребности без особых усилий.
В этой статье мы рассмотрим один из лучших пакетов для генерации синтетических данных.
Читать далее https://habr.com/ru/articles/771950
Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является дорогостоящим или затрудненным из-за внешних условий. Кроме того, правила конфиденциальности влияют на способы использования или распространения набора данных. По всем этим причинам использование синтетических данных является хорошей альтернативой, поскольку с их помощью можно удовлетворить те же потребности без особых усилий.
В этой статье мы рассмотрим один из лучших пакетов для генерации синтетических данных.
Читать далее https://habr.com/ru/articles/771950
Хабр
Mimesis: идеальное решение для генерации данных
Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является...
Кто такие LLM-агенты и что они умеют?.
В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными темпами, привлекая внимание не только специалистов в области машинного обучения, но и обычных пользователей. Кто-то высказывает массу опасений насчет их дальнейшего развития, а кто-то и вовсе предлагает бомбить дата-центры — и даже в Белом Доме обсуждают будущее моделей. Но неужели текстом можно кому-то навредить? А что если такая модель приобрела бы агентность, смогла создать себе физическую оболочку и полностью ей управлять? Ну, это какая-то фантастика из (не)далёкого будущего, а про агентов нашего времени я расскажу в этой статье. И не переживайте — знание машинного обучения вам не понадобится!
Читать далее https://habr.com/ru/companies/ods/articles/776478
В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными темпами, привлекая внимание не только специалистов в области машинного обучения, но и обычных пользователей. Кто-то высказывает массу опасений насчет их дальнейшего развития, а кто-то и вовсе предлагает бомбить дата-центры — и даже в Белом Доме обсуждают будущее моделей. Но неужели текстом можно кому-то навредить? А что если такая модель приобрела бы агентность, смогла создать себе физическую оболочку и полностью ей управлять? Ну, это какая-то фантастика из (не)далёкого будущего, а про агентов нашего времени я расскажу в этой статье. И не переживайте — знание машинного обучения вам не понадобится!
Читать далее https://habr.com/ru/companies/ods/articles/776478
Хабр
Кто такие LLM-агенты и что они умеют?
В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными...
❤1
MLX — это эффективная среда машинного обучения , специально разработанная для процессоров Apple
Code: https://github.com/ml-explore/mlx
Docs: https://ml-explore.github.io/mlx/build/html/index.html
Code: https://github.com/ml-explore/mlx
Docs: https://ml-explore.github.io/mlx/build/html/index.html
GitHub
GitHub - ml-explore/mlx: MLX: An array framework for Apple silicon
MLX: An array framework for Apple silicon. Contribute to ml-explore/mlx development by creating an account on GitHub.
Кураторский список потрясающих библиотек с открытым исходным кодом для развертывания, мониторинга, версии и масштабирования вашего машинного обучения.
https://github.com/EthicalML/awesome-production-machine-learning
https://github.com/EthicalML/awesome-production-machine-learning
GitHub
GitHub - EthicalML/awesome-production-machine-learning: A curated list of awesome open source libraries to deploy, monitor, version…
A curated list of awesome open source libraries to deploy, monitor, version and scale your machine learning - EthicalML/awesome-production-machine-learning
👍3
Cog — это инструмент с открытым исходным кодом, который позволяет упаковывать модели машинного обучения в стандартный, готовый к использованию контейнер.
https://github.com/replicate/cog
https://github.com/replicate/cog
GitHub
GitHub - replicate/cog: Containers for machine learning
Containers for machine learning. Contribute to replicate/cog development by creating an account on GitHub.
8 полезных репозиториев LLM и Deep Learning
https://dev.to/quine/8-llms-and-deep-learning-repos-to-get-you-into-the-top-1-108g
https://dev.to/quine/8-llms-and-deep-learning-repos-to-get-you-into-the-top-1-108g
[Перевод] Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа.
AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.
Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.
Читать далее https://habr.com/ru/articles/768844/
AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.
Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.
Читать далее https://habr.com/ru/articles/768844/
Хабр
Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа
AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что внедряют в продукт как можно больше AI фичей, поднимают миллионы на оболочку для ChatGPT, осваивают сто первый...
👍1
Используем MLOps-конвейер: пример работы с Cloud ML Platform для построения сервиса распознавания лиц.
Есть два подхода к работе с машинным обучением (Machine Learning, ML): быть человеком-оркестром и задействовать «зоопарк технологий» для каждого этапа, или работать с готовым набором инфраструктурных решений, который позволяет выстроить MLOps-конвейер в рамках одной платформы. Для реализации первого подхода нужны senior-специалисты и большие ресурсы, для второго достаточно найти сервис с нужным набором возможностей.
Меня зовут Станислав Кипрюшин, я ведущий программист в VK Cloud. В этой статье на примере Cloud ML Platform мы разберём, как создать MLOps-конвейер для обучения моделей и построения сервиса распознавания лиц.
Читать дальше →https://habr.com/ru/companies/vk/articles/780050
Есть два подхода к работе с машинным обучением (Machine Learning, ML): быть человеком-оркестром и задействовать «зоопарк технологий» для каждого этапа, или работать с готовым набором инфраструктурных решений, который позволяет выстроить MLOps-конвейер в рамках одной платформы. Для реализации первого подхода нужны senior-специалисты и большие ресурсы, для второго достаточно найти сервис с нужным набором возможностей.
Меня зовут Станислав Кипрюшин, я ведущий программист в VK Cloud. В этой статье на примере Cloud ML Platform мы разберём, как создать MLOps-конвейер для обучения моделей и построения сервиса распознавания лиц.
Читать дальше →https://habr.com/ru/companies/vk/articles/780050
Хабр
Используем MLOps-конвейер: пример работы с Cloud ML Platform для построения сервиса распознавания лиц
Есть два подхода к работе с машинным обучением (Machine Learning, ML): быть человеком-оркестром и задействовать «зоопарк технологий» для каждого этапа, или работать с готовым набором инфраструктурных...
Создание LLM с миллионом параметров с нуля с использованием Python
Пошаговое руководство по репликации архитектуры LLaMA
https://levelup.gitconnected.com/building-a-million-parameter-llm-from-scratch-using-python-f612398f06c2
Пошаговое руководство по репликации архитектуры LLaMA
https://levelup.gitconnected.com/building-a-million-parameter-llm-from-scratch-using-python-f612398f06c2
Medium
Building a Million-Parameter LLM from Scratch Using Python
A Step-by-Step Guide to Replicating LLaMA Architecture
Разработайте своего первого ИИ-агента: глубокое Q-обучение
Погрузитесь в мир искусственного интеллекта — постройте с нуля тренажерный зал глубокого обучения с подкреплением.
https://medium.com/towards-data-science/develop-your-first-ai-agent-deep-q-learning-375876ee2472
Погрузитесь в мир искусственного интеллекта — постройте с нуля тренажерный зал глубокого обучения с подкреплением.
https://medium.com/towards-data-science/develop-your-first-ai-agent-deep-q-learning-375876ee2472
Medium
Develop Your First AI Agent: Deep Q-Learning
Dive into the world of artificial intelligence — build a deep reinforcement learning gym from scratch.
This media is not supported in your browser
VIEW IN TELEGRAM
DreaMoving — это управляемая система генерации видео на основе диффузии, предназначенная для создания высококачественных индивидуальных видеороликов с участием людей.
demo: https://modelscope.cn/studios/vigen/video_generation/summary
github: https://github.com/dreamoving/dreamoving-project
demo: https://modelscope.cn/studios/vigen/video_generation/summary
github: https://github.com/dreamoving/dreamoving-project
WhisperPlus (GitHub Repo)
Передовая обработка речи в текст. подробнее→ https://github.com/kadirnar/whisper-plus
Передовая обработка речи в текст. подробнее→ https://github.com/kadirnar/whisper-plus
GitHub
GitHub - kadirnar/whisper-plus: WhisperPlus: Faster, Smarter, and More Capable 🚀
WhisperPlus: Faster, Smarter, and More Capable 🚀. Contribute to kadirnar/whisper-plus development by creating an account on GitHub.
Make-A-Character: высококачественное преобразование текста в 3D-персонажей за считанные минуты.
С появлением агентов искусственного интеллекта растет спрос на персонализированные и выразительные 3D-персонажи . и Metaverse, но создание 3D-персонажей с использованием традиционных инструментов компьютерной графики — сложная и трудоемкая задача. Чтобы решить эти проблемы, мы предлагаем удобную для пользователя платформу Make-A-Character (Mach) для создания реалистичных 3D-аватаров из текстовых описаний. Страница документа: https://huggingface.co/papers/2312.15430
С появлением агентов искусственного интеллекта растет спрос на персонализированные и выразительные 3D-персонажи . и Metaverse, но создание 3D-персонажей с использованием традиционных инструментов компьютерной графики — сложная и трудоемкая задача. Чтобы решить эти проблемы, мы предлагаем удобную для пользователя платформу Make-A-Character (Mach) для создания реалистичных 3D-аватаров из текстовых описаний. Страница документа: https://huggingface.co/papers/2312.15430
huggingface.co
Paper page - Make-A-Character: High Quality Text-to-3D Character Generation within
Minutes
Minutes
Join the discussion on this paper page