Big data world

Cog — это инструмент с открытым исходным кодом, который позволяет упаковывать модели машинного обучения в стандартный, готовый к использованию контейнер.

https://github.com/replicate/cog

GitHub

GitHub - replicate/cog: Containers for machine learning

Containers for machine learning. Contribute to replicate/cog development by creating an account on GitHub.

890 views10:44

Big data world

8 полезных репозиториев LLM и Deep Learning

https://dev.to/quine/8-llms-and-deep-learning-repos-to-get-you-into-the-top-1-108g

625 views18:11

Big data world

[Перевод] Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа.

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.

Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.

Читать далее https://habr.com/ru/articles/768844/

Хабр

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что внедряют в продукт как можно больше AI фичей, поднимают миллионы на оболочку для ChatGPT, осваивают сто первый...

👍1

700 views08:46

Big data world

Используем MLOps-конвейер: пример работы с Cloud ML Platform для построения сервиса распознавания лиц.

Есть два подхода к работе с машинным обучением (Machine Learning, ML): быть человеком-оркестром и задействовать «зоопарк технологий» для каждого этапа, или работать с готовым набором инфраструктурных решений, который позволяет выстроить MLOps-конвейер в рамках одной платформы. Для реализации первого подхода нужны senior-специалисты и большие ресурсы, для второго достаточно найти сервис с нужным набором возможностей.

Меня зовут Станислав Кипрюшин, я ведущий программист в VK Cloud. В этой статье на примере Cloud ML Platform мы разберём, как создать MLOps-конвейер для обучения моделей и построения сервиса распознавания лиц.

Читать дальше →https://habr.com/ru/companies/vk/articles/780050

Хабр

Используем MLOps-конвейер: пример работы с Cloud ML Platform для построения сервиса распознавания лиц

Есть два подхода к работе с машинным обучением (Machine Learning, ML): быть человеком-оркестром и задействовать «зоопарк технологий» для каждого этапа, или работать с готовым набором инфраструктурных...

720 views13:50

Big data world

Создание LLM с миллионом параметров с нуля с использованием Python
Пошаговое руководство по репликации архитектуры LLaMA

https://levelup.gitconnected.com/building-a-million-parameter-llm-from-scratch-using-python-f612398f06c2

Medium

Building a Million-Parameter LLM from Scratch Using Python

A Step-by-Step Guide to Replicating LLaMA Architecture

1.27K views13:06

Big data world

Разработайте своего первого ИИ-агента: глубокое Q-обучение
Погрузитесь в мир искусственного интеллекта — постройте с нуля тренажерный зал глубокого обучения с подкреплением.

https://medium.com/towards-data-science/develop-your-first-ai-agent-deep-q-learning-375876ee2472

Medium

Develop Your First AI Agent: Deep Q-Learning

Dive into the world of artificial intelligence — build a deep reinforcement learning gym from scratch.

724 views14:07

Big data world

https://blog.research.google/2023/12/advancements-in-machine-learning-for.html

research.google

Advancements in machine learning for machine learning

Posted by Phitchaya Mangpo Phothilimthana, Staff Research Scientist, Google DeepMind, and Bryan Perozzi, Senior Staff Research Scientist, Google Re...

641 views14:22

Big data world

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

DreaMoving — это управляемая система генерации видео на основе диффузии, предназначенная для создания высококачественных индивидуальных видеороликов с участием людей.

demo: https://modelscope.cn/studios/vigen/video_generation/summary

github: https://github.com/dreamoving/dreamoving-project

733 views06:32

Big data world

WhisperPlus (GitHub Repo)

Передовая обработка речи в текст. подробнее→ https://github.com/kadirnar/whisper-plus

GitHub

GitHub - kadirnar/whisper-plus: WhisperPlus: Faster, Smarter, and More Capable 🚀

WhisperPlus: Faster, Smarter, and More Capable 🚀. Contribute to kadirnar/whisper-plus development by creating an account on GitHub.

745 views06:29

Big data world

Make-A-Character: высококачественное преобразование текста в 3D-персонажей за считанные минуты.

С появлением агентов искусственного интеллекта растет спрос на персонализированные и выразительные 3D-персонажи . и Metaverse, но создание 3D-персонажей с использованием традиционных инструментов компьютерной графики — сложная и трудоемкая задача. Чтобы решить эти проблемы, мы предлагаем удобную для пользователя платформу Make-A-Character (Mach) для создания реалистичных 3D-аватаров из текстовых описаний. Страница документа: https://huggingface.co/papers/2312.15430

huggingface.co

Paper page - Make-A-Character: High Quality Text-to-3D Character Generation within
Minutes

Join the discussion on this paper page

714 views09:43

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Может ли машинное обучение предсказать хаос? В моей новой статье проводится крупномасштабное сравнение современных методов прогнозирования на гигантском наборе данных из 135 хаотических систем.
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.5.043252

741 views11:35

Big data world

Модель прогнозирования погоды на основе MachineLearning от
GoogleDeepMind
Cогласно новому исследованию Science, приводит к более качественным, быстрым и доступным 10-дневным прогнозам погоды, чем существующие подходы. https://www.science.org/doi/10.1126/science.adi2336

👍1

662 views15:31

Big data world

А вот и технология больших данных, способная конкурировать с кластерами на одной машине.

https://cassio-bolba.medium.com/here-comes-big-data-technology-that-rivals-clusters-on-a-single-machine-992f41e67a72

Medium

Here comes big data technology that rivals clusters on a single machine

Distributed data warehouses (such as MPP) in the era of big data are a popular technology, even to the point where data warehouses are…

685 views07:02

Big data world

TinyZero (GitHub Repo) Простое обучение AlphaZero-подобных агентов на любом окружении. подробнее→ https://github.com/s-casci/tinyzero

Модель разделения речи (GitHub Repo) Модель MossFormer2, усовершенствованная по сравнению с оригинальной моделью MossFormer, предлагает улучшенные возможности разделения монофонической речи. больше→ https://github.com/alibabasglab/MossFormer2

GitHub

GitHub - s-casci/tinyzero: Easily train AlphaZero-like agents on any environment you want!

Easily train AlphaZero-like agents on any environment you want! - s-casci/tinyzero

901 views09:03

Big data world

Дорожная карта MLOps на 2024 год

https://medium.com/marvelous-mlops/mlops-roadmap-2024-ff4216b8bc62

Medium

MLOps roadmap 2024

The MLOps engineer role is different from an ML engineer role. Even though the role varies from company to company, in general, ML…

919 views07:25

Big data world

1,5 года знаний Spark в 8 советах

Мои выводы из взаимодействия с клиентами Databricks
https://towardsdatascience.com/1-5-years-of-spark-knowledge-in-8-tips-f003c4743083

Medium

1.5 Years of Spark Knowledge in 8 Tips

My learnings from Databricks customer engagements

969 views10:23

Big data world

Forwarded from Добро пожаловать в мир Python

Самый быстрый способ чтения Excel на Python

Чтение 500 тыс. строк менее чем за 4 секунды
https://hakibenita.com/fast-excel-python

Hakibenita

Fastest Way to Read Excel in Python

Reading 500K rows in less than 4 seconds

699 views08:19

Big data world

PFGM++: буст генеративных моделей с применением электростатики

Новая ступень в развитии диффузионных генеративных моделей ИИ, и новая возможность создавать собственные изображения в 10 раз быстрее, чем раньше. Это стало реальным благодаря удачной попытке совместить знания об электростатике и принципу функционирования привычных нам диффузионных моделей. Так, исследователям из MIT CSAIL удалось воплотить в жизнь инновационную модель PFGM ++, которая по последним данным значительно превосходит своих предшественниц.

Какова физическая природа PFGM ++, и как ее использовать на практике – давайте разбираться далее вместе. https://habr.com/ru/companies/bothub/articles/785192/

Хабр

PFGM++: буст генеративных моделей с применением электростатики

Развитие генеративных моделей ИИ продвигается семимильными шагами и будурожит сознания миллионов людей во всем мире. Все больше скандалов, интриг и расследований связаны с ними, мы становимся...

👍1

663 views08:46

Big data world

Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев

Улучшение Том и Джерри из 480p в 1440p

С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране. https://habr.com/ru/articles/784648/

Хабр

Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев

С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от...

744 views12:50

Big data world

Шлюз LLM (GitHub Repo) Portkey AI недавно выложила в открытый доступ свой шлюз, который позволяет осуществлять маршрутизацию между множеством различных языковых моделей. подробнее→ https://github.com/Portkey-AI/gateway

GitHub

GitHub - Portkey-AI/gateway: A blazing fast AI Gateway with integrated guardrails. Route to 200+ LLMs, 50+ AI Guardrails with 1…

A blazing fast AI Gateway with integrated guardrails. Route to 200+ LLMs, 50+ AI Guardrails with 1 fast & friendly API. - Portkey-AI/gateway

👍3

835 views14:56

About

Blog

Apps

Platform