Big data world

Создание поиска в видео

Сегодня мы собираемся взглянуть на закулисную технологию, лежащую в основе того, как Netflix создает великолепные трейлеры, ролики для Instagram, короткометражные видеоролики и другие рекламные видеоролики.

Предположим, вы пытаетесь создать трейлер к боевику «Серый человек» и знаете, что хотите использовать кадр взрывающейся машины. Вы не знаете, существует ли этот кадр и где он находится в фильме, и вам приходится искать его, просматривая весь фильм.

Мы создали внутреннюю систему, которая позволяет кому-то выполнять поиск внутри видео по всему видеокаталогу Netflix, и мы хотели быподелиться своим опытом создания этой системы.

https://netflixtechblog.com/building-in-video-search-936766f0017c

Medium

Building In-Video Search

Empowering video editors with multimodal machine learning to discover perfect moments across the entire Netflix catalog

👍2

611 views13:25

Big data world

Бесплатный практический вебинар: Рабочий день аналитика данных.

⏰ Когда: 15 ноября в 19:00 по мск.

✔️Погружаемся в профессию и составляем отчет о продажах интернет-магазина.

✔️Покажем, какие задачи решают аналитики данных, какие проекты реализуют и как помогают бизнесу принимать решения и расти.

✔️Расскажем, как пройти собеседование, найти удаленную работу и начать менять свою жизнь уже сегодня.

🎁 Дарим скидку 100 000 рублей на курс «Аналитик данных» и 20 000 рублей депозит до 19 ноября, а еще + 6 месяцев сопровождения наставника и карьерного трека после обучения!

Реклама. АНПОО "ХЕКСЛЕТ КОЛЛЕДЖ". ИНН 7839056670. erid: LjN8JycWu

621 views16:14

Big data world

Выпустив недавно отличную языковую модель Zephyr, команда HuggingFace демонстрирует, как можно обучать персонализированные модели, построенные на основе нескольких мощных предварительно обученных моделей с открытым исходным кодом. подробнее→ https://github.com/huggingface/alignment-handbook

Суперразрешение аудио (GitHub Repo) Сверхразрешение звука - это процесс повышения качества и достоверности любого звука, реального или синтетического. Большинство систем суперразрешения ориентированы на конкретные задачи, при этом отдельные модели обучаются для отдельных типов аудиоданных. Эта новая работа - удивительный шаг вперед, когда одна модель может служить для повышения качества звука в разных задачах. подробнее→ https://github.com/haoheliu/versatile_audio_super_resolution

GitHub

GitHub - huggingface/alignment-handbook: Robust recipes to align language models with human and AI preferences

Robust recipes to align language models with human and AI preferences - huggingface/alignment-handbook

626 views13:48

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Итак, Генеративный ИИ в РЕАЛЬНОМ ВРЕМЕНИ уже здесь. 🔥

Все инструменты проектирования, все рабочие процессы — ВСЕ изменится.

💡Вот все, что вам нужно знать о LCM-LoRA.

https://arxiv.org/abs/2311.05556

https://latent-consistency-models.github.io/

656 views06:08

Big data world

Сегментация дорог с помощью лидара (GitHub Repo) Исследователи разработали для самоуправляемых автомобилей более интеллектуальный метод распознавания дорог с помощью технологии лидара, который требует меньше ручной работы, но при этом сохраняет точность системы. подробнее→ https://github.com/evocargo/lidar-annotation-is-all-you-need

GitHub

GitHub - Evocargo/Lidar-Annotation-is-All-You-Need: 2D road segmentation using lidar data during training

2D road segmentation using lidar data during training - GitHub - Evocargo/Lidar-Annotation-is-All-You-Need: 2D road segmentation using lidar data during training

👍5

2.37K views11:03

Big data world

Представляем Mirasol, мультимодальную модель для обучения через аудио, видео и текст, которая разделяет моделирование на отдельные авторегрессионные модели для обработки входных данных в соответствии с характеристиками их модальностей, обеспечивая высочайшую производительность

https://blog.research.google/2023/11/scaling-multimodal-understanding-to.html

research.google

Scaling multimodal understanding to long videos

Posted by Isaac Noble, Software Engineer, Google Research, and Anelia Angelova, Research Scientist, Google DeepMind When building machine learning...

718 views06:14

Big data world

🙌Топ-10 🐍 Библиотек Python для любых проектов машинного обучения 🚀

https://dev.to/taipy/top-10-python-libraries-for-any-ml-projects-3gfp

DEV Community

🙌Top 10 🐍 Python libraries for any ML projects 🚀

TL;DR In this article, I’ll give you the ultimate Python libraries for any Machine...

1.27K views06:09

Big data world

Ускорение генеративного искусственного интеллекта с помощью PyTorch: сегментируйте что угодно быстро

Этот пост является первой частью многосерийного блога, посвященного тому, как ускорить генеративные модели ИИ с помощью чистого, нативного PyTorch. Мы рады поделиться множеством недавно выпущенных функций производительности PyTorch, а также практическими примерами того, как эти функции можно комбинировать, чтобы увидеть, насколько далеко мы можем повысить производительность PyTorch. https://pytorch.org/blog/accelerating-generative-ai/

673 views08:58

Big data world

Практические советы по точной настройке LLM с использованием LoRA

https://magazine.sebastianraschka.com/p/practical-tips-for-finetuning-llms

Sebastianraschka

Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation)

Things I Learned From Hundreds of Experiments

618 views12:07

Big data world

Модель прогнозирования погоды DeepMind (репозиторий GitHub)
DeepMind уже несколько лет работает над прогнозированием погоды. Последняя модель, построенная на графовых нейронных сетях, чрезвычайно точна для 10-дневных прогнозов. https://github.com/google-deepmind/graphcast

Интерполяция видеокадров с индексацией расстояния
Существующие методы интерполяции видеокадров (VFI) слепо предсказывают, где находится каждый объект в определенный момент времени t («индексация времени»), что затрудняет предсказание точных движений объекта. Учитывая два изображения ⚾️, существует бесконечно много возможных траекторий: ускоряющихся или замедляющихся, прямых или изогнутых. Это часто приводит к размытым кадрам, поскольку метод усредняет эти возможности. Вместо того, чтобы заставлять сеть неявно изучать это сложное сопоставление времени и местоположения вместе с прогнозированием кадров, мы предоставляем сети явную подсказку о том, как далеко объект прошел между начальным и конечным кадрами. Новый подход получил название «индексация расстояния». https://zzh-tech.github.io/InterpAny-Clearer

GitHub

GitHub - google-deepmind/graphcast

Contribute to google-deepmind/graphcast development by creating an account on GitHub.

718 views14:37

Big data world

Microsoft запустила лучший курс по генеративному искусственному интеллекту. Бесплатный курс из 12 уроков доступен на Github и научит вас всему, что вам нужно знать, чтобы начать создавать приложения генеративного ИИ.

https://github.com/microsoft/generative-ai-for-beginners

GitHub

GitHub - microsoft/generative-ai-for-beginners: 21 Lessons, Get Started Building with Generative AI

21 Lessons, Get Started Building with Generative AI - GitHub - microsoft/generative-ai-for-beginners: 21 Lessons, Get Started Building with Generative AI

👍3

1.28K views13:26

Big data world

Модели больших данных 📊 против памяти компьютера 💾

https://dev.to/taipy/big-data-models-vs-computer-memory-4po6

DEV Community

Big data models 📊 vs. Computer memory 💾

Data pipelines are the backbone of any data-intensive project. As datasets grow beyond memory size...

802 views16:37

Big data world

5 бесплатных курсов для освоения машинного обучения
Вам интересно изучать и создавать модели машинного обучения? Начните обучение сегодня с помощью этих бесплатных курсов машинного обучения.

https://www.kdnuggets.com/5-free-courses-to-master-machine-learning

KDnuggets

5 Free Courses to Master Machine Learning

Are you excited to learn about and build machine learning models? Start learning today with these free machine learning courses.

❤3

805 views07:35

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Интерактивная панель управления Python, чтобы продемонстрировать сэмплер Гиббса, концепцию в цепи Маркова Монте-Карло

https://github.com/GeostatsGuy/PythonNumericalDemos/blob/master/Interactive_Gibbs_Sampler.ipynb

721 views06:39

Big data world

Создайте языковую модель в своих чатах WhatsApp

Визуальное руководство по архитектуре GPT с приложением

В этой статье я расскажу вам о своем пути создания (маленькой) языковой модели, которая генерирует синтетические разговоры, используя мои сообщения чата WhatsApp в качестве входных данных. https://towardsdatascience.com/build-a-language-model-on-your-whatsapp-chats-31264a9ced90

Medium

Build a Language Model on Your WhatsApp Chats

A visual guide through the GPT architecture with an application

625 views11:53

Big data world

🏆Как освоить 📊 конвейеры больших данных с помощью Taipy и PySpark 🐍

В этой статье будет использован простой пример, чтобы продемонстрировать, как мы можем интегрировать PySpark с Taipy , чтобы соединить ваши потребности в обработке больших данных с интеллектуальным выполнением заданий . https://dev.to/taipy/how-to-master-big-data-pipelines-with-taipy-and-pyspark-14oe

DEV Community

🏆How to master 📊 Big Data pipelines with Taipy and PySpark 🐍

This article will employ a simple example to demonstrate how we can integrate PySpark with Taipy to...

👍1

657 views08:11

Big data world

Ускорение генеративного ИИ с Pytorch II: GPT, быстро.

https://pytorch.org/blog/accelerating-generative-ai-2/

688 views14:05

Big data world

llamafile - это комбинация llama.cpp и Cosmopolitan libc. Это означает, что вы можете использовать практически любой процессор на любой ОС и упаковать свою модель в один исполняемый файл.
больше→ https://github.com/Mozilla-Ocho/llamafile

GitHub

GitHub - mozilla-ai/llamafile: Distribute and run LLMs with a single file.

Distribute and run LLMs with a single file. Contribute to mozilla-ai/llamafile development by creating an account on GitHub.

565 views07:37

Big data world

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.

Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.

И бонусом затронем новую модель для качественного подробного описания фото.

UPD: Добавлена информация для запуска на Windows с ускорением на AMD. https://habr.com/ru/articles/776314/

Хабр

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

OpenChat 7B запущенный локально через text-generation-webui Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я...

695 views16:21

Big data world

Mimesis: идеальное решение для генерации данных.

Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является дорогостоящим или затрудненным из-за внешних условий. Кроме того, правила конфиденциальности влияют на способы использования или распространения набора данных. По всем этим причинам использование синтетических данных является хорошей альтернативой, поскольку с их помощью можно удовлетворить те же потребности без особых усилий.

В этой статье мы рассмотрим один из лучших пакетов для генерации синтетических данных.

Читать далее https://habr.com/ru/articles/771950

Хабр

Mimesis: идеальное решение для генерации данных

Сбор данных имеет решающее значение для каждого проекта, связанного с машинным обучением. Однако не всегда искомые данные существуют или общедоступны. Во многих случаях получение данных является...

648 views16:00

About

Blog

Apps

Platform