Machinelearning – Telegram

Machinelearning

@ai_machinelearning_big_data

306K subscribers

4K photos

707 videos

17 files

4.58K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

306K subscribers

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🖼

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning

Только что были выпущены Animate Diff v3 и Sparse Ctrl, модели которые позволяют качественно анимировать и стилизовать видео, генерировать переходы между кадрами.

🖥

Github: https://github.com/guoyww/animatediff/

💻

Colab: https://colab.research.google.com/github/camenduru/AnimateDiff-colab/blob/main/AnimateDiff_colab.ipynb

📚

Paper: https://arxiv.org/abs/2307.04725

📁

Project: https://animatediff.github.io/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤4🥰3🔥1😁1

9.56K views18:26

Machinelearning

Как строится работа полного цикла ML-разработки и как в ней использовать готовые платформенные решения

Ведущий программист VK Cloud Станислав Кипрюшин показывает пример работы с Cloud ML Platform для создания сервиса распознавания лиц.

В машинном обучении (Machine Learning, ML) можно использовать два подхода: задействовать различные технологии на каждом этапе или работать с готовыми инфраструктурными решениями, которые позволяют создать MLOps-конвейер на одной платформе. Какой путь принесет больше профита — узнайте в статье.

👍17🥰2❤1🥱1

8.94K views09:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ UDiffText: A Unified Framework for High-quality Text Synthesis in Arbitrary Images via Character-aware Diffusion Models ✒ Colab 🥳

UDiffText: Единая платформа для высококачественной генерации текста на изображениях с помощью моделей диффузии.

UDiffText способен синтезировать точный текст на синтетических или реальных изображениях, поэтому может применяться для решения таких задач, как редактирование текста на картинке (a), генерация произвольного текста и генерация точного текста.

🖥

code: https://github.com/ZYM-PKU/UDiffText

⚡️

page: https://udifftext.github.io

📚

paper: https://arxiv.org/abs/2312.04884

🔥

colab: https://github.com/camenduru/UDiffText-colab

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16🔥4🎉2❤1

9.83K views11:03

Machinelearning

⚡️

Deep dive into 4 NeurIPS 2023 best paper award winners

NeurIPS 2023 обзор лучших работ: https://youtu.be/LkED9wKI1TY

- Является ли эмерджентность больших языковых моделей миражом? https://arxiv.org/abs/2304.15004
- Масштабирование языковых моделей с ограничениями по данным. https://arxiv.org/abs/2305.16264
- Прямая оптимизация предпочтений: Your Language Model is Secretly a Reward Model. https://arxiv.org/abs/2305.18290
- DecodingTrust: Всесторонняя оценка достоверности в GPT-моделях. https://arxiv.org/abs/2306.11698

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥4❤3

8.85K views08:20

Machinelearning

🖥

𝗧𝗵𝗲 𝘀𝘁𝗮𝘁𝗲 𝗼𝗳 𝗼𝗽𝗲𝗻 𝘀𝗼𝘂𝗿𝗰𝗲 𝗶𝗻 𝟮𝟬𝟮𝟯 by GitHub

GitHub только что опубликовал свой последний отчет о состоянии открых проектов. Авторы отметили тренд на использование разработчиками технологий искусственного интеллекта и тренд на создание приложений на основе искусственного интеллекта.

Они выделили основные тенденции:

🔹 Разработчики все чаще используют генеративный ИИ: Все больше разработчиков работают с моделями OpenAI ( 92% ) и с моделями других ИИ-компаний; в 2023 году проекты генеративного ИИ с открытым исходным кодом входят в десятку самых популярных проектов по количеству контрибьюторов.

🔹 Наблюдается тренд на работу с облачными приложениями:
Развертывание облаков становится стандартом; резко возросло количество использования разработчиками Docker контейнеров, IaC и других облачных нативных технологий.

🔹 В 2023 году на GitHub было создано 98 млн новых проектов (за 2022 год - 85.7 млн, за 2021 - 61 млн, за 2020 - 60 млн). Общее число проектов достигло отметки в 420 млн (+27%), а число публично доступных репозиториев - 284 млн (+22%).

🔸 За год добавлено около 65 тысяч новых проектов, связанных с машинным обучением, это на 248% больше, чем в прошлом году. Число AI-проектов за год выросло на 148%.

🔸 Аудитория GitHub за год выросла на 20.2 млн пользователей (+26%) и теперь достигает 114 млн (в прошлом году было 20.5 млн, позапрошлом - 73 млн, три года назад - 56 млн). На первом месте по числу разработчиков находится США, на втором - Индия, на третьем - Китай, на четвёртом Бразилия, на пятом - Великобритания, на шестом - РФ, на седьмом Германия. К 2027 году Индия обгонит США как крупнейшее сообщество разработчиков на GitHub

🔸Javascript остается самым популярным язком. Второе место сохраняет за собой Python.Популярность TypeScript выросла на 37 %. и он вытеснил на четвёртое место язык Java. 5, 6 и 7 места удержали за собой языки С#, C++ и PHP. На восьмое место поднялся язык С, который вытеснил на девятое место Shell. Десятое место занял Go.

🔸 𝗥𝘂𝘀𝘁 растет быстрее всех остальных языков в этом году (рост на 40 % по сравнению с предыдущим годом).

🔸 𝟰.𝟯 миллиона открытых и приватных репозиториев используют 𝗗𝗼𝗰𝗸𝗲𝗿𝗳𝗶𝗹𝗲𝘀. Это является следcтвием роста использования Terraform и других облачных нативных технологий, который мы наблюдали в течение последних нескольких лет.

🔸 Сингапур занял первое место по количеству новых разработчиков на душу населения.

📌 Полный отчет
📌 Видео

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

The GitHub Blog

Octoverse: The state of open source and rise of AI in 2023

In this year’s Octoverse report, we study how open source activity around AI, the cloud, and Git are changing the developer experience.

👍23🎉5🔥4❤2🥰2

35.1K viewsedited 09:46

Machinelearning

📲

CogAgent: A Visual Language Model for GUI Agents

A state-of-the-art-level open visual language model.

Люди проводят огромное количество времени на цифровых устройствах, используя графические пользовательские интерфейсы (GUI), например, экраны компьютеров или смартфонов.

Большие языковые модели, такие как ChatGPT, могут помочь людям в решении таких задач, как написание электронных писем и ответов на вопросы, но они не способны понимать и взаимодействовать с графическими интерфейсами, что ограничивает их потенциал в плане повышения уровня автоматизации.

CogAgent - новая визуальная языковая модель (VLM) с 18 миллиардами параметров, которая специализируется на работе и навигации в графических интерфейсах.

Используя кодировщики изображений как низкого, так и высокого разрешения, CogAgent поддерживает ввод с разрешением 1120*1120, что позволяет ему распознавать мельчайшие элементы страниц и текст.

Будучи универсальной моделью визуального языка, CogAgent достигает передовых результатов в пяти тестах VQA с большим количеством текста и четырех тестах VQA общего назначения, включая VQAv2, OK-VQA, Text-VQA, ST-VQA, ChartQA, infoVQA, DocVQA, MM-Vet и POPE. CogAgent, использующий в качестве входных данных только скриншоты, превосходит методы на основе LLM, которые принимают извлеченный HTML-текст, в задачах навигации по графическому интерфейсу на ПК и смартфонах.

🖥

code: https://github.com/thudm/cogvlm

📚

paper: https://arxiv.org/abs/2312.08914v1

🔥

dataset: https://paperswithcode.com/dataset/ok-vqa

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20🔥7❤2😁1

9.59K views15:03

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🔊 Amphion: An Open-Source Audio, Music, and Speech Generation Toolkit

Amphion - это новый инструмент с открытым исходным кодом, позволяющий создавать речь, звуки и песни.

Он разработан для поддержки исследований в области аудио, музыки и генерации речи.

С его помощью Тейлор Свифт демонстрирует свой талант, исполняя песни на китайском. 😊🎵

🖥

GitHub: https://github.com/open-mmlab/Amphion

📚

Paper: arxiv.org/abs/2312.09911

🥩

HF: https://huggingface.co/amphion

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤3🔥1

10.3K viewsedited 06:03

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 Большая подборка вопросов для собеседования по DS, AI, ML, DL, NLP, компьютерному зрению.

Подборка вопросов для собеседования поможет вам на собеседовании в области науки о данных, искусственного интеллекта, машинного обучения, глубинного обучения, обработки естественного языка, компьютерного зрения.

▪100 вопросов для собеседования по машинному обучению в 2024 году

▪50 вопросов для собеседования по компьютерному зрению в 2024 году

▪50 вопросов для интервью по глубинному обучению в 2024 году

▪50 вопросов для интервью по НЛП (обработке естественного языка) в 2024 году

▪100 вопросов с собеседований Data Science

▪Топ-60 вопросов с собеседований R

@ai_machinelearning_big_data

🔥34👍8❤6🤬4

8.69K viewsedited 08:08

Machinelearning

🪩 DiffusionLight: Light Probes for Free by Painting a Chrome Ball

Диффузионная модель, обучена на миллиардах изображений, для визуализации хромированного шара на изображениях с разным освещением.

Несмотря на простоту, эта задача остается сложной: диффузионные модели часто вставляют неправильные или непоследовательные объекты и не могут правильно генерировать изображения со светом в формате HDR.

Для входного изображения, оценивается освещение сцены в виде карты окружения HDR. Идея заключается в том, чтобы нарисовать на изображении хромированный шар с помощью диффузионной модели и развернуть его в окружении. Таким образом решаются задачи: (1) как последовательно генерировать хромированные шары и (2) как использовать модель диффузии LDR для создания хромированных шаров HDR.

Данный метод позволяет генерировать освещение высокого качества в различных условиях и демонстрирует превосходный результат для изображений в дикой природе.

🖥

GitHub: https://github.com/DiffusionLight/DiffusionLight

🔮

Colab: https://colab.research.google.com/drive/15pC4qb9mEtRYsW3utXkk-jnaeVxUy-0S?usp=sharing&sandboxMode=true

📚

Paper: https://arxiv.org/abs/2312.09168

🥩

Score Measurement: https://vistec-my.sharepoint.com/:f:/g/personal/pakkapon_p_s19_vistec_ac_th/EvBHbnLrVnZArhQTcboh6qkBGcSqUqzdgx13iZ2IsLPzOw

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥18👍7🥰2🤔2❤1⚡1

10.4K views10:08

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🖼

ImageDream: Image-Prompt Multi-view Diffusion for 3D Generation

ImageDream - новый набор диффузионных моделей многоракурсной генерации, разработанный для решения сложной задачи создания 3D-объектов из изображения.

🖥

GitHub: https://github.com/bytedance/ImageDream

📚

Paper: https://arxiv.org/abs/2312.02201

🥩

Demo: https://github.com/bytedance/ImageDream/blob/main

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍6🔥3

8.71K viewsedited 08:02

Machinelearning

🃏 Poker Hand History File Format Specification

An open-source Python library for poker simulations and hand evaluations.

PokerKit - это библиотека Python с открытым исходным кодом для симуляции игры в покер и оценки покерных рук, разработанная группой по изучению покера Университета Торонто.

PokerKit поддерживает широкий спектр разновидностей покера и предоставляет архитектуру для создания собственных игр.

Все эти возможности предоставляются через интуитивно понятный унифицированный API высокого уровня.

Библиотека может быть использована в самых разных сферах, от разработки покерного AI до создания инструментов предсказания покерных.

pip install pokerkit

🖥

GitHub: https://github.com/uoftcprg/pokerkit

📚

Paper: https://arxiv.org/pdf/2312.11753v1.pdf

🥩

Project: https://pokerkit.readthedocs.io/en/stable/

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🥰13🔥5👍4❤3

9.63K views14:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🥳FreeInit with AnimateDiff Gradio Colab

FreeInit - новый эффективный метод улучшения временной согласованности видео, генерируемых диффузионными моделями.

🖥

colab: https://github.com/camenduru/FreeInit-colab

🔮

page: https://tianxingwu.github.io/pages/FreeInit/

📚

paper: https://arxiv.org/abs/2312.07537

🥩

code: https://github.com/TianxingWu/FreeInit

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11👏3❤2🔥1

8.94K views08:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🔍 FIND: Interface Foundation Models' Embeddings

FIND - удобный интерфейс для настройки эмбедингов вших моделей.

🖥

Code: https://github.com/UX-Decoder/FIND

🎓

Demo: https://find.xyzou.net/

🔮

Project Page: https://x-decoder-vl.github.io

🥩

Demo: https://find.xyzou.net

📚

ArXiv: https://arxiv.org/pdf/2312.07532.pdf

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍3🔥1

8.9K views14:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

LongAnimateDiff, a text2video model for generating extended videos.

▪Новая модель "LongAnimateDiff" способная генерировать видео с количеством кадров от 16 до 64.
Веса можно загрузить с Google Drive или HuggingFace. Для получения оптимальных результатов рекомендуется использовать шкалу движения 1,28.

▪Специализированная модель, предназначенная для создания видеороликов с 32 кадрами. Эта модель обычно создает видео более высокого качества по сравнению с моделью LongAnimateDiff, поддерживающей 16-64 кадра. Веса на Google Drive или HuggingFace. Для получения хороших результатов используйте масштаб движения 1,15.

🖥

Code: https://github.com/Lightricks/LongAnimateDiff

🎓

HF: https://huggingface.co/spaces/Lightricks/LongAnimateDiff

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15🔥3❤2🥰1

9.09K views07:37

Machinelearning

🎲 ReBRAC (Revisited Behavior Regularized Actor Critic)
ReBRAC (Revisited Behavior Regularized Actor Critic) — алгоритм, созданный в Tinkoff Research, который обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям на ходу.

🖥

Code: https://github.com/tinkoff-ai/ReBRAC

🎓

ArXiv: https://arxiv.org/abs/2305.09836

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍19❤6🔥3🤔1🆒1

9.82K viewsedited 12:22