Machinelearning – Telegram

Machinelearning

@ai_machinelearning_big_data

332K subscribers

4.11K photos

750 videos

17 files

4.67K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

332K subscribers

Machinelearning

➕

SA-Med2D-20M Dataset: Segment Anything in 2D Medical Imaging with 20 Million masks

Модель Segment Anything Model (SAM) достигла впечатляющих результатов при сегментации изображений и успех модели во многом объясняется наличием большого количества обучающих данных с метками.

Однако применение SAM для сегментации медицинских изображений не может дать хороших результатов, поскольку SAM не обладает медицинскими знаниями - она не использует медицинские изображения для обучения.

SA-Med2D-20M - крупномасштабный датасет по сегментации двумерных медицинских изображений, созданный на основе многочисленных гснимков.

Он состоит из 4,6 млн. двумерных медицинских изображений и 19,7 млн. соответствующих масок, охватывающих практически все тело и содержащий значительное разнообразие.

В данной работе описаны все датасеты, собранные в SA-Med2D-20M, и подробно описаны способы обработки этих наборов данных. Кроме того, приведена полная статистика SA-Med2D-20M, которая поможет исследователям построить базовые модели медицинского зрения или применить свои модели в медицинских приложениях.

🏆 Самая большая на сегодняшний день база данных по сегментации медицинских изображений (4,6 млн. изображений и 19,7 млн. масок) для обучения моделей.
🏆 Инструмент файнтюнинга на основе модели Segment Anything Model (SAM).
🏆 Всесторонняя оценка SAM-Med2D на крупномасштабных датасетах.

🖥

Github: https://github.com/OpenGVLab/SAM-Med2D

🖥

Colab: https://colab.research.google.com/github/OpenGVLab/SAM-Med2D/blob/main/predictor_example.ipynb

📕

Paper: https://arxiv.org/abs/2311.11969v1

⭐️

Dataset: https://arxiv.org/abs/2311.11969

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤7🔥5🍌1

9.34K views11:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

👱‍♂️ ChatAnything: Facetime Chat with LLM-Enhanced Personas

FACETIME CHAT WITH LLM-ENHANCED PERSONAS.

Новая модель ChatAnything, которая способна придать жизнь разнообразным объектам, будь то животное, фрукт, монстр или даже ваше собственное фото, создавая говорящего персонажа. При помощи нейронных сетей и алгоритмов текст в речь, программа автоматически выбирает наиболее подходящий тон и настроение для созданного персонажа.

Вам предоставляется возможность создать любогоаватара, из текстовом описании или загрузив свое собственное изображение. После этого вы можете общаться с ним, используя текстовые сообщения или ваш голос.

🖥

Github: https://github.com/zhoudaquan/ChatAnything

📕

Paper: https://arxiv.org/abs/2311.06772

⭐️

Model: https://github.com/zhoudaquan/ChatAnything/blob/main/python_scripts/prepare_models.py

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤4🔥4🍌1

8.85K views17:06

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

Stability AI is releasing Stable Video Diffusion! 🔥

Stability AI выпустили опенсорс модель image-to-video.

Это новая модель преобразования изображения в видео, которая позволяет получить 14-25 кадров с разрешением 576x1024 при наличии контекстного кадра такого же размера.

🖥

Code: https://github.com/Stability-AI/generative-models

🦾 Announcement: https://stability.ai/news/stable-video-diffusion-open-ai-video-model

📚

Paper: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets

🔗

Weights: https://github.com/Stability-AI/generative-models

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10👍7❤2🍌1

8.35K views10:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🪄

InternLM-XComposer

Multi-Objective Reinforcement Learning algorithms implementations.

MORL-Baselines - это библиотека алгоритмов многоцелевого обучения с подкреплением (MORL).

Данный репозиторий содержит рабочие реализации алгоритмов MORL в PyTorch.

🖥

Code: https://github.com/lucasalegre/morl-baselines

🦾 Project: lucasalegre.github.io/morl-baselines

🖥

Colab: https://colab.research.google.com/drive/1ByjuUp8-CJeh1giPOACqPGiglPxDnlSq?usp=sharing

📚

Paper: https://arxiv.org/abs/2311.12495v1

🔗

Dataset: https://paperswithcode.com/dataset/mo-gymnasium

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🥰2❤1🍌1

9.27K views12:44

Machinelearning

💸 На AI Journey авторы лучшей статьи про искусственный интеллект получили 1 млн рублей

Сбер наградил группу исследователей из Университета Иннополис и МФТИ в составе Михаила Рудакова, Александра Безносикова, Ярослава Холодова и Александра Гасникова — они получили 1 млн рублей за свою статью «Техники сжатия активаций слоёв и градиентов для распределённого обучения моделей искусственного интеллекта».

Её и еще 37 работ других претендентов опубликуют в научном сборнике международной конференции AI Journey — «Путешествие в мир искусственного интеллекта». Всего для участия в отборе прислали более 270 заявок.

«Лучшую статью члены экспертной комиссии отобрали в силу её высокой научной ценности, огромного фундаментального и прикладного значения. Я поздравляю победителей и надеюсь, что они продолжат свои исследования в этом важном направлении», — рассказал первый заместитель председателя правления Сбера Александр Ведяхин.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍36🔥12❤4🍌2😁1

36.2K views17:57

Machinelearning

🐬

ShareGPT4V:Improving Large Multi-Modal Models with Better Captions

🔥 Масштабный набор данных,содержащий изображения и тексты.
🔥 1,2 млн высококачественных подписей к ихображениям для предварительного обучения.
🔥 Программа для создания описания изображений, приближающаяся по возможностям к GPT4-Vision.
🔥 Большая мультимодальная модель, ShareGPT4V-7B

🖥

Code: https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V

🦾 Project: https://sharegpt4v.github.io/

⚡️

Demo: https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B

📚

Paper: https://arxiv.org/pdf/2311.12793.pdf

🔗

Dataset: https://huggingface.co/datasets/Lin-Chen/ShareGPT4V

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤3🔥3🍌2

8.92K views19:43

Machinelearning

Новый фреймворк файнтюнинга ЛЛМ

Higgsfield AI выпустил бета версию фулл-стек легковесного фреймворка для тренировки больших моделей. Пользователи загружают датасет через веб интерфейс и получают модель, которая тренируется на их серверах. Доступны любые модели llama/mistral. Метод оплаты не требуется. Лучше всего работает с десктопным Chrome.

Попробовать запустить новую видео диффузию: https://higgsfield.ai/stable-diffusion

Зафайнтюнить ЛЛМ: https://higgsfield.ai/profile/submit

Github фреймворк который позволяет оркестрировать несколько ГПУ нод без необходимости менеджить Slurm/Kubernetes: https://github.com/higgsfield-ai/higgsfield

ai_machinelearning_big_data

GitHub - higgsfield-ai/higgsfield: Fault-tolerant, highly scalable GPU orchestration, and a machine learning framework designed…

Fault-tolerant, highly scalable GPU orchestration, and a machine learning framework designed for training models with billions to trillions of parameters - higgsfield-ai/higgsfield

👍17🔥9❤3🍌1

9.19K views11:31

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⭐️ Karpathy just uploaded what could be the best Intro to Large Language Models.

Обязательно к просмотру. Карпатый только что выложил, возможно, лучшее введение в большие языковые модели.

В лекции продолжительностью 1 час рассматривается абсолютно все: обучение, вывод, взлом, тонкая настройка и многое другое.

🔗

Смотреть здесь: https://youtube.com/watch?v=zjkBMFhNj_g

🔗

Слайды: https://drive.google.com/file/d/1pxx_ZI7O-Nwl7ZLNk5hI3WzAsTLwvNU7/view

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥42👍21❤5🍌1

10.5K views18:16

Machinelearning

🤖

Российская художница написала картину совместно с Kandinsky

Мария Суворова использовала ИИ для создания картин, уделив особое внимание логическому расположению цвета и тона. Такая методика предполагает установление баланса тона, цвета и динамики, что похоже на очень сложный аналитический процесс.

Суворова говорит, что для работы с Kandinsky нужно соединить два полюса, создавая эскиз по методу Матисса и постепенно дополнять его абстрактным видением.

Плоды ее творчества человека и искусственного интеллекта представила галерея «МастАРТ» на международной конференции AI Journey.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🥴19🔥13💊6😁3❤2👍2🥱2🥰1🍌1

22.1K views12:03

Machinelearning

🗣 HierSpeech++: Bridging the Gap between Semantic and Acoustic Representation by Hierarchical Variational Inference for Zero-shot Speech Synthesis

Синтез речи на основе больших языковых моделей получил широкое распространение.

Однако такие модели требуют большого объема данных и обладают теми же недостатками, что и предыдущие авторегрессионные модели речи, включая низкую скорость вывода и плохое качетсво речи.

В данной работе прелставлен HierSpeech++, быстрый и надежный синтезатор речи для преобразования текста в речь (TTS) и голоса (VC).

Данная модель синтеза речи позволяют значительно повысить надежность и выразительность синтетической речи.

Кроме того, значительно улучшено естественность и сходство с диктором синтетической речи даже в сценариях синтеза речи с нулевым результатом.

🖥

Code: https://github.com/sh-lee-prml/hierspeechpp

🦾 Checkpoint: https://drive.google.com/drive/folders/1-L_90BlCkbPyKWWHTUjt5Fsu3kz0du0w?usp=sharing

⚡️

Demo: https://sh-lee-prml.github.io/HierSpeechpp-demo/

📚

Paper: https://arxiv.org/abs/2311.12454v1

🔗

Dataset: https://paperswithcode.com/dataset/libri-light

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16❤3🔥1🍌1

9.31K views14:03

Machinelearning

Профессия AI-тренера, гонка нейросетей: о чем еще говорили на YaC 2023?

YaC 2023 — это сериал из 4 серий — про город, дом, интернет и людей. Главные герои — не только сервисы, но и команды, которые их разрабатывают.

✨ Нейросерия — одна из самых интересных. Яндекс рассказал:

- как генеративные нейросети меняют подход к поиску информации и работе с ней
- как pretrain модель влияет на качество ответов нейросети
- как компания разрабатывала языковые модели и нейросети, встраивала технологии в свои продукты и ввела новую профессию AI-тренера — специалиста, который работает над тем, чтобы нейронка выдавала качественные, этичные и безопасные ответы.

Посмотреть сериал полностью можно на Кинопоиске и Ютубе

@ai_machinelearning_big_data

Кинопоиск

Yet another Conference 2023, 2023

Смотрите онлайн сериал «Yet another Conference 2023» (2023) на Кинопоиске все серии, 1 сезон. Большой рассказ Яндекса о технологиях дома, в городе, интернете и о людях, которые их создают

❤11👍9🔥3🍌1🙈1

8.99K views19:24

Machinelearning

🔥

Diffusion360: Seamless 360 Degree Panoramic Image Generation based on Diffusion Models.

Модель для формирования панорамных изображений 360 на основе стабильной диффузии.

🖥

Code: https://github.com/archerfmy/sd-t2i-360panoimage

📚

Paper: https://arxiv.org/abs/2311.13141v1

🔗

Dataset: https://paperswithcode.com/dataset/sun360

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤3🤩2🔥1🍌1

8.85K views21:24

Machinelearning

🎮

Language Models are Super Mario: Absorbing Abilities from Homologous Models as a Free Lunch

В данной работе показано, что языковые модели (ЯМ), могут приобретать новые возможности за счет ассимиляции параметров однотипных моделей без переобучения или использования графических процессоров.

🖥

Code: https://github.com/yule-BUAA/MergeLM

📚

Paper: https://arxiv.org/abs/2311.03099

🔗

Dataset: https://paperswithcode.com/task/instruction-following

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥11👍8❤4🍌2

9.37K views10:36

Machinelearning

♟ ChessVision - A dataset for logically coherent multi-label classification.

Набор данных с изображениями шахматных досок в различных позициях.

🖥

Github: https://github.com/espressovi/chessvisionchallenge

📕

Paper: https://arxiv.org/abs/2311.12610

🔥Datasets: https://zenodo.org/records/8278015

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥11👍5🥴2🍌1

9.03K viewsedited 08:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Swift Parameter-free Attention Network for Efficient Super-Resolution

Сверхразрешение изображений (SISR) - важнейшая задача низкоуровневого компьютерного зрения, направленная на восстановление изображений высокого разрешения по их аналогам низкого разрешения.

Традиционные механизмы внимания значительно улучшили производительность SISR, но такие механизмы часто приводят к сложной структуре сети и большому количеству параметров, что приводит к низкой скорости вывода и большому размеру модели.

Parameter-free Attention Network (SPAN) - новая высокоэффективная модель SISR, которая позволяет сбалансировать количество параметров, скорость вывода и качество изображения.

В SPAN используется новый механизм внимания без параметров, который использует симметричные функции активации для усиления качества генерации и подавления избыточной информации.

SPAN был протестирован на нескольких бенчмарках,которые показали что она превосходит существующие модели суперразрешения как по качеству изображения, так и по скорости вывода, достигая компромисса между качеством и скоростью.

Это делает SPAN весьма пригодной для использования в реальных приложениях, особенно в случаях с ограниченными ресурсами.

🖥

Code: https://github.com/hongyuanyu/span

🦾 Checkpoint: https://drive.google.com/file/d/1iYUA2TzKuxI0vzmA-UXr_nB43XgPOXUg/view?usp=sharing

📚

Paper: https://arxiv.org/abs/2311.12770v1

🔗

Dataset: https://paperswithcode.com/dataset/manga109

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍27🔥3❤2😢1🍌1🆒1

9.67K views08:17

Machinelearning

🦜🦴Skeleton-of-Thought (новый шаблон LangChain!)

⭐️Большие Языковые модели могут работать параллельно и быстро⭐️.

В недавней работе Университета Цингуа и Microsoft Research показано, как можно значительно уменьшить время генерации LLM.

Данная техника сначала направляет LLM на генерацию скелета answer☠️, а затем выполняет параллельные вызовы API для параллельного заполнения содержимого каждой точки скелета🚤.

▪Шаблон LangChain здесь: https://github.com/langchain-ai/langchain/tree/master/templates/skeleton-of-thought.
▪Посмотрите видео на YouTube о его создании: https://youtube.com/watch?v=wLRHwKuKvOE
▪Прочитать статью здесь: https://arxiv.org/abs/2307.15337

@ai_machinelearning_big_data

👍16❤4🔥4🍌1

9.11K views08:12

Machinelearning

🔵

Differentiable and accelerated spherical transforms with JAX

Новые алгоритмы для ускоренного и дифференцируемого вычисления обобщенных преобразований Фурье на сфере и группы вращения т.е. сферических гармонических преобразований и преобразований Вигнера.

Новый гибридный подход к автоматическому и ручному дифференцированию, позволяющий эффективно вычислять градиенты.

Алгоритмы реализованы в рамках дифференцируемого программирования JAX.

🖥

Code: https://github.com/astro-informatics/s2fft

🦾 Project: https://astro-informatics.github.io/s2fft/

📚

Paper: https://arxiv.org/abs/2311.14670v1

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤3🔥2🎉1🍌1

8.91K views17:55

Machinelearning

👨‍💻 Нейросети, помогающие в написании и редактировании кода

Здесь собраны ИИ, которые пишут качественный код и по-настоящему помогут исправить баги в вашем проекте.В кажом проекте есть инструкция по установке и использованию.

1️⃣ Codeium - Поддерживаемые языки: более 70, но наиболее развиты C#, C, Python, CSS, Go, Groovy, Kotlin. В отличие от Copilot, Codeium позиционируется как помощник, который допишет код сам или найдет необходимые программисту инструменты в собственном хранилище. Пользователь пишет запрос на английском языке, а ИИ ищет и предлагает варианты.

2️⃣ Autogen - новейшее разработка от Microsoft вызвала фурор на GitHub: компания представила Autogen. Этот фреймворк позволяет ИИ-агентам общаться между собой для выполнения ваших задач.

Настройка Autogen проста — например, для устранения ошибок, написания кода, создания веб-дизайнов и выполнения различных проектов. Нейронные сети выдают себя за команду IT-специалистов, ведут диалог в чате и выполняют различные задачи по вашему запросу.

3️⃣ Code GPT — расширение для Visual Studio Code от OpenAI, которое помогает писать код по текстовым промптами. Он поддерживает множество популярных языков программирования и упрощает разработку, автоматически предлагая код на основе введенного вами текста.

4️⃣ CodePal — инструмент для написания и оптимизации кода, который также помогает находить ошибки и проводить код-ревью, делая разработку проще для программистов всех уровней.

5️⃣ Codesnippets — это сервис, который создает код по текстовым запросам. Он предлагает функции отладки, рефакторинга и возможность сохранения кода для командной работы. Существует как платная, так и бесплатная версия этого сервиса, что делает его доступным для широкого круга разработчиков.

6️⃣ BlackBox.AI - ИИ способный использовать поиск в интернете, но с добавлением агентов, который ориентирован на работу с кодом и чтение документации.

7️⃣ Tabnine - нейросеть, которая поддерживает различные популярные языки программирования. Этот сервис может дополнять строки кода и даже целые ветки кода.

8️⃣ Adrenaline - помогает анализировать и исправлять код, обнаруживая и предлагая варианты исправлений ошибок. Особенностью этого сервиса является возможность видеть свой код и предложенные изменения от Adrenaline на одном экране.

@ai_machinelearning_big_data

🔥47👍5😱3❤1

7.74K viewsedited 19:03

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

📐 Sketch Video Synthesis

Новая модель для создания скетчей из видео, представленных покадровыми кривыми Безье.

🖥

Code: https://github.com/yudianzheng/sketchvideo

🦾 Project: https://sketchvideo.github.io/

📚

Paper: https://arxiv.org/abs/2311.15306v1

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🥰14🔥4❤2🍌1

8.89K views21:01