gptscience 🤖
205 subscribers
42 photos
28 videos
50 links
Свежие новости из мира GPT-моделей, Машинного Обучения и ИИ🤖

Для связи: @sokoloveai
Download Telegram
#GPTApplication Насколько быстро развиваются диффузионные модели? Настолько быстро! 🤖

К примеру, Вы можете оценить качество сгенерированных изображений на моем втором канале @gptwomen
В основном это 🔞
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2😁2🍌2
This media is not supported in your browser
VIEW IN TELEGRAM
#GPTApplication LIV: Языковая ценность изображения для роботов 🤖

🤓 В статье Language-Image Value Learning представлен новый подход, который сочетает в себе reinforcement learning и mutual information constractive learning для обучения роботов зрительно-языковому представлению с использованием системы вознаграждений.

Основные выводы из статьи:

🗂 Можно использовать большие наборы видеоданных для обучения моделей. Затем модель самостоятельно может назначать вознаграждения (поощрение за правильные действия модели) отдельным кадрам в видео, где могут быть представлены роботы или люди, выполняющие определенные задачи в новых условиях.

🧠 LIV можно зафайнтюнить за счет точной настройки с использованием данных, специфичных для предметной области, что позволит лучше управлять роботами.

👨‍💻 К примеру, робота из видео, готовящего сочный 🍔, тренировали на датасете EpicKitchen

Мы уже рассматривали Tennis AI как пример обучения моделей на специфических данных, теперь доступно на роботах 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥2
#GPTEli5 Обучение роботов 🤖

🧠 Language-Image Value learning (LIV) - метод, который сочетает в себе обучение с подкреплением и контрастным обучением для модели, которая понимает как язык, так и информацию об изображении / видео для роботов.

🤓 Mutual Information Contrasive Learning (контрастное обучение) - метод, который обучает модель находить полезную информацию из разных источников (например, языка и изображения) путем максимизации взаимной информации между ними.

👨‍💻 Reinforcment learning (обучение с подкреплением) - обучение модели принимать решения на основе проб и ошибок, где она получает вознаграждения за правильные действия.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥2