302K subscribers
4.07K photos
725 videos
17 files
4.62K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🌟 ИИ применили для восстановления утраченного полотна Веласкеса

В Испании художник-реставратор Фернандо Санчес Кастильо с помощью нейросети смог воссоздать утраченную при пожаре картину «Изгнание морисков» Веласкеса. Для обучения ИИ он использовал эскиз полотна и описания современников художника.

Веласкес создал «Изгнание морисков» в 1627 году по заказу короля Филиппа IV. Картина изображала изгнание из Испании 300 тысяч перешедших в католичество мусульман из-за возможного предательства. В 1734 году картина была утрачена при пожаре.

ИИ сгенерировал видео продолжительностью чуть более четырёх минут, которое вначале демонстрирует повреждения полотна, но затем постепенно реконструирует его. Этот ролик использовали для воссоздания холста размером 335х274 см. Также художники применили последнюю версию Adobe Photoshop с функциями ИИ. В частности, они использовали «генеративную заливку», чтобы незаметно объединить разные изображения.

Работа заняла более ста часов. Как отмечает Кастильо, 80% работы соответствует «художественному творчеству», а 20% принадлежит ИИ.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27🔥115🤬3🥱3❤‍🔥1🙈1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ DesignEdit: Multi-Layered Latent Decomposition and Fusion for Unified & Accurate Image Editing

Microsoft представляет DesignEd it!

Это метод редактирования изображений, который позволяет удалять объекты, менять местами предметы, перемещать их, изменять размер, добавлять и переворачивать несколько объектов, делать панорамы и масштабировать изображения, удалять объекты с изображений.

Github: https://github.com/design-edit/DesignEdit.git
Paper: https://arxiv.org/abs/2403.14487
Project: https://design-edit.github.io/

@ai_machinelearning_big_data
👍244🔥4🤔2👏1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Unbounded 3D City Generation🔥

🏙️ CityDreamer 🏙️ композиционная генеративная модель для создания полноценных 3D-городов.

Project: https://infinitescript.com/project/city-dreamer/
Code: https://github.com/hzxie/CityDreamer
Demo: https://huggingface.co/spaces/hzxie/

@ai_machinelearning_big_data
👍19🔥3😁32
🌟 Claude 3 Opus сбросила GPT-4 с первого места в рейтинге языковых моделей

Большая языковая модель (LLM) Claude 3 Opus от Anthropic впервые превзошла GPT-4 (модель в основе ChatGPT) от OpenAI на Chatbot Arena — популярной площадке, где пользователи оценивают качество работы чат-ботов. «Король мёртв», — написал в социальной сети X разработчик ПО Ник Добос.

Зашедшим на сайт пользователям Chatbot Arena предлагается ввести запрос, после чего демонстрируются два результата от неуказанных языковых моделей — человек должен выбрать, какой результат нравится больше. Проведя тысячи сравнений, Chatbot Arena заполняет обновляемую рейтинговую таблицу. Сайт управляется исследовательской организацией Large Model Systems Organization (LMSYS ORG), занимающейся открытыми ИИ-моделями.

«Впервые на вершине рейтинга ИИ-модели не от OpenAI: Opus для сложных задач, Haiku — для вариантов, когда нужно дёшево и быстро. Это обнадёживает — от конкуренции разработчиков все только выиграют. Тем не менее, GPT-4 уже больше года, и конкуренты догнали её только сейчас», — прокомментировал событие независимый исследователь ИИ Саймон Уиллисон (Simon Willison).

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍123😁3
📌Аппаратные требования больших языковых моделей ИИ сокращаются вдвое каждые восемь месяцев

Большие языковые модели, лежащие в основе чат-ботов с искусственным интеллектом, развиваются настолько быстро, что всего за восемь месяцев необходимые им для работы аппаратные ресурсы сокращаются вдвое — сами чипы демонстрируют намного более скромный прогресс.

Существуют два способа повысить производительность систем ИИ, обращает внимание исследователь из Массачусетского технологического института Тамай Бесироглу (Tamay Besiroglu): увеличить размеры больших языковых моделей, что потребует соразмерного увеличения вычислительной мощности, хотя оборудование для ИИ сегодня находится в дефиците; или оптимизировать базовые алгоритмы, чтобы более эффективно применять существующее оборудование. Похоже, нынешние разработчики больших языковых моделей предпочли второй подход.

Учёные проанализировали показатели производительности 231 большой языковой модели, разработанных в период с 2012 по 2023, и обнаружили, что вычислительная мощность, необходимая для их работы, сокращалась в среднем вдвое каждые восемь месяцев. Это значительно быстрее, чем предполагает эмпирический закон Мура, согласно которому число транзисторов на кристалле (мера его производительности) удваивается каждые 18–24 месяца. Исследователи отмечают, что такой рост производительности систем ИИ отчасти связан с оптимизацией кода, хотя точно определить это не получается, потому что алгоритмы ИИ часто не поддаются анализу. Свою роль, конечно, сыграло и развитие аппаратных компонентов

Разница в темпах развития является показателем того, насколько эффективно разработчики больших языковых моделей используют доступные им ресурсы. Бесконечно оптимизировать алгоритмы не получится, считает Бесироглу, и нет ясности, сохранится ли такой темп развития в долгосрочной перспективе. Существуют и опасения, что повышение эффективности моделей может, напротив, увеличить потребление энергии отраслью ИИ, поэтому нельзя заниматься только одним аспектом.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍145🔥5
🔥 Microsoft разработала систему для выявления галлюцинаций в ИИ-приложениях клиентов

Директор по продуктам Microsoft по ответственному ИИ Сара Бёрд рассказала, что её команда разработала несколько новых функций безопасности для клиентов Azure, которые позволят выявлять галлюцинации в работе служб искусственного интеллекта.

Эти инструменты на базе больших языковых моделей могут обнаруживать потенциальные уязвимости, отслеживать галлюцинации, «которые правдоподобны, но не поддерживаются», и блокировать вредоносные запросы в режиме реального времени для клиентов Azure AI, работающих с любой моделью, размещённой на платформе.

Одна из функций будет блокировать вредоносные подсказки из внешних документов, которые провоцируют модели отойти от инструкций. Другая будет оценивать безопасность, в том числе уязвимости модели.

Скоро появятся две другие функции, позволяющие направлять модели к безопасным выводам и отслеживать подсказки для выявления потенциально проблемных пользователей. Независимо от того, вводит ли пользователь подсказку или модель обрабатывает сторонние данные, система мониторинга оценит её, чтобы определить, содержит ли она какие-либо запрещённые слова. После этого система просматривает ответ модели и проверяет, не галлюцинировала ли она.

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍187🔥3🤨3🤔2😐1
🔥 Для модели Voice Engine от OpenAI требуется всего лишь 15-секундный образец для клонирования голоса

Для модели Voice Engine от OpenAI требуется всего лишь 15-секундный образец для клонирования голоса

OpenAI предложила ограниченный доступ к платформе преобразования текста в голос Voice Engine, которой достаточно 15-секундного образца для клонирования голоса. Сгенерированный искусственным интеллектом голос способен по команде зачитывать текстовые подсказки на языке исходника или других языках.

Одними из первых доступ к Voice Engine получили компания в сфере образовательных технологий Age of Learning, платформа визуального повествования HeyGen, ведущий производитель программного обеспечения для здравоохранения Dimagi, разработчик коммуникационных приложений на базе ИИ Livox и система здравоохранения Lifespan.

В OpenAI поделились, что разработка Voice Engine стартовала в конце 2022 года. Технология уже поддерживает предустановленные голоса для API преобразования текста в речь и функции чтения вслух ChatGPT.

Член команды разработчиков Voice Engine Джефф Харрис рассказал, что модель обучили на «сочетании лицензированных и общедоступных данных». OpenAI уточнила, что модель будет доступна примерно 10 разработчикам.

Генерация текста в аудио при помощи ИИ — развивающаяся область. Большинство моделей генеративного ИИ сосредоточены на инструментальных или естественных звуках. Компании Podcastle и ElevenLabs представили свои технологии клонирования голоса, использующие нейросети.

Одновременно с этим правительство США стремится ограничить неэтичное использование голосовых технологий ИИ. В прошлом месяц Федеральная комиссия по связи США запретила звонки с использованием сгенерированных ИИ голосов, поскольку ранее несколько абонентов получили спам-звонки с клонированным голосом американского президента Джо Байдена.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍175🌚4🔥3🤔2
🌟 NVIDIA анонсировала ИИ-медсестёр для помощи в больницах

Производитель видеочипов объявил о сотрудничестве с Hippocratic AI, специализирующейся на разработках искусственного интеллекта. Компания презентовала виртуальных медсестёр для снижения нагрузки на медицинских работников в здравоохранительной сфере.

По словам компании-партнёра Hippocratic AI, языковые модели — единственный масштабируемый способ, позволяющий устранить разрыв между спросом пациентов и возможностями больниц, столкнувшихся с дефицитом кадров. Новые роботы-медсёстры обходятся медицинским учреждениям всего в 9 долларов в час — это ниже, чем минимальная почасовая оплата труда в США и ниже средней почасовой оплаты труда дипломированных медсестёр.

В новом ролике NVIDIA показала возможный разговор между пациентом и искусственным интеллектом после операции. Виртуальный медработник даёт советы по реабилитационному периоду и отвечает на вопросы о том, безопасны ли определённые антибиотики в лечении.

Hippocratic AI привлекла инвестиции в размере 53 миллионов долларов от General Catalyst и Premji Invest. Общий бюджет проекта оценивается в 500 миллионов долларов. Разработка может решить проблему растущей нехватки кадров в медицинской сфере.

📎 Youtube

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍225🔥3😨1
▶️Учёные создали пластырь, восстанавливающий речь при помощи ML

Биоинженеры Калифорнийского университета в Лос-Анджелесе разработали клейкий пластырь на шею для людей с ограниченными возможностями. Открытие поможет пациентам с нарушениями голоса, а также людям с диагностированным раком гортани.

Авторы исследования создали тонкое и эластичное устройство в виде пластыря размером 30х30 мм. Для работы оно крепится на кожу рядом с горлом, чтобы дать людям возможность говорить при проблемах с голосовыми связками и диагностированными заболеваниями.

Система фиксирует движения мышц гортани и переводит эти сигналы в слышимую речь с использованием машинного обучения. Технология считывает работу мышц с точностью до 95%. Гаджет весит семь граммов, а его толщина составляет всего 1,5 мм. Пластырь крепится к горлу на двустороннюю биосовместимую ленту.

Разработку можно использовать повторно. При масштабировании технология поможет восстановить голос пациентам с дисфункциональными голосовыми связками.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥70👍158🏆3❤‍🔥1😁1
Обновление платформы YTsaurus

В новой версии YTsaurus Server 23.2.0 оптимизировали подсистему обработки данных, добавили OAuth‑аутентификацию и расширили возможности языка запросов динамических таблиц. Плюсом — еще несколько обновлений других частей платформы.

Подробности — в блоге.

@ai_machinelearning_big_data
👍6🔥43😁2
This media is not supported in your browser
VIEW IN TELEGRAM
👱 Arc2Face: A Foundation Model of Human Faces

TL; DR: крупный датасет изображений лиц в высоком разрешении, а также обученная на его основе модель генерации лиц , которая:

способна создавать фотореалистичные генерации за несколько секунд
обеспечивает полное сходство генераций с целевым изображением по сравнению с другими существующими моделями
построена на основе Stable Diffusion и может быть настроена для любых вариантов генераций, например, различных поз / выражений лица и тд.

Github: https://github.com/foivospar/Arc2Face
Project: https://arc2face.github.io
Demo: https://huggingface.co/spaces/FoivosPar/Arc2Face
Paper: https://arxiv.org/abs/2403.11641

@ai_machinelearning_big_data
11👍10🔥6😐1
Факультет компьютерных наук НИУ ВШЭ расширяет сотрудничество с Яндексом для подготовки специалистов по ИИ и ML.

ФКН был основан ВШЭ совместно с Яндексом 10 лет назад. За время своего существования он стал одним из лидеров в подготовке разработчиков и специалистов по ИИ и ML, выпустив более 3 000 человек,

В следующие 10 лет Яндекс и ВШЭ:

- Увеличат количество выпускников факультета по программам Яндекса в 4 раза
- Откроют магистратуру по ИИ в маркетинге и продукте
- Создадут направления по генеративным технологиям на магистерской программе "Современные компьютерные науки"
- Запустят студенческий кемп по машинному обучению

Обратите внимание, если планируете стать студентом — ВШЭ занимает второе место среди российских университетов по количеству публикаций на конференциях A*.

Подробнее

@ai_machinelearning_big_data
👍33🔥9🤬4🥱32🥰1😁1🤓1🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

MagicLens: новое семейство моделей для поиска изображений от Google.

Они обучены на 36,7 млн высококачественных триплетов (исходное изображение, запрос, целевое изображение)с богатыми семантическими связями.

Самое интересное, что MagicLens превосходят предыдущую SOTA на 10 различных бенчмарках по поиску изображений, при этом сами модели в 50 раз меньше.

Project: https://open-vision-language.github.io/MagicLens/
Paper: https://arxiv.org/abs/2403.19651
HF: https://huggingface.co/papers/2403.19651

@ai_machinelearning_big_data
👍205🔥5❤‍🔥1