Forwarded from Дата-Утренник
Ограничения искусственного интеллекта
OpenAI считают (и заявляли в дискуссиях с правительствами), что запуск процесса тренировки подобных моделей должен сопровождаться сообщением о нём государству и/или регулятору. [2023]
Если вы думаете, что только сейчас начали стандартизировать искусственный интеллект, то вы сильно ошибаетесь.
Вот пример:
The AI Methods, Capabilities and Criticality Grid [2021]
Документ, который описывает возможное применение искусственного интеллекта в бизнесе и его последствия. Это своего рода переводчик с языка программистов на язык бизнеса, который поможет понять, что можно ожидать от разработки и какие преимущества она может принести.
Несколько других интересных событий:
ИИ системы могут получать патенты в соответствии с австралийским патентным законодательством [2021]
Апелляционный суд США окончательно разрешил собирать публичные данные в Интернете [2022]
@data_morning
Также стоит упомянуть историю с Copilot, где разработчики жаловались на то, что модель просто повторяет их код без изменений. Новости об этом были актуальны недавно, но последний апдейт по этой теме был 4 ноября 2022.
OpenAI считают (и заявляли в дискуссиях с правительствами), что запуск процесса тренировки подобных моделей должен сопровождаться сообщением о нём государству и/или регулятору. [2023]
Если вы думаете, что только сейчас начали стандартизировать искусственный интеллект, то вы сильно ошибаетесь.
Вот пример:
The AI Methods, Capabilities and Criticality Grid [2021]
Документ, который описывает возможное применение искусственного интеллекта в бизнесе и его последствия. Это своего рода переводчик с языка программистов на язык бизнеса, который поможет понять, что можно ожидать от разработки и какие преимущества она может принести.
Несколько других интересных событий:
ИИ системы могут получать патенты в соответствии с австралийским патентным законодательством [2021]
Апелляционный суд США окончательно разрешил собирать публичные данные в Интернете [2022]
@data_morning
Также стоит упомянуть историю с Copilot, где разработчики жаловались на то, что модель просто повторяет их код без изменений. Новости об этом были актуальны недавно, но последний апдейт по этой теме был 4 ноября 2022.
👍11🔥2❤1👎1
Forwarded from Дата-Утренник (Максим Герасимов)
Tweets for Stocks
Вы наверняка слышали о том, как сообщения известных личностей могут повлиять на цены акций. Нашел проект, в котором решили проверить существует ли зависимость между твитами и изменением цен на акции.
Для этого они использовали несколько моделей, включая catboost, tr roberta и naive bayes. Наилучший результат на классификации (повышение/понижение цены) составил 0,58.
@data_morning
В репозитории есть все ноутбуки.
Страница проекта
Вы наверняка слышали о том, как сообщения известных личностей могут повлиять на цены акций. Нашел проект, в котором решили проверить существует ли зависимость между твитами и изменением цен на акции.
Для этого они использовали несколько моделей, включая catboost, tr roberta и naive bayes. Наилучший результат на классификации (повышение/понижение цены) составил 0,58.
@data_morning
В репозитории есть все ноутбуки.
Страница проекта
👍28❤4😁2
Forwarded from Dealer.AI
Self-supervised learning book.
Ну, что, други. Прошли сутки, пора выдыхать и тянуть нашу DS'ную лямку дальше. Работку работать.
Поэтому я со свежими новостями.
Тут давече, Мета, выпустила на arxiv книжку по самообучению. ;)
Напомню, что мой любимый metric-learning, contrastive learning и обучение LM'ок в тч сводится к self-supervised. Поэтому берём на вооружение книженцию, я уже посмотрел чутка. Точно будет полезно, особенно есть как математические выкладки, так и полезные usefull хинты для практики.
Налетай!
Ну, что, други. Прошли сутки, пора выдыхать и тянуть нашу DS'ную лямку дальше. Работку работать.
Поэтому я со свежими новостями.
Тут давече, Мета, выпустила на arxiv книжку по самообучению. ;)
Напомню, что мой любимый metric-learning, contrastive learning и обучение LM'ок в тч сводится к self-supervised. Поэтому берём на вооружение книженцию, я уже посмотрел чутка. Точно будет полезно, особенно есть как математические выкладки, так и полезные usefull хинты для практики.
Налетай!
arXiv.org
A Cookbook of Self-Supervised Learning
Self-supervised learning, dubbed the dark matter of intelligence, is a promising path to advance machine learning. Yet, much like cooking, training SSL methods is a delicate art with a high...
👍39🥰4
Forwarded from Соне нравится (или нет)
Мы с частью нашей команды активно потрудились в начале этого года и теперь готовы представить наш качественно размеченный датасет для обучения моделей в задачах Face Parsing и Portrait Segmentation. Решать данные задачи с нашим датасетом стало так просто, что мы назвали его EasyPortrait. 😎
Все мы не первый день в машинном обучении и знаем, что большую часть успеха в обучении модели играют данные. И прежде, чем обучать модель, стоит оценить качество данных, с которыми нужно работать. Если данные хорошо размечены, их много и они разнообразныеа ещё у ML-разработчика прямые руки, то можно взять стандартный пайплайн обучения без каких-либо усложнений и быстро обучить модель с лёгкой архитектурой, получая на уже относительно ранних шагах достаточно высокие метрики. Если же ситуация с данными неутешительная, то в ход идут усложнения пайплайна обучения или препроцессинга данных.
Я и мои work-✨ besties✨ предполагали, что наш датасет будет использоваться для разработки моделей для приложений с видеозвонками, где есть спрос на сегментацию фона, чтобы его заблюрить, или на сегментацию кожи и зубов для бьютификации. 💅✨ Поэтому данные модели должны быть максимально лёгкими и быстрыми, чтобы работать в риал-тайме почти без пропусков кадров, ведь пайплайн инференса будет происходить на CPU вашего любимого компьютера! А ещё мы так и не нашли ни одного датасета из всех существующих, который бы удовлетворил наши требования при решении задач Face Parsing и Portrait Segmentation, поэтому прошу любить и активно использовать EasyPortrait в своих задачах, вам должно понравится.
А ещё не забудьте усыпать нам звёздами репозиторий на GitHub. Нам было бы приятно! И ещё будем очень признательны за фидбек, а также мы готовы к совместным проектам!🥰
➡️ Ссылки:
💙 Arxiv
💙 GitHub
💙 Habr
💙 Medium (soon)
Все мы не первый день в машинном обучении и знаем, что большую часть успеха в обучении модели играют данные. И прежде, чем обучать модель, стоит оценить качество данных, с которыми нужно работать. Если данные хорошо размечены, их много и они разнообразные
Я и мои work-
А ещё не забудьте усыпать нам звёздами репозиторий на GitHub. Нам было бы приятно! И ещё будем очень признательны за фидбек, а также мы готовы к совместным проектам!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤31👍8🔥5🤩1
Forwarded from Дата-Утренник (Максим Герасимов)
ML Model Watermarking
SAP сделали инструмент для защиты моделей машинного обучения путем добавления водяных знаков (в веса модели) на основных фреймворках: Scikit-learn, PyTorch, HuggingFace.
Добавление водяных знаков не сильно влияет на точность модели, но позволяет доказать ее владение и предотвратить несанкционированное использование.
@data_morning
github
SAP сделали инструмент для защиты моделей машинного обучения путем добавления водяных знаков (в веса модели) на основных фреймворках: Scikit-learn, PyTorch, HuggingFace.
Добавление водяных знаков не сильно влияет на точность модели, но позволяет доказать ее владение и предотвратить несанкционированное использование.
@data_morning
github
🔥46🤡14👍7
Тот самый хардкорный курс по машинному обучению от топов рынка!
Валерий Бабушкин (Vice President, Data Science в Blockchainꓸcom, ранее работал в Facebook, Alibaba, X5 Group, Яндекс) со своими коллегами — руководителями Data Science направлений в крупнейших компаниях помогут вывести ваши знания на новый уровень.
Вы научитесь решать нестандартные ML-задачи, востребованные бизнесом.
От предсказания ценовых диапазонов до решения маркетинговых задач с помощью uplift-моделирования.
Этот курс может стать для вас вызовом — придётся нехило попотеть (поэтому курс и называется HARD ML) Но оно определённо того стоит, ведь знания прикладные: каждый модуль заканчивается разработкой ML-сервиса, который будет не стыдно показать будущему работодателю.
Следующий поток стартует уже 5 июня, а по промокоду GRADIENTML27 вы получите скидку 5%. Ждем вас!
[Зарегистрироваться]
Валерий Бабушкин (Vice President, Data Science в Blockchainꓸcom, ранее работал в Facebook, Alibaba, X5 Group, Яндекс) со своими коллегами — руководителями Data Science направлений в крупнейших компаниях помогут вывести ваши знания на новый уровень.
Вы научитесь решать нестандартные ML-задачи, востребованные бизнесом.
От предсказания ценовых диапазонов до решения маркетинговых задач с помощью uplift-моделирования.
Этот курс может стать для вас вызовом — придётся нехило попотеть (поэтому курс и называется HARD ML) Но оно определённо того стоит, ведь знания прикладные: каждый модуль заканчивается разработкой ML-сервиса, который будет не стыдно показать будущему работодателю.
Следующий поток стартует уже 5 июня, а по промокоду GRADIENTML27 вы получите скидку 5%. Ждем вас!
[Зарегистрироваться]
👎51👍17🤡13🥱4❤1
Forwarded from Нейрокузня | DreamForge
Пока SDXL еще не полностью вышла в открытый доступ, продолжаем выжимать всё возможное из нынешних моделей.
Почти месяц назад я разработал в рамках своей дипломной работы скрипт для Stable Diffusion WebUI, призванный помочь и новичкам, только осваивающим интерфейс, и бывалым энтузиастам в создании качественных изображений с минимальными усилиями. И наконец я готов этот скрипт, пусть и все еще на стадии поздней беты, выложить в открытый доступ.
AutoChar осуществляет автоматический инпеинт обнаруженных лиц и глаз на них, налаживает двухэтапный апскейл изображения, а так же чистит изначальную генерацию от шума.
Всё, впрочем, детально регулируется или выключается по мере надобности, при этом все настройки скрыты за шторкой, у новичков глаза разбегаться не будут. Базовые настройки достаточно универсальны, но в случае чего их всегда можно адаптировать под задачу.
Десятки лишних кликов и ручное рисований масок лиц мышкой теперь в прошлом, иллюстрация получается значительно лучше с одной кнопки. По сути, я автоматизировал свой собственный алгоритм работы и не надо верить мне на слово, сами попробуйте и оцените, насколько много времени и сил AutoChar экономит.
Пока реализованы не все задуманные мной и предложенные первыми тестерами функции, но всё впереди! Забрасывать разработку не намерен, т.к. каждый день использую скрипт сам в своей работе и сам заинтересован в его улучшении. Буду рад всем предложениям, пожеланиям и сообщениям об ошибках.
https://github.com/alexv0iceh/AutoChar
https://www.reddit.com/r/StableDiffusion/comments/14h5qa3/autochar_new_automatic1111_webui_script_for/
https://civitai.com/models/95923?modelVersionId=102438
Почти месяц назад я разработал в рамках своей дипломной работы скрипт для Stable Diffusion WebUI, призванный помочь и новичкам, только осваивающим интерфейс, и бывалым энтузиастам в создании качественных изображений с минимальными усилиями. И наконец я готов этот скрипт, пусть и все еще на стадии поздней беты, выложить в открытый доступ.
AutoChar осуществляет автоматический инпеинт обнаруженных лиц и глаз на них, налаживает двухэтапный апскейл изображения, а так же чистит изначальную генерацию от шума.
Всё, впрочем, детально регулируется или выключается по мере надобности, при этом все настройки скрыты за шторкой, у новичков глаза разбегаться не будут. Базовые настройки достаточно универсальны, но в случае чего их всегда можно адаптировать под задачу.
Десятки лишних кликов и ручное рисований масок лиц мышкой теперь в прошлом, иллюстрация получается значительно лучше с одной кнопки. По сути, я автоматизировал свой собственный алгоритм работы и не надо верить мне на слово, сами попробуйте и оцените, насколько много времени и сил AutoChar экономит.
Пока реализованы не все задуманные мной и предложенные первыми тестерами функции, но всё впереди! Забрасывать разработку не намерен, т.к. каждый день использую скрипт сам в своей работе и сам заинтересован в его улучшении. Буду рад всем предложениям, пожеланиям и сообщениям об ошибках.
https://github.com/alexv0iceh/AutoChar
https://www.reddit.com/r/StableDiffusion/comments/14h5qa3/autochar_new_automatic1111_webui_script_for/
https://civitai.com/models/95923?modelVersionId=102438
🔥42👏2❤1👍1
Forwarded from Complete AI (Andrey Kuznetsov)
⚡️⚡️⚡️Kandinsky 2.2 выходит в свет
Вот и наступил долгожданный знаменательный день, когда мы готовы порадовать комьюнити новой версией генеративной модели Kandinsky 2.2.
Не буду долго томить вас лирикой и историями, как мы маленькими шагами двигались к качественному скачку эти 3 месяца с момента релиза 2.1, а просто расскажу о ключевых нововведениях:
📌 разрешение генераций теперь достигло 1024 px
📌 генерировать можно с различным соотношением сторон (ура, конец монополии квадратных генераций!)
📌 изображения стали максимально близки к фотореалистичным
📌 у модели появилась возможность изменения частей изображения за счёт внедрения механики ControlNet (пока только на основе карты глубины)
📌 версии 2.1 и 2.2 встроены в самый большой и известный фреймворк генеративных моделей - Diffusers
⚡️В телеграм боте теперь 6 режимов:
1) генерация картинки по тексту
2) смешивание двух изображений
3) смешивание изображения и текста
4) создание вариаций входной картинки
5) локальные изменения с помощью ControlNet механики 💥
6) создание стикеров и стикерпаков по текстовым запросам 💥
Воспользоваться моделью можно тут:
Telegram bot
fusionbrain.ai
Diffusers
rudalle.ru
Салют
📕Почитать подробнее про Kandinsky 2.2 можно в новой статье на Хабре.
❓По вопросам сотрудничества и развития модели пишите в ЛС - с радостью обсудим все идеи😉
P.S. По неожиданной случайности сегодня еще День Фотографа, с чем всех причастных торжественно поздравляю📸 Такой вот подарок для сообщества от нашей команды🎉
@complete_ai
Вот и наступил долгожданный знаменательный день, когда мы готовы порадовать комьюнити новой версией генеративной модели Kandinsky 2.2.
Не буду долго томить вас лирикой и историями, как мы маленькими шагами двигались к качественному скачку эти 3 месяца с момента релиза 2.1, а просто расскажу о ключевых нововведениях:
📌 разрешение генераций теперь достигло 1024 px
📌 генерировать можно с различным соотношением сторон (ура, конец монополии квадратных генераций!)
📌 изображения стали максимально близки к фотореалистичным
📌 у модели появилась возможность изменения частей изображения за счёт внедрения механики ControlNet (пока только на основе карты глубины)
📌 версии 2.1 и 2.2 встроены в самый большой и известный фреймворк генеративных моделей - Diffusers
⚡️В телеграм боте теперь 6 режимов:
1) генерация картинки по тексту
2) смешивание двух изображений
3) смешивание изображения и текста
4) создание вариаций входной картинки
5) локальные изменения с помощью ControlNet механики 💥
6) создание стикеров и стикерпаков по текстовым запросам 💥
Воспользоваться моделью можно тут:
Telegram bot
fusionbrain.ai
Diffusers
rudalle.ru
Салют
📕Почитать подробнее про Kandinsky 2.2 можно в новой статье на Хабре.
❓По вопросам сотрудничества и развития модели пишите в ЛС - с радостью обсудим все идеи😉
P.S. По неожиданной случайности сегодня еще День Фотографа, с чем всех причастных торжественно поздравляю📸 Такой вот подарок для сообщества от нашей команды🎉
@complete_ai
🔥31❤6👍5
Градиентное погружение
Сегодня будут колабы с лорой на канди2.2)
LORA for Kandinsky2.2, которая работает в бесплатном колабе!)
Google
lora_decoder.ipynb
Colaboratory notebook
🔥28👍5