В современном мире технологии синтеза речи и клонирования голоса стремительно развиваются и уже достигли впечатляющих результатов. С 2015 года проводится специальное соревнование ASV Spoofing, на котором ежегодно презентуют новые методы проведения спуфинг-атак (атаки, когда один человек или программа маскируется под другую путем фальсификации данных) с помощью видео-дипфейков и синтеза речи. Существующие речевые системы способны синтезировать речь и тембр голоса, на слух неотличимые от настоящих. Технологии клонирования голоса привлекают всё большее внимание и находят широкое применение в таких сферах, как голосовое управление, робототехника, голосовые ассистенты (например, Siri и Алиса) и т.д. Однако вместе с этим открываются новые возможности для мошенничества. Особенно уязвимы системы, использующие голосовую биометрию для идентификации пользователей: используя синтез речи, мошенники могут получить доступ к аккаунтам и данным пользователей.
Для борьбы с неэтичным использованием голосовых технологий необходимо разработать инструменты распознавания искусственной речи. Нужно, чтобы разработанная модель обладала хорошей обобщающей способностью и умела детектировать синтезированную речь независимо от языка, акцента и тембра голоса конкретного человека.
В публикации рассмотрю несколько новейших разработок в этой области, а потом синтезирую запись искусственной речи и на этом примере проверю работу одной из представленных моделей.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤1🔥1
Вам больше не нужен интерпритатор.
Этот рассказ вдохновлён другой историей, “Настройка Виртуальной Машины внутри ChatGPT”. Я был впечатлен и решил попробовать нечто подобное – в этот раз вместо командной строки Linux давайте попросим ChatPGT стать нашим интерпретатором Python.Можно воспринимать эту статью как инструкцию по работе с CHATGpt.
Вот исходная команда для инициализации ChatPGT:
Я хочу, чтобы ты выступил в роли интерпретатора Python. Я буду вводить команды, а ты будешь отвечать, что должен показать вывод Python. Я хочу, чтобы ты отвечал только с выводом на терминал внутри одного уникального блока кода, и ничего больше. Не пиши объяснений, выводи только то, что выводит Python. Не вводи команды пока я не дам соответствующих инструкций. Когда мне нужно сказать тебе что-то по-английски, я буду делать это, помещая текст внутри фигурных скобок, как это сделано здесь: {пример текста}. Моя первая команда – a=1.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥1
В последнее время создание моделей Transformer для обработки графоструктурированных данных вызвало широкий интерес в сообществе исследователей машинного обучения. Одна из критических проблем связана с квадратичной сложностью глобального внимания, которая мешает трансформерам масштабироваться до больших графов. В этом блоге будет кратко представлена недавняя работа над NeurIPS22:
В этой работе предлагается масштабируемый graph Transformers для графов классификации больших узлов, где количество узлов может варьироваться от тысяч до миллионов (или даже больше). Ключевой модуль представляет собой передачу сообщений на основе ядра Gumbel-Softmax, которая обеспечивает распространение функций по всем парам со сложностью O(N) (N для #nodes).
Нижеследующее содержание подытожит основную идею и результаты данной работы.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥1
Часто у начинающих Data Scientists возникает вопрос, как демонстрировать работу своих моделей другим людям. Банальный пример – прикрепить ссылку на гитхаб репозиторий в отклике на вакансию или показать свое “детище” знакомым со словами “смотрите, что умею”.
Проще говоря, мы хотим задеплоить нашу модель, превратить ее в демо нашего исследования.
Проблема в том, что для этого нужно скачивать репозиторий, установливать нужную версию python и всех необходимых библиотек, а также разбираться, как запускать приложение. Слишком много сложностей для человека, который хочет использовать или просто посмотреть вашу работу. То есть вопрос в том, как передать продукт клиенту.
В статье я расскажу простыми словами, что такое Docker и как его можно использовать для реализации своих решений в Machine Learning.
▪ Читать дальше
▪ Разработка Airflow с помощью Docker
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍4❤2😁1🤔1
Многие привыкли считать, что компьютерное зрение — это какая-то неимоверно сложная технология и исключительно вещь в себе. Ну, конечно, кроме тех людей, которые занимаются непосредственно компьютерным зрением. Надеюсь.
Сегодня я хочу рассказать про один фокус, можно сказать, забавный эксперимент — довольно известный, возможно, среди опытных обработчиков изображений, но настолько слабо применимый на практике, что не часто о нём заходит речь. Однако, этот маленький эксперимент, как мне кажется, наводит на интересные теоретические выкладки относительно работы свёрточных нейросетей. Эксперимент, о котором я говорю — поиск объекта на изображении при помощи функции взаимной корреляции (без нейронных сетей). Звучит, возможно, пугающе и непонятно, но на деле всё очень просто, чистая математика.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый алгоритм реставрации лица SOTA на фотографиях с сильными искажениями.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥3❤1
Понадобится, если вы не слишком часто программируете на Python, хотите научиться в довольно короткий срок или хотите быстро вникнуть в синтаксис, функции и методы языка.
На страничке также есть описания некоторых библиотек для скрапинга, затронуто метапрограммирование и асинхронность.
#python #cheatsheet
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤1🥰1
✔️ 38 лучших библиотек для Data Science, Data Visualization и Машинного Обучения
Мы решили, что будем группировать все библиотеки по общим признакам, будь то библиотеки для машинного обучения или библиотеки для математики. Тем не менее, все 38 из них будут полезны для разработки в области Data Science.
➡️ Смотреть
@machinelearning_ru
Мы решили, что будем группировать все библиотеки по общим признакам, будь то библиотеки для машинного обучения или библиотеки для математики. Тем не менее, все 38 из них будут полезны для разработки в области Data Science.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥1
Квантовое машинное обучение – это область на пересечении квантовых вычислений и машинного обучения. Она включает в себя использование квантовых компьютеров для выполнения задач машинного обучения, таких как классификация, регрессия и кластеризация. Квантовые компьютеры – это мощные машины, которые используют квантовые биты (кубиты) вместо классических битов для хранения и обработки информации. Это позволяет им выполнять определенные задачи намного быстрее, чем классические компьютеры, что делает их особенно хорошо подходящими для задач машинного обучения, связанных с большими объемами данных.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥2❤1
Auto-Synced-Translated-Dubs – инструмент, который позволяет, c помощью AI создавать аудиодорожки для видео на разных языках.
✔️ Пример
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Сервис использует глубокое обучение, чтобы помочь вам писать код быстрее.
Данные для обучения модели разработчики собрали с открытых репозиториев на GitHub. Во время обучения модель будет предсказывать следующий токен на основе предыдущих токенов. В NLP токен — это единица анализа текста.
Текущая версия работает для Python, Java, Haskell и C++. Tabnine совместим с VS Code, Sublime Text, Atom, Vim и прочими редакторами кода.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Мультимодальный рассказчик ИИ, созданный с помощью Stable Diffusion, GPT и нейронного преобразования текста в речь (TTS).
$ git clone https://github.com/jaketae/storyteller.git@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2❤1
Важность непрерывного обучения в области Data Science и машинного обучения.
Непрерывное обучение так важно в этих областях, потому что там всё постоянно меняется! Постоянно разрабатываются новые методы и инструменты. Важно быть в курсе последних событий, если вы хотите оставаться конкурентоспособным на рынке труда и быть эффективным в своей работе. Кроме того, следование последним передовым технологиям и отраслевым стандартам – это просто хорошая практика, независимо от того, в какой области вы работаете.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤2👍2
Yolo8 is coming!
На github вылложили веса.
Обновилась документация.
🖥 Github
🖥 Colab
✔️ Docs
@machinelearning_ru
На github вылложили веса.
Обновилась документация.
✔️ Docs
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥3🥰2
2022 год был прорывом для машинного обучения и исследований в области искусственного интеллекта. Крупные технологические компании выпустили множество удивительных библиотек, которые принесут пользу разработчикам. Мы видели несколько замечательных исследовательских работ, как от крупных технологических компаний, так и от небольших групп программистов.
И, конечно же, это был год Больших Языковых Моделей. Люди придумали всевозможные варианты использования LLM. В то время как большая часть этого контента была продуктом влиятельных лиц, создающих видео с большим количеством лжи и дезинформации, этот ажиотаж является доказательством потенциала, стоящего за такими технологиями. Однако ChatGPT в настоящее время закрыт из-за ограничений доступа API. Хотя он может делать довольно крутые вещи, решения с открытым исходным кодом и доступом к нему крайне важны для тех, кто хочет создавать свои собственные приложения, используя этот API. В этой статье я поделюсь с вами некоторыми из конкурентов ChatGPT, чтобы у вас было представление о том, что выбрать.
✔️ Читать дальше
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤1🔥1
Библиотека Python для расчета большого количества метрик из текста (ов) с использованием компонентов конвейера spaCy v.3 и расширений. TextDescriptives можно использовать для вычисления нескольких описательных статистик, показателей удобочитаемости текста и показателей, связанных с расстоянием зависимости слов.
pip install textdescriptives@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
CV-CUDA — это проект с открытым исходным кодом от Nvidia, который позволяет создавать эффективные облачные приложения искусственного интеллекта (ИИ) для обработки изображений и компьютерного зрения (CV).
✔️ Guide
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2❤1
🚀 Обучаем с YOLOv8 на пользовательских данных? YOLOv8 инструкция по работе
Значительные улучшения были сделаны с точки зрения скорости, точности и архитектуры. Его архитектура сделана с нуля, и из YOLOv5 не использовались никакие основные модули. YOLOv8 быстрее по скорости и точнее, чем его предыдущая версия (YOLOv7), и достигает нового максимума с точки зрения средней точности (MAP) с результатом 53,7.
Давайте попробуем обучить модель на собственных данных.
➡️ Читать дальше
@machinelearning_ru
Значительные улучшения были сделаны с точки зрения скорости, точности и архитектуры. Его архитектура сделана с нуля, и из YOLOv5 не использовались никакие основные модули. YOLOv8 быстрее по скорости и точнее, чем его предыдущая версия (YOLOv7), и достигает нового максимума с точки зрения средней точности (MAP) с результатом 53,7.
Давайте попробуем обучить модель на собственных данных.
➡️ Читать дальше
@machinelearning_ru
👍11❤2🔥1
🔥 6 новых библиотек Machine Learning (ML), которые стоит изучить, чтобы улучшить свои навыки в 2023
На дворе только начался 2023 год, а это значит, что пришло время открыть для себя новые тенденции в области Data Science и машинного обучения. Хотя старые материалы по-прежнему актуальны, знаний Pandas, NumPy, Matplotlib и Scikit-learn уже недостаточно.
Данная статья посвящена шести восходящим звёздам экосистемы MLOps; инструментам, ориентированным на создание наиболее эффективных моделей и последующее внедрение их в продакшен. Давайте начнём!
▪ Читать
▪Зеркало
@machinelearning_ru
На дворе только начался 2023 год, а это значит, что пришло время открыть для себя новые тенденции в области Data Science и машинного обучения. Хотя старые материалы по-прежнему актуальны, знаний Pandas, NumPy, Matplotlib и Scikit-learn уже недостаточно.
Данная статья посвящена шести восходящим звёздам экосистемы MLOps; инструментам, ориентированным на создание наиболее эффективных моделей и последующее внедрение их в продакшен. Давайте начнём!
▪ Читать
▪Зеркало
@machinelearning_ru
👍9🔥4❤2
В этой статье я покажу, как мы можем взять описания покемонов из записей Pokedex, найденных в разных играх франшизы Pokemon, и использовать их для создания сгенерированных искусственным интеллектом изображений этих покемонов с помощью Python! Я думаю, будет весело и даже интересно посмотреть, как искусственный интеллект интерпретирует покемонов.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍5❤2👎1
NLP системы автоматического ответа на вопросы (Question Answering /QA).
Одним из разделов NLP являются системы автоматического ответа на вопросы (Question Answering /QA). Разделяют три основных вида моделей QA:
- Извлекающая QA: модель извлекает ответ из контекста. В качестве контекста выступает предоставленный текст, таблица или даже HTML;
- Открытая генерирующая QA: модель генерирует произвольный текст непосредственно на основе контекста;
- Закрытый генеративный QA: в этом случае контекст не предоставляется. Ответ полностью генерируется моделью.
➡️ Читать дальше
@machinelearning_ru
Одним из разделов NLP являются системы автоматического ответа на вопросы (Question Answering /QA). Разделяют три основных вида моделей QA:
- Извлекающая QA: модель извлекает ответ из контекста. В качестве контекста выступает предоставленный текст, таблица или даже HTML;
- Открытая генерирующая QA: модель генерирует произвольный текст непосредственно на основе контекста;
- Закрытый генеративный QA: в этом случае контекст не предоставляется. Ответ полностью генерируется моделью.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🔥1