Простой гайд по построению модели синтеза речи
Недавно выходило несколько постов про нейросетевую обработку звука, данный гайд объединяет предыдущие подборки в результат, который можно потрогать. В основном используются фреймворки, представленные ранее в подборке.
Ссылка на источник
Недавно выходило несколько постов про нейросетевую обработку звука, данный гайд объединяет предыдущие подборки в результат, который можно потрогать. В основном используются фреймворки, представленные ранее в подборке.
Ссылка на источник
👍6🔥1
Трансформеры
Статься на русском с очень подробным объяснением архитектуры Transformers.
На данный момент эта архитектура используется почти во всех сферах ИИ, особенно в обработке естественного языка. Все LLM основаны именно на этой архитектуре.
Ссылка на источник
Статься на русском с очень подробным объяснением архитектуры Transformers.
На данный момент эта архитектура используется почти во всех сферах ИИ, особенно в обработке естественного языка. Все LLM основаны именно на этой архитектуре.
Ссылка на источник
👍6❤3
✍️ Библиотека программиста» находится в поиске авторов оригинальных статей
Языки
● C#, Go, SQL.
Тематика
● Data Science (Python), базовые и продвинутые концепции языков C#, Go, SQL.
Объем
● от 7 до 15 тыс. знаков.
● 3-4 статьи в месяц.
Оплата
● 4к руб. за статью.
● Работаем с самозанятыми, ИП.
Статья публикуется на сайте proglib.io, в группе ВК (424к подписчиков), на канале «Библиотека программиста» (77к подписчиков) и в одном из профильных тг-каналов: Библиотека Шарписта, Data scientist’а, Go-разработчика.
➡️ Заполнить анкету ⬅️
Я хорошо программирую, но пишу «так себе». Что делать?
Если вы хорошо программируете, но навыки письма немного отстают, пройдите наш бесплатный курс на Степике «Статьи для IT: как объяснять и распространять значимые идеи».
Языки
● C#, Go, SQL.
Тематика
● Data Science (Python), базовые и продвинутые концепции языков C#, Go, SQL.
Объем
● от 7 до 15 тыс. знаков.
● 3-4 статьи в месяц.
Оплата
● 4к руб. за статью.
● Работаем с самозанятыми, ИП.
Статья публикуется на сайте proglib.io, в группе ВК (424к подписчиков), на канале «Библиотека программиста» (77к подписчиков) и в одном из профильных тг-каналов: Библиотека Шарписта, Data scientist’а, Go-разработчика.
➡️ Заполнить анкету ⬅️
Я хорошо программирую, но пишу «так себе». Что делать?
Если вы хорошо программируете, но навыки письма немного отстают, пройдите наш бесплатный курс на Степике «Статьи для IT: как объяснять и распространять значимые идеи».
👍5❤3
Соглашение Эйнштейна о суммировании
einsum - это функция, предоставляемая библиотеками NumPy, PyTorch и тд. Она используется для выполнения операций над массивами с помощью спецификации индексов, что позволяет выполнять различные математические операции над многомерными массивами более эффективно и удобно.
Спецификация индексов в einsum определяет, какие элементы из входных массивов должны быть комбинированы, и каким образом они должны быть комбинированы. Это может быть полезным, например, для перемножения матриц, вычисления скалярных произведений, агрегирования данных и других операций, где необходимо управлять взаимодействием между элементами массивов.
Пример использования вложенных циклов и einsum для перемножения матриц:
einsum - это функция, предоставляемая библиотеками NumPy, PyTorch и тд. Она используется для выполнения операций над массивами с помощью спецификации индексов, что позволяет выполнять различные математические операции над многомерными массивами более эффективно и удобно.
Спецификация индексов в einsum определяет, какие элементы из входных массивов должны быть комбинированы, и каким образом они должны быть комбинированы. Это может быть полезным, например, для перемножения матриц, вычисления скалярных произведений, агрегирования данных и других операций, где необходимо управлять взаимодействием между элементами массивов.
Пример использования вложенных циклов и einsum для перемножения матриц:
👍17
Подборка ресурсов про MLOps
🔸 Статья про MLOps в финтех и общие тенденции
🔸 Репозиторий с передовыми инструментами
🔸 Открытый курс по MLOps
🔸 Вебинар по облачному MLOps от VK
🔸 Подборка докладов от ODS
🔸 Статья на Medium про создание конвеера
🔸 Подборка библиотек для MLOps
🔸 Общая статья про инструменты MLOps
🔸 Статья про MLOps в финтех и общие тенденции
🔸 Репозиторий с передовыми инструментами
🔸 Открытый курс по MLOps
🔸 Вебинар по облачному MLOps от VK
🔸 Подборка докладов от ODS
🔸 Статья на Medium про создание конвеера
🔸 Подборка библиотек для MLOps
🔸 Общая статья про инструменты MLOps
🔥6
Marqo - векторная поисковая система с открытым исходным кодом для приложений искусственного интеллекта
Генерация, хранение и извлечение векторов с помощью единого API.
Векторные базы данных — это невоспетые герои современного движения ИИ, хранящие неструктурированные данные, такие как изображения, видео и текст, чтобы люди и системы могли искать некатегоризированный контент. Они особенно важны для больших языковых моделей (LLM), таких как GPT-4 (который поддерживает ChatGPT), во многом благодаря способности баз данных обеспечивать индексацию и поиск в реальном времени по мере создания или обновления данных — это важно для функций персонализации, систем рекомендаций, анализа настроений и многого другого.
Подробнее по ссылке на источник
Генерация, хранение и извлечение векторов с помощью единого API.
Векторные базы данных — это невоспетые герои современного движения ИИ, хранящие неструктурированные данные, такие как изображения, видео и текст, чтобы люди и системы могли искать некатегоризированный контент. Они особенно важны для больших языковых моделей (LLM), таких как GPT-4 (который поддерживает ChatGPT), во многом благодаря способности баз данных обеспечивать индексацию и поиск в реальном времени по мере создания или обновления данных — это важно для функций персонализации, систем рекомендаций, анализа настроений и многого другого.
Подробнее по ссылке на источник
👍5
Promptitude - самый простой и быстрый способ интегрировать GPT
Шаги по использованию:
🔸 Вставить ключ API чтобы использовать Promptitude для запросов
🔸 Настроить свои входные данные и персонализировать результат
🔸 Получить ключ API Promptitude
🔸 Просмотр истории использования
Ссылка на источник
Шаги по использованию:
🔸 Вставить ключ API чтобы использовать Promptitude для запросов
🔸 Настроить свои входные данные и персонализировать результат
🔸 Получить ключ API Promptitude
🔸 Просмотр истории использования
Ссылка на источник
👍5
В связи с недавним всплеском исследований в области машинного обучения и LLM широкой публике трудно быть в курсе последних событий.
Для исследователей, ученых и, в частности, инженеров оставаться в курсе последних исследований в области машинного обучения - настоящая проблема. Более того, типичного поиска редко бывает достаточно.
Cambrian создан для более сложного глубокого поиска более 240 000 статей с машинным обучением, постоянно поглощая недавно выпущенные работы.
Быстрый поиск знаний обеспечивается с помощью CambrianGPT, внутреннего LLM для запросов по отдельным статьям.
Ссылка на источник
Для исследователей, ученых и, в частности, инженеров оставаться в курсе последних исследований в области машинного обучения - настоящая проблема. Более того, типичного поиска редко бывает достаточно.
Cambrian создан для более сложного глубокого поиска более 240 000 статей с машинным обучением, постоянно поглощая недавно выпущенные работы.
Быстрый поиск знаний обеспечивается с помощью CambrianGPT, внутреннего LLM для запросов по отдельным статьям.
Ссылка на источник
❤5👍1
LangChain для Gen AI и LLM
Подробный туториал по аугментации данных в LangChain: автор рассказывает, как предоставить LLM доступ к дополнительной информации и сократить количество галлюцинаций.
Ссылка на источник
Подробный туториал по аугментации данных в LangChain: автор рассказывает, как предоставить LLM доступ к дополнительной информации и сократить количество галлюцинаций.
Ссылка на источник
🔥1
Как развитие технологий повлияет на будущее нейронных сетей?
Есть мнение, что текущее состояние рынка нейронных сетей - пузырь, который скоро лопнет, автор стати в источнике отвечает на вопросы перспектив глубокого обучения относительно железа, архитектур, технологий и внедрения в бизнес.
Есть мнение, что текущее состояние рынка нейронных сетей - пузырь, который скоро лопнет, автор стати в источнике отвечает на вопросы перспектив глубокого обучения относительно железа, архитектур, технологий и внедрения в бизнес.
🔥2
Где взять эмеддинги на русском?
🟠 deeppavlov - open-source библиотека от лаборатории МФТИ с большим количеством предобученных моделей для NLP задач
🟠 ResVectores - семантические модели для русского языка с возможностью поиграться прямо на сайте
🟠 deeppavlov - open-source библиотека от лаборатории МФТИ с большим количеством предобученных моделей для NLP задач
🟠 ResVectores - семантические модели для русского языка с возможностью поиграться прямо на сайте
👍11🤔1
Чего ждать от языка Mojo?
Несколько дней назад новый язык программирования Mojo (Python++) стал доступен для локальной загрузки. А в статье из источника подробно разбираются перспективы этого языка.
Люди, как обычно, разделились на два лагеря и комментарии варьируются от "Вау, они изобрели Cython" до восхищения.
В любом случае язык еще слишком сырой и, не смотря на неофициальное название Python++ еще не поддерживает некоторые конструкции Python, но предварительные тесты выглядят очень сильно.
Несколько дней назад новый язык программирования Mojo (Python++) стал доступен для локальной загрузки. А в статье из источника подробно разбираются перспективы этого языка.
Люди, как обычно, разделились на два лагеря и комментарии варьируются от "Вау, они изобрели Cython" до восхищения.
В любом случае язык еще слишком сырой и, не смотря на неофициальное название Python++ еще не поддерживает некоторые конструкции Python, но предварительные тесты выглядят очень сильно.
👍17
Deep Learning в Swift
Пример обучения модели для распознавания цифр на Swift с возможностью легко добавить в свое приложение.
Подробный гайд в официальном источнике
Пример обучения модели для распознавания цифр на Swift с возможностью легко добавить в свое приложение.
Подробный гайд в официальном источнике
👍7🤯1
S4 лучше трансформеров?
Архитектура Структурированного пространства состояний для моделирования последовательностей (S4) — это новый подход к задачам моделирования длинных последовательностей для задач компьютерного зрения, анализа языка и звука, демонстрирующий способность фиксировать зависимости на протяжении десятков тысяч шагов.
В источнике подробно и с примерами кода и графиков описывается новый подход.
Архитектура Структурированного пространства состояний для моделирования последовательностей (S4) — это новый подход к задачам моделирования длинных последовательностей для задач компьютерного зрения, анализа языка и звука, демонстрирующий способность фиксировать зависимости на протяжении десятков тысяч шагов.
В источнике подробно и с примерами кода и графиков описывается новый подход.
👍6
Курс лекций ИТМО по распознаванию и синтезу речи
Курсу уже несколько лет, но при этом он очень подробно погружает в тему, после чего намного проще разобраться в новом материале
Курсу уже несколько лет, но при этом он очень подробно погружает в тему, после чего намного проще разобраться в новом материале
👍2
Гайд по обучению модели на PyTorch и MLlib
PyTorch - один из самых удобных пакетов для обучения нейронных сетей, MLlib - конвейер с открытым исходным кодом для управления пайплайнами и вывода в прод. В источнике гайд по их совместному использованию.
PyTorch - один из самых удобных пакетов для обучения нейронных сетей, MLlib - конвейер с открытым исходным кодом для управления пайплайнами и вывода в прод. В источнике гайд по их совместному использованию.
👍13🔥3
Pytorch + C++ = TorchScript
Гайд от ODS по TorchScript - инструмент, который позволяет с помощью пары строк кода и нескольких щелчков мыши сделать из пайплайна на питоне отчуждаемое решение, которое можно встроить в систему на C++
Гайд от ODS по TorchScript - инструмент, который позволяет с помощью пары строк кода и нескольких щелчков мыши сделать из пайплайна на питоне отчуждаемое решение, которое можно встроить в систему на C++
👍5❤2
Как ускорить инференс классификатора BERT с помощью ONNX?
ONNX - открытый стандарт для конвертации моделей машинного обучения из разных фреймворков в единый формат, а также для обмена моделями между фреймворками, для которого существует библиотека ONNX Runtime.
Гайд по ссылке по сути является альтернаттивой TorchScript из предыдущего поста, в будущем постараемся их сравнить.
ONNX - открытый стандарт для конвертации моделей машинного обучения из разных фреймворков в единый формат, а также для обмена моделями между фреймворками, для которого существует библиотека ONNX Runtime.
Гайд по ссылке по сути является альтернаттивой TorchScript из предыдущего поста, в будущем постараемся их сравнить.
🔥2
Когда какие базы данных лучше использовать?
Большой обзор видов баз данных. В нынешних реалиях даже research engineer должен уметь работать с базами данных, но с развитием технологий (особенно с появлением LLM) уже не очевидно, что всегда лучший вариант - хранить данные в sql.
Большой обзор видов баз данных. В нынешних реалиях даже research engineer должен уметь работать с базами данных, но с развитием технологий (особенно с появлением LLM) уже не очевидно, что всегда лучший вариант - хранить данные в sql.
👍13🔥1😁1