Big data world

Стоимость языковых моделей для одних языков в 10 раз выше, чем для других

Этот процесс токенизации неодинаков для разных языков, что приводит к несоответствию количества токенов, созданных для эквивалентных выражений на разных языках. Например, для предложения на бирманском или амхарском языке может потребоваться в 10 раз больше токенов, чем для аналогичного сообщения на английском языке.

https://blog.yenniejun.com/p/all-languages-are-not-created-tokenized

660 views09:02

Big data world

4 простых шага для обучения вашей модели ИИ и создания личного генератора аватаров 😎✨

https://madza.hashnode.dev/4-easy-steps-to-train-your-ai-model-and-create-personal-avatar-generator

Madza's blog

4 Easy steps to train your AI model and create personal Avatar generator 😎✨

1. Make the AI model
Open tryleap.ai, create a new account and log in.
Select "Image" -> "Fine Tune" and pick "Create Model".

Assign your model a Name, and a Keyword for prompts and click "Create".

2. Provide samples
Select "Upload samples", select...

654 views04:59

Big data world

rapidsave.com_umyz0u9fsl0b1.gif

14.7 MB

Тайпи превращает данные и алгоритмы искусственного интеллекта в полноценные веб-приложения в кратчайшие сроки.

https://github.com/Avaiga/taipy

632 views07:28

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

Синтез визуального контента, отвечающего потребностям пользователей, часто требует гибкого и точного управления позой, формой, выражением и расположением сгенерированных объектов. Существующие подходы обеспечивают управляемость генеративно-состязательными сетями (GAN) с помощью аннотированных вручную обучающих данных или предшествующей трехмерной модели, которым часто не хватает гибкости, точности и универсальности. В этой работе мы изучаем мощный, но гораздо менее изученный способ управления GAN, то есть «перетаскивание» любых точек изображения для точного достижения целевых точек в интерактивном режиме

https://huggingface.co/papers/2305.10973

👍3❤‍🔥1

689 views10:39

Big data world

Как развернуть сложные модели как Transformers и подружить их с инфраструктурой? Как сделать предобработку текста для классификации отзывов?

Благодаря глубоким знаниям предметной области Natural Language Processing вы сможете ответить на эти вопросы.

На курсе по обработке естественного языка (NLP) вы научитесь грамотно извлекать информацию из текста, решать задачи информационного поиска, распознания речи и генерации текста. Погружаться в область вы будете под руководством экспертов из Digital habits, EORA, Ozon Tech и Delivery Hero.

Всю теорию вы будете отпрабатывать на практических заданиях. Дополнительно вы получите доступ к мастер-классам с примерами реальных проектов по NLP, которые потом сможете реализовать у себя в компании.

На курсе Easy NLP вы получите необходимые знания для работы специалистом в данной области, а также разберете все нестандартные ситуации и сложные моменты.

Старт потока 19 июня, присоединяйтесь по ссылке
Промокод (всего 10 штук) на скидку 5% EASYNLPBIGDATA

646 views12:13

Big data world

Создайте собственную систему распознавания лиц с помощью Python за считанные минуты

Эта концепция известна как однократное обучение. Она отличается от традиционных моделей распознавания изображений тем, что вам требуется только одно изображение человека, которого вы хотите распознать, и вам не нужно «обучать модель» распознаванию этого человека.

Если у вас есть IPhone — вы можете вспомнить момент, когда вы впервые распаковали его и настроили свой faceid — он сделал только одну (или, возможно, несколько) фотографию вашего лица, и все. Эти изображения не использовались для обучения модели машинного обучения распознаванию вашего конкретного лица. https://danilzherebtsov.medium.com/build-your-own-face-recognition-system-with-python-in-minutes-6325eb03d0b9

680 views06:23

Big data world

Как я повторно реализовал PyTorch для WebGPU

Я работал над оптимизированной для WebGPU библиотекой вывода и автоградации под названием webgpu-torch с API, соответствующим PyTorch. Цель состоит в том, чтобы запускать нейронные сети в браузере со скоростью, сравнимой с рабочей станцией Linux. Было реализовано много ядер, и его конструкция легко расширяется. Теперь он доступен в NPM и работает как в браузере, так и в Node.js! https://praeclarum.org/2023/05/19/webgpu-torch.html

praeclarum

How I Re-implemented PyTorch for WebGPU

TL;DR I’ve been working on a WebGPU optimized inference and autograd library called webgpu-torch with an API that matches PyTorch. The goal is to run neural networks in the browser at speeds comparable to a Linux workstation. Many kernels have been implemented…

750 views07:24

Big data world

Курс практического обучения с подкреплением🚀

https://github.com/Paulescu/hands-on-rl

GitHub

GitHub - Paulescu/hands-on-rl: Free course that takes you from zero to Reinforcement Learning PRO 🦸🏻‍🦸🏽

Free course that takes you from zero to Reinforcement Learning PRO 🦸🏻‍🦸🏽 - Paulescu/hands-on-rl

811 views08:05

Big data world

ONE-PEACE: универсальная модель для задач зрения, аудио и языка (GitHub Repo)

ONE-PEACE - это новая модель, которая превосходно понимает изображения, звуки и слова, без необходимости начинать с предварительно обученной модели, и показывает исключительные результаты в задачах, связанных со зрением, звуком и языком. Он также обладает уникальной функцией, которая позволяет ему находить связи между различными типами данных, которые он раньше не видел вместе, а его гибкая структура означает, что в будущем он может использоваться с большим количеством типов данных. https://github.com/OFA-Sys/ONE-PEACE

SuperAgent (GitHub Repo)

SuperAgent - это мощный инструмент, который упрощает конфигурирование и развертывание агентов LLM (Large Language Model) на производстве. https://github.com/homanp/superagent

GitHub

GitHub - OFA-Sys/ONE-PEACE: A general representation model across vision, audio, language modalities. Paper: ONE-PEACE: Exploring…

A general representation model across vision, audio, language modalities. Paper: ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities - OFA-Sys/ONE-PEACE

780 views11:50

Big data world

Узнайте, как точно настроить большие языковые модели (LLM) в пользовательском наборе данных. Мы будем использовать Lit-Parrot , основанную на nanoGPT реализацию модели GPT-NeoX,
которая поддерживает модели StableLM , Pythia и RedPajama-INCITE .

Вы можете точно настроить эти модели, чтобы адаптировать их к вашей конкретной задаче, например, обучить чат-бота отвечать на финансовые вопросы.

https://lightning.ai/pages/blog/how-to-finetune-gpt-like-large-language-models-on-a-custom-dataset/

Lightning AI

How To Finetune GPT Like Large Language Models on a Custom Dataset - Lightning AI

The AI community’s effort has led to the development of many high-quality open-source LLMs, including but not limited to LLaMA 2, Falcon, StableLM, and Pythia. You can finetune these models on a custom instruction dataset to adapt to your specific task, such…

661 views12:10

Big data world

Scikit-LLM: НЛП с ChatGPT в Scikit-Learn

Легко интегрируйте мощные языковые модели, такие как ChatGPT, в scikit-learn для расширенных задач анализа текста. https://shly.link/mdmEQvu

708 views07:37

Big data world

Пост для тех, кто думает, что в ИТ сложно вырасти в карьере ⬇️

Университет Иннополис предлагает поступить в онлайн-магистратуру на специальности:

👨‍🎓«Управление цифровым продуктом»

👨‍🎓«Управление на основе данных»

Что мы предлагаем:

▫️Полностью дистанционное обучение, возможность подключиться к лекции и семинару из любой точки мира

▫️Студенчество в одном из передовых ИТ-университетов России, имеющем государственную аккредитацию

▫️Преподавателей мирового уровня с высоким h-индексом

▫️Годовую стажировку в компании, специализирующейся на технологиях

▫️Возможность создать свой стартап или возглавить команду в крупном проекте

▫️ Рассрочку на оплату

☝🏻 Вы не просто получите знания, но и научитесь применять их под присмотром крутых наставников и высококлассных ИТ-специалистов!

Переходите по ссылке, чтобы узнать о программах обучения и своей будущей зарплате подробнее, подписывайтесь на наш канал.

641 views11:44

Big data world

ControlVideo: Генерация текста в видео с улучшенной последовательностью и качеством (GitHub Repo)

ControlVideo - это новая система, которая решает проблемы, связанные с созданием видео из текста, путем внедрения подхода, не требующего обучения. Используя структурную согласованность, улучшая связность внешнего вида, смягчая эффекты мерцания и применяя иерархическую выборку, ControlVideo превосходит существующие методы в генерации высококачественного видео, как короткого, так и длинного. Важно отметить, что ControlVideo достигает таких результатов эффективно, генерируя видео в течение нескольких минут с помощью одного графического процессора NVIDIA 2080Ti. https://github.com/YBYBZhang/ControlVideo

ChainForge (GitHub Repo)

Среда визуального программирования с открытым исходным кодом для тестирования подсказок для LLM. https://github.com/ianarawjo/ChainForge

LoopGPT (GitHub Repo)

LoopGPT - это повторная реализация популярного проекта Auto-GPT в виде соответствующего пакета python, написанного с учетом модульности и расширяемости. https://github.com/farizrahman4u/loopgpt

GitHub

GitHub - YBYBZhang/ControlVideo: [ICLR 2024] Official pytorch implementation of "ControlVideo: Training-free Controllable Text…

[ICLR 2024] Official pytorch implementation of "ControlVideo: Training-free Controllable Text-to-Video Generation" - YBYBZhang/ControlVideo

681 views13:11

Big data world

Распознавание эмоций ИИ с помощью компьютерного зрения

Компьютерное зрение — одна из наиболее широко используемых и развивающихся областей ИИ. Это дает компьютеру возможность наблюдать и учиться на визуальных данных так же, как люди. В этом процессе компьютер извлекает значимую информацию из цифровых изображений, видео и т. д. и применяет это обучение для решения проблем. https://heartbeat.comet.ml/ai-emotion-recognition-using-computer-vision-61fe49fc7c33

553 views12:14

Big data world

Миссия выполнима: как Smart Engines обучила нейросеть распознавать все страницы паспорта РФ и находить подделки

Восемь лет упорного труда, немного удачи и ... девять из тринадцати крупнейших банков России наши клиенты. В этой статье мы расскажем, как мы решили задачу распознавания (даже в темноте) и проверки подлинности паспорта и почему корпорации теперь отказываются от ручного ввода данных (спойлер: чтобы не утекли). https://habr.com/ru/companies/smartengines/articles/731230/

627 views12:22

Big data world

Forwarded from Базы данных

В этой статье мы демонстрируем мощный новый механизм запросов ( SQLAutoVectorQueryEngine) в LlamaIndex, который может использовать как базу данных SQL, так и векторное хранилище для выполнения сложных запросов на естественном языке по сочетанию структурированных и неструктурированных данных. Этот механизм запросов может использовать выразительность SQL для структурированных данных и объединять их с неструктурированным контекстом из векторной базы данных. Мы продемонстрируем этот механизм запросов на нескольких примерах и покажем, что он может обрабатывать запросы, использующие как структурированные, так и неструктурированные данные, или и то, и другое.
https://shly.link/mdmudhD

Medium

Combining Text-to-SQL with Semantic Search for Retrieval Augmented Generation

Summary

574 views12:50

Big data world

Создайте ChatGPT с вашими личными данными, используя LlamaIndex и MongoDB

Модели больших языков (LLM), такие как ChatGPT, произвели революцию в том, как пользователи могут получать ответы на свои вопросы. Однако «знания» LLM ограничены тем, чему они обучались, что для ChatGPT означает общедоступную информацию в Интернете до сентября 2021 года. Как LLM могут отвечать на вопросы, используя частные источники знаний, такие как данные вашей компании, и раскрывать ее истинную преобразующую силу. ? https://medium.com/llamaindex-blog/build-a-chatgpt-with-your-private-data-using-llamaindex-and-mongodb-b09850eb154c

Повышение производительности машинного обучения с помощью Rust

Rust + LibTorch = увеличение скорости обучения в 5,5 раз на Python + PyTorch https://shly.link/XVmNc

Medium

Build a ChatGPT with your Private Data using LlamaIndex and MongoDB

Co-authors: Prakul Agarwal and Jerry Liu

702 views12:07

Big data world

Лучшее описание обратного распространения, которое я когда-либо видел ))

609 views13:52

Big data world

Chain of Hidsight согласовывает языковые модели с обратной связью

Языковые модели ИИ становятся важной частью нашего цифрового мира. Однако проблема заключается в том, чтобы привести эти модели в соответствие с человеческими предпочтениями, чтобы они были действительно полезными и ценными. Современные методы, хотя и успешны во многих отношениях, имеют ограничения: они либо неэффективны в использовании данных, либо сильно зависят от сложных функций вознаграждения и обучения с подкреплением.

А вот и «Цепочка ретроспективного взгляда», захватывающая новая техника, вдохновленная механизмами человеческого обучения. Он может учиться на любой форме обратной связи, даже преобразовывая ее в язык для точной настройки модели. Этот подход обусловливает модель последовательностью поколений моделей в сочетании с обратной связью, помогая ей научиться исправлять отрицательные атрибуты или ошибки. Он значительно превосходит предыдущие методы, особенно демонстрируя большие успехи в задачах подведения итогов и диалога.
Ссылка на статью: https://arxiv.org/abs/2302.02676

Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-coh

Andlukyane

Paper Review: Chain of Hindsight Aligns Language Models with Feedback – Andrey Lukyanenko

My review of the paper Chain of Hindsight Aligns Language Models with Feedback

640 views14:19

Big data world

Первый дееспособный, коммерчески жизнеспособный LLM общего назначения с открытым исходным кодом, который превосходит все LLM Big Tech, появился в ОАЭ.

Доктор Эбтесам Алмазроуи, директор кросс-центрового подразделения искусственного интеллекта в TII, сказал: «Отказ от лицензионных платежей за Falcon 40B способствует инклюзивным технологическим достижениям для сплоченного общества. Мы стремимся использовать технологии для объединения человечества и обеспечения будущего нашего мира».

Для получения дополнительной информации о текущей модели искусственного интеллекта Falcon 40B с открытым исходным кодом и о регистрации посетите: FalconLLM.TII.ae

Чтобы узнать рейтинг Falcon 40B, посетите: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

huggingface.co

Open LLM Leaderboard - a Hugging Face Space by open-llm-leaderboard

Compare the performance of open-source Large Language Models using multiple benchmarks like IFEval, BBH, MATH, GPQA, MUSR, and MMLU-PRO. Filter results in real-time and vote on your favorite models.

639 views06:21

About

Blog

Apps

Platform