Создание LLM с миллионом параметров с нуля с использованием Python
Пошаговое руководство по репликации архитектуры LLaMA
https://levelup.gitconnected.com/building-a-million-parameter-llm-from-scratch-using-python-f612398f06c2
Пошаговое руководство по репликации архитектуры LLaMA
https://levelup.gitconnected.com/building-a-million-parameter-llm-from-scratch-using-python-f612398f06c2
Medium
Building a Million-Parameter LLM from Scratch Using Python
A Step-by-Step Guide to Replicating LLaMA Architecture
Разработайте своего первого ИИ-агента: глубокое Q-обучение
Погрузитесь в мир искусственного интеллекта — постройте с нуля тренажерный зал глубокого обучения с подкреплением.
https://medium.com/towards-data-science/develop-your-first-ai-agent-deep-q-learning-375876ee2472
Погрузитесь в мир искусственного интеллекта — постройте с нуля тренажерный зал глубокого обучения с подкреплением.
https://medium.com/towards-data-science/develop-your-first-ai-agent-deep-q-learning-375876ee2472
Medium
Develop Your First AI Agent: Deep Q-Learning
Dive into the world of artificial intelligence — build a deep reinforcement learning gym from scratch.
This media is not supported in your browser
VIEW IN TELEGRAM
DreaMoving — это управляемая система генерации видео на основе диффузии, предназначенная для создания высококачественных индивидуальных видеороликов с участием людей.
demo: https://modelscope.cn/studios/vigen/video_generation/summary
github: https://github.com/dreamoving/dreamoving-project
demo: https://modelscope.cn/studios/vigen/video_generation/summary
github: https://github.com/dreamoving/dreamoving-project
WhisperPlus (GitHub Repo)
Передовая обработка речи в текст. подробнее→ https://github.com/kadirnar/whisper-plus
Передовая обработка речи в текст. подробнее→ https://github.com/kadirnar/whisper-plus
GitHub
GitHub - kadirnar/whisper-plus: WhisperPlus: Faster, Smarter, and More Capable 🚀
WhisperPlus: Faster, Smarter, and More Capable 🚀. Contribute to kadirnar/whisper-plus development by creating an account on GitHub.
Make-A-Character: высококачественное преобразование текста в 3D-персонажей за считанные минуты.
С появлением агентов искусственного интеллекта растет спрос на персонализированные и выразительные 3D-персонажи . и Metaverse, но создание 3D-персонажей с использованием традиционных инструментов компьютерной графики — сложная и трудоемкая задача. Чтобы решить эти проблемы, мы предлагаем удобную для пользователя платформу Make-A-Character (Mach) для создания реалистичных 3D-аватаров из текстовых описаний. Страница документа: https://huggingface.co/papers/2312.15430
С появлением агентов искусственного интеллекта растет спрос на персонализированные и выразительные 3D-персонажи . и Metaverse, но создание 3D-персонажей с использованием традиционных инструментов компьютерной графики — сложная и трудоемкая задача. Чтобы решить эти проблемы, мы предлагаем удобную для пользователя платформу Make-A-Character (Mach) для создания реалистичных 3D-аватаров из текстовых описаний. Страница документа: https://huggingface.co/papers/2312.15430
huggingface.co
Paper page - Make-A-Character: High Quality Text-to-3D Character Generation within
Minutes
Minutes
Join the discussion on this paper page
This media is not supported in your browser
VIEW IN TELEGRAM
Может ли машинное обучение предсказать хаос? В моей новой статье проводится крупномасштабное сравнение современных методов прогнозирования на гигантском наборе данных из 135 хаотических систем.
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.5.043252
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.5.043252
Модель прогнозирования погоды на основе MachineLearning от
GoogleDeepMind
Cогласно новому исследованию Science, приводит к более качественным, быстрым и доступным 10-дневным прогнозам погоды, чем существующие подходы. https://www.science.org/doi/10.1126/science.adi2336
GoogleDeepMind
Cогласно новому исследованию Science, приводит к более качественным, быстрым и доступным 10-дневным прогнозам погоды, чем существующие подходы. https://www.science.org/doi/10.1126/science.adi2336
👍1
А вот и технология больших данных, способная конкурировать с кластерами на одной машине.
https://cassio-bolba.medium.com/here-comes-big-data-technology-that-rivals-clusters-on-a-single-machine-992f41e67a72
https://cassio-bolba.medium.com/here-comes-big-data-technology-that-rivals-clusters-on-a-single-machine-992f41e67a72
Medium
Here comes big data technology that rivals clusters on a single machine
Distributed data warehouses (such as MPP) in the era of big data are a popular technology, even to the point where data warehouses are…
TinyZero (GitHub Repo) Простое обучение AlphaZero-подобных агентов на любом окружении. подробнее→ https://github.com/s-casci/tinyzero
Модель разделения речи (GitHub Repo) Модель MossFormer2, усовершенствованная по сравнению с оригинальной моделью MossFormer, предлагает улучшенные возможности разделения монофонической речи. больше→ https://github.com/alibabasglab/MossFormer2
Модель разделения речи (GitHub Repo) Модель MossFormer2, усовершенствованная по сравнению с оригинальной моделью MossFormer, предлагает улучшенные возможности разделения монофонической речи. больше→ https://github.com/alibabasglab/MossFormer2
GitHub
GitHub - s-casci/tinyzero: Easily train AlphaZero-like agents on any environment you want!
Easily train AlphaZero-like agents on any environment you want! - s-casci/tinyzero
1,5 года знаний Spark в 8 советах
Мои выводы из взаимодействия с клиентами Databricks
https://towardsdatascience.com/1-5-years-of-spark-knowledge-in-8-tips-f003c4743083
Мои выводы из взаимодействия с клиентами Databricks
https://towardsdatascience.com/1-5-years-of-spark-knowledge-in-8-tips-f003c4743083
Medium
1.5 Years of Spark Knowledge in 8 Tips
My learnings from Databricks customer engagements
Forwarded from Добро пожаловать в мир Python
Самый быстрый способ чтения Excel на Python
Чтение 500 тыс. строк менее чем за 4 секунды
https://hakibenita.com/fast-excel-python
Чтение 500 тыс. строк менее чем за 4 секунды
https://hakibenita.com/fast-excel-python
Hakibenita
Fastest Way to Read Excel in Python
Reading 500K rows in less than 4 seconds
PFGM++: буст генеративных моделей с применением электростатики
Новая ступень в развитии диффузионных генеративных моделей ИИ, и новая возможность создавать собственные изображения в 10 раз быстрее, чем раньше. Это стало реальным благодаря удачной попытке совместить знания об электростатике и принципу функционирования привычных нам диффузионных моделей. Так, исследователям из MIT CSAIL удалось воплотить в жизнь инновационную модель PFGM ++, которая по последним данным значительно превосходит своих предшественниц.
Какова физическая природа PFGM ++, и как ее использовать на практике – давайте разбираться далее вместе. https://habr.com/ru/companies/bothub/articles/785192/
Новая ступень в развитии диффузионных генеративных моделей ИИ, и новая возможность создавать собственные изображения в 10 раз быстрее, чем раньше. Это стало реальным благодаря удачной попытке совместить знания об электростатике и принципу функционирования привычных нам диффузионных моделей. Так, исследователям из MIT CSAIL удалось воплотить в жизнь инновационную модель PFGM ++, которая по последним данным значительно превосходит своих предшественниц.
Какова физическая природа PFGM ++, и как ее использовать на практике – давайте разбираться далее вместе. https://habr.com/ru/companies/bothub/articles/785192/
Хабр
PFGM++: буст генеративных моделей с применением электростатики
Развитие генеративных моделей ИИ продвигается семимильными шагами и будурожит сознания миллионов людей во всем мире. Все больше скандалов, интриг и расследований связаны с ними, мы становимся...
👍1
Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев
Улучшение Том и Джерри из 480p в 1440p
С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране. https://habr.com/ru/articles/784648/
Улучшение Том и Джерри из 480p в 1440p
С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране. https://habr.com/ru/articles/784648/
Хабр
Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев
С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от...
Шлюз LLM (GitHub Repo) Portkey AI недавно выложила в открытый доступ свой шлюз, который позволяет осуществлять маршрутизацию между множеством различных языковых моделей. подробнее→ https://github.com/Portkey-AI/gateway
GitHub
GitHub - Portkey-AI/gateway: A blazing fast AI Gateway with integrated guardrails. Route to 200+ LLMs, 50+ AI Guardrails with 1…
A blazing fast AI Gateway with integrated guardrails. Route to 200+ LLMs, 50+ AI Guardrails with 1 fast & friendly API. - Portkey-AI/gateway
👍3
С новым годом: GPT в 500 строках на SQL
В минувшем году все только и говорили об ИИ и о том, как он может всё за вас сделать.
Мне нравится, когда кто-то или что-то работает за меня. Поэтому решил: попрошу-ка ChatGPT написать за меня новогодний пост:
«Эй, ChatGPT. А ты можешь реализовать большую языковую модель на SQL?»
«Нет, SQL не подходит для реализации больших языковых моделей. Язык SQL предназначен для выполнения запросов к данным, хранящимся в РСУБД и для управления этими запросами. Для реализации большой языковой модели требуются сложные алгоритмы, обширные датасеты, а зачастую — и фреймворки для глубокого обучения. SQL всеми этими возможностями не обладает.»
Что ж, лишний раз убеждаешься, что, если хочешь что‑то сделать хорошо – сделай это сам.
Давайте же воодушевимся этим оптимистическим планом и реализуем большую языковую модель на языке SQL.
https://habr.com/ru/articles/786276/
В минувшем году все только и говорили об ИИ и о том, как он может всё за вас сделать.
Мне нравится, когда кто-то или что-то работает за меня. Поэтому решил: попрошу-ка ChatGPT написать за меня новогодний пост:
«Эй, ChatGPT. А ты можешь реализовать большую языковую модель на SQL?»
«Нет, SQL не подходит для реализации больших языковых моделей. Язык SQL предназначен для выполнения запросов к данным, хранящимся в РСУБД и для управления этими запросами. Для реализации большой языковой модели требуются сложные алгоритмы, обширные датасеты, а зачастую — и фреймворки для глубокого обучения. SQL всеми этими возможностями не обладает.»
Что ж, лишний раз убеждаешься, что, если хочешь что‑то сделать хорошо – сделай это сам.
Давайте же воодушевимся этим оптимистическим планом и реализуем большую языковую модель на языке SQL.
https://habr.com/ru/articles/786276/
Хабр
С новым годом: GPT в 500 строках на SQL
В минувшем году все только и говорили об ИИ и о том, как он может всё за вас сделать. Мне нравится, когда кто-то или что-то работает за меня. Поэтому решил: попрошу-ка ChatGPT написать за меня...
Как работают трансформеры: разбираем математику
В этом посте я представлю подробный пример математики, используемой внутри модели трансформера, чтобы вы получили хорошее представление о работе модели. Чтобы пост был понятным, я многое упрощу. Мы будем выполнять довольно много вычислений вручную, поэтому снизим размерность модели. Например, вместо эмбеддингов из 512 значений мы используем эмбеддинги из 4 значений. Это позволит упростить понимание вычислений. Мы используем произвольные векторы и матрицы, но при желании вы можете выбрать собственные значения.
Как вы увидите, математика модели не так уж сложна. Сложность возникает из-за количества этапов и количества параметров. https://habr.com/ru/articles/785474/
В этом посте я представлю подробный пример математики, используемой внутри модели трансформера, чтобы вы получили хорошее представление о работе модели. Чтобы пост был понятным, я многое упрощу. Мы будем выполнять довольно много вычислений вручную, поэтому снизим размерность модели. Например, вместо эмбеддингов из 512 значений мы используем эмбеддинги из 4 значений. Это позволит упростить понимание вычислений. Мы используем произвольные векторы и матрицы, но при желании вы можете выбрать собственные значения.
Как вы увидите, математика модели не так уж сложна. Сложность возникает из-за количества этапов и количества параметров. https://habr.com/ru/articles/785474/
Хабр
Как работают трансформеры: разбираем математику
В этом посте я представлю подробный пример математики, используемой внутри модели трансформера, чтобы вы получили хорошее представление о работе модели. Чтобы пост был понятным, я многое упрощу. Мы...
130 терминов в области науки о данных, которые должен знать каждый специалист по данным
https://medium.com/aimonks/130-data-science-terms-every-data-scientist-should-know-7199a22fc809
https://medium.com/aimonks/130-data-science-terms-every-data-scientist-should-know-7199a22fc809
Medium
130+ Data Science Terms Every Data Scientist Should Know in 2024
Most Data Science Jargon explained in plain English
Deepdive: Text-To-Video (18 минут чтения) Генерация видео из текстовых описаний - активная область исследований, и за последние несколько недель появилось множество мощных моделей. В этом блоге команды Hugging Face описывается задача, текущие проблемы и состояние исследований. Он не является полностью исчерпывающим, но послужит отличной отправной точкой для дальнейшего чтения. подробнее→ https://huggingface.co/blog/text-to-video
huggingface.co
A Dive into Text-to-Video Models
We’re on a journey to advance and democratize artificial intelligence through open source and open science.