This media is not supported in your browser
VIEW IN TELEGRAM
Personal Copilot: Train Your Own Coding Assistant.
В постоянно развивающейся сфере программирования и разработки программного обеспечения стремление к эффективности и производительности привело к появлению замечательных инноваций.
Одной из таких инноваций является появление моделей генерации кода, таких как Codex, StarCoder и Code Llama. Эти модели продемонстрировали широкие возможности по генерации рабочих скриптов, тем самым показав огромный потенциал в качестве помощников кодера.
Однако, несмотря на то, что эти предварительно обученные модели могут демонстрировать впечатляющие результаты при выполнении целого ряда задач, за горизонтом маячит интересная возможность: возможность адаптировать модель генерации кода к вашим конкретным потребностям. Подумайте о персонализированных помощниках кодинга, которые можно было бы использовать в масштабах предприятия.
В этой статье показано пошаговое создание HugCoder 🤗, кодовый LLM, обученной из публичных репозиториев huggingface GitHub.
В статье показан процесс сбора данных, экспериментах по обучению и некоторых интересных результатах. Это позволит вам создать свой личный Copilot на основе собственной кодовой базы.
@machinelearning_ru
В постоянно развивающейся сфере программирования и разработки программного обеспечения стремление к эффективности и производительности привело к появлению замечательных инноваций.
Одной из таких инноваций является появление моделей генерации кода, таких как Codex, StarCoder и Code Llama. Эти модели продемонстрировали широкие возможности по генерации рабочих скриптов, тем самым показав огромный потенциал в качестве помощников кодера.
Однако, несмотря на то, что эти предварительно обученные модели могут демонстрировать впечатляющие результаты при выполнении целого ряда задач, за горизонтом маячит интересная возможность: возможность адаптировать модель генерации кода к вашим конкретным потребностям. Подумайте о персонализированных помощниках кодинга, которые можно было бы использовать в масштабах предприятия.
В этой статье показано пошаговое создание HugCoder 🤗, кодовый LLM, обученной из публичных репозиториев huggingface GitHub.
В статье показан процесс сбора данных, экспериментах по обучению и некоторых интересных результатах. Это позволит вам создать свой личный Copilot на основе собственной кодовой базы.
@machinelearning_ru
👍7❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь ИИ может предсказывать структуру не только белков, но и различных молекул.
Исследователи ожидают, что модернизация AlphaFold может вывести на новый уровень исследования заболеваний, разработку лекарств, синтетическую биологию и многое другое.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13🔥6👍3
Ключи, хранящиеся в Secrets, являются скрытыми и видны только вам и выбранным вами блокнотам.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤1🔥1
📌 Видео
📌 Код
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥3❤1🤬1
🚀 Курс из 12 уроков, обучающий всему, что необходимо знать для создания приложений генеративного ИИ.
Полностью бесплатный и находится на GitHub:
https://github.com/microsoft/generative-ai-for-beginners
@machinelearning_ru
Полностью бесплатный и находится на GitHub:
https://github.com/microsoft/generative-ai-for-beginners
@machinelearning_ru
👍10❤2🔥1
NVIDIA’s New AI: Wow, 8x Better Text To 3D!
https://www.youtube.com/watch?v=FEOAnDgCD5A
@machinelearning_ru
https://www.youtube.com/watch?v=FEOAnDgCD5A
@machinelearning_ru
YouTube
NVIDIA’s New AI: Wow, 8x Better Text To 3D!
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.me/papers
📝 The paper "Magic3D: High-Resolution Text-to-3D Content Creation" is available here:
https://research.nvidia.com/labs/dir/magic3d/
Will be available in Picasso: ht…
📝 The paper "Magic3D: High-Resolution Text-to-3D Content Creation" is available here:
https://research.nvidia.com/labs/dir/magic3d/
Will be available in Picasso: ht…
❤5👍2🔥2
Представляем DeepSpeed-FastGen 🚀
Обслуживание LLM и генеративных моделей ИИ с
- 2,3-кратное увеличение пропускной способности
- В 2 раза меньшая средняя задержка
Автоматическое TP, балансировка нагрузки с линейным масштабированием, а также простой в использовании API.
https://github.com/microsoft/DeepSpeed/tree/master/blogs/deepspeed-fastgen
@machinelearning_ru
Обслуживание LLM и генеративных моделей ИИ с
- 2,3-кратное увеличение пропускной способности
- В 2 раза меньшая средняя задержка
Автоматическое TP, балансировка нагрузки с линейным масштабированием, а также простой в использовании API.
https://github.com/microsoft/DeepSpeed/tree/master/blogs/deepspeed-fastgen
@machinelearning_ru
👍5🔥2❤1
🚀 Реализация MetNet-3, нейронной модели погоды SOTA из Google Deepmind, в #Pytorch
https://github.com/lucidrains/metnet3-pytorch
#machinelearning #ml #ai #neuralnetworks #datascience #deeplearning
@machinelearning_ru
https://github.com/lucidrains/metnet3-pytorch
#machinelearning #ml #ai #neuralnetworks #datascience #deeplearning
@machinelearning_ru
👍4🔥2❤1
👉 Awesome Data Labeling
Коллекция инструментов для аннотирования изображений, аннотирования видео, семантической сегментации и маркировки данных для машинного обучения.
🔗 https://github.com/HumanSignal/awesome-data-labeling
@machinelearning_ru
Коллекция инструментов для аннотирования изображений, аннотирования видео, семантической сегментации и маркировки данных для машинного обучения.
🔗 https://github.com/HumanSignal/awesome-data-labeling
@machinelearning_ru
👍7❤2
OpenAI's ChatGPT: 7 Unexpected Results!
https://www.youtube.com/watch?v=y0ls3lH3rYM
@machinelearning_ru
https://www.youtube.com/watch?v=y0ls3lH3rYM
@machinelearning_ru
YouTube
OpenAI's ChatGPT Fell For This Illusion! But Why?
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.me/papers
📝 Our light transport paper is available here:
https://users.cg.tuwien.ac.at/zsolnai/gfx/adaptive_metropolis/
The free light transport course is available here - enjoy!…
📝 Our light transport paper is available here:
https://users.cg.tuwien.ac.at/zsolnai/gfx/adaptive_metropolis/
The free light transport course is available here - enjoy!…
👍5❤2🔥1
📌 Существует три основных способа обучения LLM: естественный язык, классификация предложений и классификация лексем.
👉 Приведенная картинка дает представление о каждом из них!
#llms #largelanguagemodel #generativeai
@machinelearning_ru
👉 Приведенная картинка дает представление о каждом из них!
#llms #largelanguagemodel #generativeai
@machinelearning_ru
👍5❤1🔥1
🔥 ИИ-агент, использующий GPT-4V(ision), способный использовать, cv, мышь/клавиатуру для взаимодействия с веб-интерфейсом.
GPT-4V-ACT: https://github.com/ddupont808/GPT-4V-Act
GPT-V-on-Web: https://github.com/Jiayi-Pan/GPT-V-on-Web
vimGPT: https://github.com/ishan0102/vimGPT
@machinelearning_ru
GPT-4V-ACT: https://github.com/ddupont808/GPT-4V-Act
GPT-V-on-Web: https://github.com/Jiayi-Pan/GPT-V-on-Web
vimGPT: https://github.com/ishan0102/vimGPT
@machinelearning_ru
👍9❤1🔥1
Глубокое погружение в режим Copy-on-Write в pandas. Часть 2
Мы используем технику, применяемую внутренними средствами pandas, чтобы избежать копирования всего DataFrame, когда в этом нет необходимости, и тем самым повысить производительность.
Удаление защитных копий
Начнем с наиболее значимого улучшения. Многие методы pandas выполняли защитное копирование, чтобы избежать побочных эффектов и защититься от последующих модификаций в памяти.
В reset_index нет необходимости копировать данные, но возврат представления привел бы к побочным эффектам при модификации результата (к примеру, также обновился бы df). Поэтому в reset_index выполняется защитное копирование.
При включении Copy-on-Write всех этих защитных копий уже нет. Такое действие затрагивает многие методы (с полным списком можно ознакомиться здесь).
Кроме того, при выборе столбцового подмножества DataFrame теперь всегда будет возвращаться представление, а не копия, как раньше.
Посмотрим, как все это выглядит с точки зрения производительности, когда мы комбинируем некоторые из этих методов:
Создается DataFrame с 30 столбцами, 3 разными типами данных и 2 миллионами строк. Выполним следующую цепочку методов для этого DataFrame:
Смотреть
Часть 1.
@machinelearning_ru
Мы используем технику, применяемую внутренними средствами pandas, чтобы избежать копирования всего DataFrame, когда в этом нет необходимости, и тем самым повысить производительность.
Удаление защитных копий
Начнем с наиболее значимого улучшения. Многие методы pandas выполняли защитное копирование, чтобы избежать побочных эффектов и защититься от последующих модификаций в памяти.
df = pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
df2 = df.reset_index()
df2.iloc[0, 0] = 100В reset_index нет необходимости копировать данные, но возврат представления привел бы к побочным эффектам при модификации результата (к примеру, также обновился бы df). Поэтому в reset_index выполняется защитное копирование.
При включении Copy-on-Write всех этих защитных копий уже нет. Такое действие затрагивает многие методы (с полным списком можно ознакомиться здесь).
Кроме того, при выборе столбцового подмножества DataFrame теперь всегда будет возвращаться представление, а не копия, как раньше.
Посмотрим, как все это выглядит с точки зрения производительности, когда мы комбинируем некоторые из этих методов:
import pandas as pd
import numpy as np
N = 2_000_000
int_df = pd.DataFrame(
np.random.randint(1, 100, (N, 10)),
columns=[f"col_{i}" for i in range(10)],
)
float_df = pd.DataFrame(
np.random.random((N, 10)),
columns=[f"col_{i}" for i in range(10, 20)],
)
str_df = pd.DataFrame(
"a",
index=range(N),
columns=[f"col_{i}" for i in range(20, 30)],
)
df = pd.concat([int_df, float_df, str_df], axis=1)
Создается DataFrame с 30 столбцами, 3 разными типами данных и 2 миллионами строк. Выполним следующую цепочку методов для этого DataFrame:
Смотреть
Часть 1.
@machinelearning_ru
👍4❤1🔥1
👉 Awesome TensorFlow
Список awesome учебников по TensorFlow, моделей/проектов, библиотек, инструментов/утилит, видео, докладов, статей, сообществ, книг и многого другого.
🔗 https://github.com/jtoy/awesome-tensorflow
@machinelearning_ru
Список awesome учебников по TensorFlow, моделей/проектов, библиотек, инструментов/утилит, видео, докладов, статей, сообществ, книг и многого другого.
🔗 https://github.com/jtoy/awesome-tensorflow
@machinelearning_ru
❤8👍3🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
ChatAnything: Facetime-чат с LLM-персонами
проект: https://chatanything.github.io/
abs: https://arxiv.org/abs/2311.06772
@machinelearning_ru
проект: https://chatanything.github.io/
abs: https://arxiv.org/abs/2311.06772
@machinelearning_ru
❤6👍2🔥1
AI Art: How is This Quality Even Possible?
https://www.youtube.com/watch?v=LfjwO5RKkZg
@machinelearning_ru
https://www.youtube.com/watch?v=LfjwO5RKkZg
@machinelearning_ru
YouTube
OpenAI's DALL-E 3 Just Got Outmatched By This AI!
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.me/papers
📝 My latest paper on simulations that look almost like reality is available for free here:
https://rdcu.be/cWPfD
Or this is the orig. Nature Physics link with clickable…
📝 My latest paper on simulations that look almost like reality is available for free here:
https://rdcu.be/cWPfD
Or this is the orig. Nature Physics link with clickable…
👍4❤1🔥1
Deepmind объявили о создании самой совершенной модели генерации музыки и двух новых экспериментах с искусственным интеллектом, призванных открыть новую площадку для творчества
https://deepmind.google/discover/blog/transforming-the-future-of-music-creation/
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Google DeepMind
Transforming the future of music creation
Announcing our most advanced music generation model and two new AI experiments, designed to open a new playground for creativity
👍6❤2🔥1