Big data world

Если вы хотите изучать науку о данных и машинное обучение, этот веб-сайт — настоящая золотая жила. Это объясняет большинство технических и теоретических концепций Data Science & ML с интерактивными визуальными эффектами.

https://brilliant.org/

924 views06:27

Big data world

Выпуск исходного кода Draggan: интерактивные манипуляции с изображениями на основе точек.
https://github.com/XingangPan/DragGAN

GitHub

GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023)

Official Code for DragGAN (SIGGRAPH 2023). Contribute to XingangPan/DragGAN development by creating an account on GitHub.

696 views06:31

Big data world

Краткое введение в нейронные сети

https://www.dkriesel.com/en/science/neural_networks

800 views06:41

Big data world

Сравнение алгоритмов машинного обучения в Python и R
Этот список наиболее часто используемых алгоритмов машинного обучения в Python и R предназначен для того, чтобы помочь начинающим инженерам и энтузиастам ознакомиться с наиболее часто используемыми алгоритмами.

https://www.kdnuggets.com/2023/06/machine-learning-algorithms-python-r.html

KDnuggets

A Comparison of Machine Learning Algorithms in Python and R - KDnuggets

This list of the most commonly used machine learning algorithms in Python and R is intended to help novice engineers and enthusiasts get familiar with the most commonly used algorithms.

840 views07:46

Big data world

Forwarded from Добро пожаловать в мир Python

1_MLqq6tvQNmQlGpQyIbxwyw.gif

11.3 MB

Более 250 советов по Python и науке о данных, включая Pandas, NumPy, основы машинного обучения, Sklearn, Jupyter и другие.

https://medium.datadriveninvestor.com/250-python-and-data-science-tips-covering-pandas-numpy-ml-basics-sklearn-jupyter-and-more-e33074b92d58

👉 Весь PDF-архив вы можете найти здесь .

610 views06:30

Big data world

Как работает языковая модель RWKV.

https://johanwind.github.io/2023/03/23/rwkv_details.html

The Good Minima

How the RWKV language model works

I go through and explain a minimal implementation of RWKV in detail.

625 views09:34

Big data world

Многоязычное связывание сущностей от конца до конца

Представляем BELA, беспрецедентное решение с открытым исходным кодом, которое должно произвести революцию в области обработки естественного языка (NLP)! BELA решает сложную задачу связывания сущностей - задачу, распространенную во многих практических приложениях, - предлагая самую первую полностью сквозную многоязычную модель. Поразительно, но она может эффективно идентифицировать и связывать сущности в текстах на 97 языках, что является невиданной до сих пор способностью. Это знаменует собой значительный скачок в направлении оптимизации сложных стеков моделей, которые были распространенной проблемой в данной области.

Ссылка на статью: https://arxiv.org/abs/2306.08896
Ссылка на код: https://github.com/facebookresearch/BELA

Подробный неофициальный обзор статьи: https://andlukyane.com/blog/paper-review-bela

GitHub

GitHub - facebookresearch/BELA: Bi-encoder entity linking architecture

Bi-encoder entity linking architecture. Contribute to facebookresearch/BELA development by creating an account on GitHub.

838 views11:40

Big data world

Pandas 2.0: меняет правила игры для специалистов по данным?

5 лучших функций для эффективной обработки данных https://towardsdatascience.com/pandas-2-0-a-game-changer-for-data-scientists-3cd281fcc4b4

Medium

Pandas 2.0: A Game-Changer for Data Scientists?

The Top 5 Features for Efficient Data Manipulation

835 views14:40

Big data world

Meta только что выпустила промежуточную графическую библиотеку

Промежуточная графическая библиотека (IGL) — это кроссплатформенная библиотека, которая управляет графическим процессором.

https://github.com/facebook/igl/

GitHub

GitHub - facebook/igl: Intermediate Graphics Library (IGL) is a cross-platform library that commands the GPU. It provides a single…

Intermediate Graphics Library (IGL) is a cross-platform library that commands the GPU. It provides a single low-level cross-platform interface on top of various graphics APIs (e.g. OpenGL, Metal an...

👍1

804 views12:03

Big data world

Новое издание одного из самых популярных учебников по машинному обучению выйдет летом 2023 года но доступно бесплатно в виде книги в формате PDF. https://hastie.su.domains/ISLP/ISLP_website.pdf

👍1

695 views13:38

Big data world

Откажитесь от жесткого кодирования в проекте по науке о данных — вместо этого используйте файлы конфигурации

Как эффективно взаимодействовать с файлами конфигурации в Python.
https://www.kdnuggets.com/2023/06/stop-hard-coding-data-science-project-config-files-instead.html

KDnuggets

Stop Hard Coding in a Data Science Project – Use Config Files Instead

How to efficiently interact with config files in Python.

1.3K views09:33

Big data world

Секреты RLHF в LLM Интересный отчет, в котором более подробно рассматривается RLHF и изучается внутренняя работа PPO. Полезно прочитать, если вы заинтересованы в LLM RLHF. Репозиторий кода тоже включен!
статья : https://arxiv.org/abs/2307.04964
код : https://github.com/OpenLMLab/MOSS-RLHF

714 views14:32

Big data world

Мы запускаем Keras Core, новую библиотеку, которая объединяет Keras API с JAX и PyTorch в дополнение к TensorFlow. Это позволяет вам писать компоненты глубокого обучения для разных платформ и извлекать выгоду из лучшего, что может предложить каждая платформа. Подробнее: https://keras.io/keras_core/announcement/

717 views06:41

Big data world

Вышло второе издание R for Data Science

https://r4ds.hadley.nz/

853 views07:14

Big data world

Удивительные графические примечания к книге Гилберта Стрэнга «Линейная алгебра для всех». Я не могу себе представить усилия, затраченные на их создание. Визуальные пояснения могут помочь нам понять концепции намного проще, особенно в таких областях, как машинное обучение и математика. https://github.com/kenjihiranabe/The-Art-of-Linear-Algebra

👍7

771 views09:04

Big data world

Kandinsky 2.2 — новый шаг в направлении фотореализма.

2023 год можно смело называть годом бурного развития генеративного искусственного интеллекта. Это касается не только привычной нам модальности изображений (Kandinsky 2.1, Stable Diffusion XL, IF, Шедеврум и др.), но и текстовой (ChatGPT, LLaMA, Falcon и др.), и даже модальности видео (GEN-2, CogVideo и др.). При этом ни в одном из направлений выделить объективного лидера почти невозможно — все команды стараются равномерно двигаться вперёд и повышать качество синтеза. Текстовые чат‑боты научились взаимодействовать с внешними системами посредством плагинов, синтез изображений вышел на уровень фотореалистичных генераций, длина генерируемых видео постепенно увеличивается с сохранением сюжетной связности между кадрами. И такой прогресс обусловлен уже не только наращиванием вычислительных мощностей, но и большим числом неординарных архитектурных решений, которые позволяют добиваться лучшего качества.

С момента выхода Kandinsky 2.1 (4 апреля 2023 года) прошло чуть больше трёх месяцев, и вот сегодня мы анонсируем новую версию модели в линейке 2.X. И если архитектурно модель не претерпела кардинальных изменений, то в части расширения функционала получила существенное развитие. В первую очередь, мы сделали упор на повышение качества генераций и их разрешении, а также новых возможностях синтеза изображений.

Читать далее https://habr.com/ru/companies/sberbank/articles/747446/

Хабр

Kandinsky 2.2 — новый шаг в направлении фотореализма

«Кот-астронавт ныряет в море, полное милых рыб, элегантный, высокая детализация, плавный, резкий фокус, красивый, полное тело, кинематографический, 8k» by Kandinsky 2.2 2023 год можно смело...

730 views07:11

Big data world

LangChain + Streamlit🔥+ Llama 🦙: перенос диалогового ИИ на ваш локальный компьютер 🤯
Интеграция LLM с открытым исходным кодом и LangChain для бесплатных генеративных ответов на вопросы (ключ API не требуется)

https://ai.plainenglish.io/%EF%B8%8F-langchain-streamlit-llama-bringing-conversational-ai-to-your-local-machine-a1736252b172

Medium

🦜️ LangChain + Streamlit🔥+ Llama 🦙: Bringing Conversational AI to Your Local Machine 🤯

Integrating Open Source LLMs and LangChain for Free Generative Question Answering (No API Key required)

701 views14:36

Big data world

Библиотека графиков с открытым исходным кодом для статистических данных

Lets-Plot — это библиотека для построения статистических данных на Python. https://lets-plot.org/

607 views10:16

Big data world

Это отличное руководство по настройке среды разработки Python с помощью VScode и Docker. Он начинается с раздела, в котором объясняются преимущества каждого инструмента и то, как они хорошо работают вместе. Оттуда это простое пошаговое руководство по настройке всего.

https://github.com/RamiKrispin/vscode-python?utm_campaign

GitHub

GitHub - RamiKrispin/vscode-python: A Tutorial for Setting Python Development Environment with VScode and Docker

A Tutorial for Setting Python Development Environment with VScode and Docker - RamiKrispin/vscode-python

677 views10:26

Big data world

Llama 2: с открытым исходным кодом, бесплатно для исследований и коммерческого использования.

Мы раскрываем мощь этих больших языковых моделей. Наша последняя версия Llama — Llama 2 — теперь доступна для отдельных лиц, создателей, исследователей и компаний, чтобы они могли экспериментировать, внедрять инновации и масштабировать свои идеи ответственно. https://ai.meta.com/resources/models-and-libraries/llama/

Meta Llama

Meta Llama 2

Llama 2 was pretrained on publicly available online data sources. The fine-tuned model, Llama Chat, leverages publicly available instruction datasets and over 1 million human annotations.

606 views11:31

Big data world

🚀Стартапы

Microsoft и Meta расширяют партнерство в области ИИ с помощью Llama 2 в Azure и Windows (4 минуты чтения)
Meta и Microsoft объявили о поддержке Llama 2, семейства больших языковых моделей, в Azure и Windows, что знаменует его первый коммерческий релиз. Партнерство позволяет разработчикам создавать, настраивать и развертывать модели на базе Llama 2 в Azure, а также оптимизировать их для локального использования в Windows. https://blogs.microsoft.com/blog/2023/07/18/microsoft-and-meta-expand-their-ai-partnership-with-llama-2-on-azure-and-windows/

По сообщениям, Google предлагает новостным редакциям новый инструмент искусственного интеллекта (2 минуты чтения)
Google тестирует Genesis - инструмент искусственного интеллекта, предназначенный для помощи журналистам в создании новостных статей. Несмотря на эти нововведения, сохраняется опасение дезинформации и предвзятости в случае отсутствия точного надзора за такими инструментами. https://www.cnet.com/tech/computing/google-reportedly-pitching-new-ai-tool-to-newsrooms/

🧠Исследования & Инновации

Последние исследования компании DeepMind (2 минуты чтения)
Исследователи Google DeepMind представят на ICML в этом году более 80 новых докладов, включая демонстрацию AlphaFold, достижения в области науки о синтезе и новые модели, такие как PaLM-E для робототехники и Phenaki для генерации видео из текста. https://www.deepmind.com/blog/google-deepmind-research-at-icml-2023

Умножение матриц только с помощью сложения (21 минута чтения)
Умножение матриц занимает большую часть времени, затрачиваемого во многих алгоритмах машинного обучения. Таким образом, все больший интерес вызывают чипы-ускорители, которые выполняют умножение матриц быстрее, чем обычные процессоры или даже графические процессоры. В этой статье мы демонстрируем метод выполнения матричного умножения без схемы скалярного умножителя. https://arxiv.org/abs/2307.01415

👨‍💻Инженерия & Ресурсы

Библиотека AX learn от Apple (GitHub Repo)
Еще одна библиотека глубокого обучения, на этот раз от Apple, построенная поверх Jax. Примечательно, что он поддерживает параллелизм на основе компилятора для крупномасштабного обучения, чего нет в ряде других популярных фреймворков. https://github.com/apple/axlearn

Ollama (GitHub Repo)
Запуск и упаковка больших языковых моделей на macOS. https://github.com/jmorganca/ollama

RAGstack (GitHub Repo)
Развертывание частной альтернативы ChatGPT, размещенной в вашем VPC. Подключите его к базе знаний организации и используйте в качестве корпоративного оракула. Поддерживает LLM с открытым исходным кодом, такие как Llama 2, Falcon и GPT4All. https://github.com/psychic-api/rag-stack

🎁 Разное

Улучшение финансовых запросов с помощью openBB и LlamaIndex (4 минуты чтения)
Вместо того чтобы использовать векторное хранилище для прямого индексирования данных, можно использовать метаданные и существующий язык запросов для значительного повышения качества извлекаемых данных. https://openbb.co/blog/breaking-barriers-with-openbb-and-llamaIndex

Rust или Mojo для будущего искусственного интеллекта (8 минут чтения)
В этом блоге рассказывается о переделке тысячи строк C++ в функции opencv в несколько строк Mojo. https://mojodojo.dev/blog/2023-07-17-rust-or-mojo-ai.html

Строительные блоки генеративного ИИ (34 минуты чтения)
Хорошая, высокоуровневая дискуссия о ключевых компонентах, возникающих тенденциях и игроках индустрии, работающих в области генеративного ИИ. Здесь много информации о базовых моделях, вычислениях, фреймворках, оркестровке, тонкой настройке, синтетических данных и многом другом! https://shriftman.substack.com/p/the-building-blocks-of-generative

The Official Microsoft Blog

Microsoft and Meta expand their AI partnership with Llama 2 on Azure and Windows

In recent months, the remarkable strides made in AI innovation have ignited a wave of transformative possibilities, captivating our collective imagination with the promise of reshaping industries and the way we work. Today, at Microsoft Inspire, Meta and…

526 views12:16

About

Blog

Apps

Platform