Big data world

Ускоренный курс линейной алгебры — математика для машинного обучения и генеративного искусственного интеллекта

https://www.freecodecamp.org/news/linear-algebra-crash-course-mathematics-for-machine-learning-and-generative-ai

freeCodeCamp.org

Linear Algebra Crash Course - Mathematics for Machine Learning and Generative AI

Linear algebra is a useful skill for professionals in data science, machine learning, and AI. We just posted a course on the freeCodeCamp.org YouTube channel that will teach you linear algebra. This crash course spans just over 6 hours and is a great...

486 views07:53

Big data world

Создание помощника по искусственному интеллекту для частных медицинских учреждений с использованием гибридного облака Qdrant (JWT-RBAC), DSPy и Groq — Llama3

https://ai.gopubby.com/building-private-healthcare-ai-assistant-for-clinics-using-qdrant-hybrid-cloud-jwt-rbac-dspy-and-089a772e08ae

Medium

Building Private Healthcare AI Assistant for Clinics Using Qdrant Hybrid Cloud (JWT-RBAC), DSPy and…

Introduction: Security in AI Healthcare

593 views07:53

Big data world

В этом руководстве по Python мы рассмотрим основы настройки элемента управления DataTable с использованием Flet.

https://www.youtube.com/watch?v=Xl7BXURZ_HI

YouTube

Python Tutorial DataTable Using Flet

In this Python tutorial, we'll go over the basics in setting up a DataTable control using Flet. We'll divide the application into three main parts, each serving a specific function. Other extra features
include search and filtering functionality.

**note:…

583 views11:08

Big data world

Сети Колмогорова-Арнольда (KAN) собираются навсегда изменить мир искусственного интеллекта
Забудьте все, что вы знали о нейронных сетях, KAN здесь, чтобы переписать правила

https://medium.com/international-school-of-ai-data-science/kolmogorov-arnold-networks-kan-are-about-to-change-the-ai-world-forever-687f6d0b4d93

651 views12:14

Big data world

Лучшие SQL-запросы для специалистов по данным
SQL кажется аутсайдером в области науки о данных по сравнению с Python и R. Однако это далеко не так. Я покажу вам здесь, как вы можете использовать его в качестве специалиста по данным. https://www.kdnuggets.com/top-sql-queries-for-data-scientists

KDnuggets

Top SQL Queries for Data Scientists

SQL seems like a data science underdog compared to Python and R. However, it’s far from it. I’ll show you here how you can use it as a data scientist.

🤡2👍1

582 views16:57

Big data world

Состояние инженерии данных в 2024 году

https://lakefs.io/blog/the-state-of-data-engineering-2024

Git for Data - lakeFS

The State of Data Engineering 2024

In the annual State of Data Engineering 2024, we explore three defining trends in this space. Find out the results in this year's report.

522 views08:50

Big data world

AutoCoder: улучшение модели большого языка кода с помощью \textsc{AIEV-Instruct}

Мы представили новую модель, предназначенную для задачи генерации кода. Точность его испытаний на базовом наборе данных HumanEval превосходит точность GPT-4 Turbo (апрель 2024 г.) и GPT-4o. https://github.com/bin123apple/autocoder

GitHub

GitHub - bin123apple/AutoCoder: We introduced a new model designed for the Code generation task. Its test accuracy on the HumanEval…

We introduced a new model designed for the Code generation task. Its test accuracy on the HumanEval base dataset surpasses that of GPT-4 Turbo (April 2024) and GPT-4o. - GitHub - bin123apple/AutoC...

502 views17:59

Big data world

Точная настройка моделей трансформаторов меньшего размера: текстовая классификация
Использование Microsoft Phi-3 для генерации синтетических данных

https://towardsdatascience.com/fine-tune-smaller-transformer-models-text-classification-77cbbd3bf02b

Towards Data Science

Fine-Tune Smaller Transformer Models: Text Classification | Towards Data Science

Using Microsoft's Phi-3 to generate synthetic data

568 views18:01

Big data world

Опасная зона в науке о данных

Почему посредственное машинное обучение так опасно для бизнеса
https://delphinaai.substack.com/p/the-danger-zone-in-data-science

Delphina

The Danger Zone in Data Science

Why mediocre ML is so dangerous to the business

598 views18:41

Big data world

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

Gaussian: Фотореалистичная 3D-реконструкция уличных сцен — важнейший метод разработки реальных симуляторов автономного вождения. Несмотря на эффективность Neural Radiance Fields (NeRF) для сцен вождения, 3D Gaussian Splatting (3DGS) становится многообещающим направлением из-за его более высокой скорости и более четкого представления.

https://github.com/nnanhuang/s3gaussian

❤2

562 views08:16

Big data world

Путешествие LLM: от POC к производству

https://medium.com/cyberark-engineering/an-llm-journey-from-poc-to-production-6c5ec6a172fb

Medium

An LLM Journey: From POC to Production

Journey from LLM Proof-of-Concept to Production: Tips, challenges, and best practices for turning your idea into a real-world product.

625 views10:50

Big data world

Создание универсальных агентов, способных выполнять разнообразные задачи и развиваться в различных средах, является долгосрочной целью сообщества ИИ. Большие языковые модели (LLM) считаются многообещающей основой для создания таких агентов из-за их обобщенных возможностей.

AgentGym — это новая платформа, включающая множество сред и задач для широкого, унифицированного и одновременного исследования агентов в режиме реального времени.

https://github.com/woooodyy/agentgym

GitHub

GitHub - WooooDyy/AgentGym: Code and implementations for the paper "AgentGym: Evolving Large Language Model-based Agents across…

Code and implementations for the paper "AgentGym: Evolving Large Language Model-based Agents across Diverse Environments" by Zhiheng Xi et al. - WooooDyy/AgentGym

479 views13:20

Big data world

Анализ главных компонентов стал проще: пошаговое руководство
Реализуйте алгоритм PCA с нуля с помощью Python

https://towardsdatascience.com/principal-component-analysis-made-easy-a-step-by-step-tutorial-184f295e97fe

Medium

Principal Component Analysis Made Easy: A Step-by-Step Tutorial

Implement the PCA algorithm from scratch with Python

544 views14:19

Big data world

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них. https://habr.com/ru/companies/yandex/articles/817509/

Хабр

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP , который помогает существенно ускорить процесс обучения больших языковых моделей. В этой статье мы расскажем...

569 views06:12

Big data world

Бесплатная книга по байесовскому анализу данных

Одна из лучших книг по байесовскому анализу данных доступна бесплатно и охватывает такие ключевые основы, как вероятность и вывод, одно- и многопараметрические модели, а также иерархические модели. Это отличный ресурс, позволяющий перейти от основ к более сложным нюансам

https://stat.columbia.edu/~gelman/book/

609 views08:43

Big data world

Создание приложений LLM: четкое пошаговое руководство
Комплексные шаги по созданию собственных приложений LLM: от первоначальной идеи до экспериментов, оценки и производства

https://towardsdatascience.com/building-llm-apps-a-clear-step-by-step-guide-1fe1e6ef60fd

Medium

Building LLM Apps: A Clear Step-By-Step Guide

Comprehensive Steps for Building LLM-Native Apps: From Initial Idea to Experimentation, Evaluation, and Productization

581 views17:41

Big data world

Масштабируемое языковое моделирование без MatMul

Наши эксперименты показывают, что предлагаемые нами модели без MatMul достигают производительности на уровне современных трансформаторов, которым требуется гораздо больше памяти во время вывода в масштабе как минимум до 2,7B параметров.

https://github.com/ridgerchu/matmulfreellm

GitHub

GitHub - ridgerchu/matmulfreellm: Implementation for MatMul-free LM.

Implementation for MatMul-free LM. Contribute to ridgerchu/matmulfreellm development by creating an account on GitHub.

536 views05:26

Big data world

Практическое руководство по масштабированию обучения модели машинного обучения

https://blog.dailydoseofds.com/p/a-practical-guide-to-scaling-ml-model

Dailydoseofds

A Practical Guide to Scaling ML Model Training

GPUs - GPU Clusters - Distributed Training.

547 views17:01

Big data world

Warp — это среда Python для написания высокопроизводительного кода моделирования и графики.

https://github.com/NVIDIA/warp

GitHub

GitHub - NVIDIA/warp: A Python framework for accelerated simulation, data generation and spatial computing.

A Python framework for accelerated simulation, data generation and spatial computing. - NVIDIA/warp

557 views17:02

Big data world

Модель авторегрессии превосходит диффузию: лама для создания масштабируемых изображений

Мы представляем LlamaGen, новое семейство моделей генерации изображений, которые применяют оригинальную парадигму «предсказания следующего токена» больших языковых моделей к области визуальной генерации.

https://github.com/foundationvision/llamagen

485 views16:19

Big data world

🧵 Блокнот Jupyter на базе искусственного интеллекта, созданный с использованием React. 🧵
Блокнот Python на базе искусственного интеллекта, встроенный в React: создавайте и редактируйте ячейки кода, автоматически исправляйте ошибки и общайтесь с вашим кодом. Самое приятное то, что Thread работает локально и его можно бесплатно использовать с вашим собственным ключом API…

https://github.com/squaredtechnologies/thread

GitHub

GitHub - alishobeiri/thread: AI-powered Jupyter Notebook — use local AI to generate and edit code cells, automatically fix errors…

AI-powered Jupyter Notebook — use local AI to generate and edit code cells, automatically fix errors, and chat with your data - alishobeiri/thread

🔥3👍1

578 views16:35

About

Blog

Apps

Platform