Big data world

10 библиотек Python для машинного обучения, которые нужно знать в 2024 году

https://machinelearningmastery.com/10-must-know-python-libraries-for-machine-learning-in-2024

1.03K views06:51

Big data world

Узнайте, как точно настроить модель Audio Spectrogram Transformer для аудиоклассификации ваших собственных данных.

https://towardsdatascience.com/fine-tune-the-audio-spectrogram-transformer-with-transformers-73333c9ef717

Medium

Fine-Tune the Audio Spectrogram Transformer with Hugging Face Transformers

Learn how to fine-tune the Audio Spectrogram Transformer model for audio classification of your own data using the Hugging Face Ecosystem.

539 views07:48

Big data world

Show-o объединяет авторегрессионное и (дискретное) диффузионное моделирование для адаптивной обработки входов и выходов различных и смешанных модальностей. Унифицированная модель гибко поддерживает широкий спектр зрительно-языковых задач, включая визуальные вопросы-ответы, генерацию текста в изображение, инкрустацию/экстраполяцию текста и генерацию смешанных модальностей. В различных бенчмарках она демонстрирует производительность, сравнимую или превосходящую существующие индивидуальные модели с эквивалентным или большим числом параметров, настроенных на понимание или генерацию. Это значительно подчеркивает его потенциал в качестве базовой модели нового поколения. Код и модели опубликованы по адресу
https://github.com/showlab/show-o

GitHub

GitHub - showlab/Show-o: [ICLR & NeurIPS 2025] Repository for Show-o series, One Single Transformer to Unify Multimodal Understanding…

[ICLR & NeurIPS 2025] Repository for Show-o series, One Single Transformer to Unify Multimodal Understanding and Generation. - showlab/Show-o

571 views13:15

Big data world

Введение в механистическую интерпретируемость

Механистическая интерпретируемость — это новая область, которая стремится понять внутренние процессы рассуждений обученных нейронных сетей и получить представление о том, как и почему они производят те или иные результаты. Исследователи ИИ в настоящее время очень мало понимают, что происходит внутри современных моделей.[1] Современные передовые модели чрезвычайно велики — и чрезвычайно сложны. Они могут содержать миллиарды или даже триллионы параметров, распределенных по более чем 100 слоям. Хотя мы контролируем данные, которые вводятся в сеть, и можем наблюдать ее выходные данные, то, что происходит в промежуточных слоях, остается в значительной степени неизвестным. Это «черный ящик», который механистическая интерпретируемость стремится увидеть внутри… https://aisafetyfundamentals.com/blog/introduction-to-mechanistic-interpretability

BlueDot Impact

Introduction to Mechanistic Interpretability – BlueDot Impact

Mechanistic Interpretability is an emerging field that seeks to understand the internal reasoning processes of trained neural networks and gain insight into how and why they produce the outputs that they do. AI researchers currently have very little understanding…

453 views12:01

Big data world

Этот курс обучения Python предназначен для бизнес-аналитиков и трейдеров JPMorgan, а также для избранных клиентов.

https://github.com/jpmorganchase/python-training

GitHub

GitHub - jpmorganchase/python-training: Python training for business analysts and traders

Python training for business analysts and traders. Contribute to jpmorganchase/python-training development by creating an account on GitHub.

572 views12:03

Big data world

Начало работы с Jupyter Notebooks в VS Code

https://www.youtube.com/watch?v=suAkMeWJ1yE

YouTube

Getting Started with Jupyter Notebooks in VS Code

In this video, you'll learn how to create your very first Jupyter Notebook in VS Code, including setting up your environment, running and debugging code, and visualizing data. Getting started with Jupyter Notebooks has never been easier!

🔎 Chapters:
00:00…

583 views13:05

Big data world

Sapiens предлагает комплексный набор для задач, ориентированных на человека (например, 2D-поза, сегментация частей, глубина, нормаль и т. д.). Семейство моделей предварительно обучено на 300 миллионах изображений человека в дикой природе и демонстрирует превосходное обобщение в условиях без ограничений.

https://github.com/facebookresearch/sapiens

GitHub

GitHub - facebookresearch/sapiens: High-resolution models for human tasks.

High-resolution models for human tasks. Contribute to facebookresearch/sapiens development by creating an account on GitHub.

634 views14:07

Big data world

10 встроенных модулей Python, которые должен знать каждый инженер по работе с данными

Интересуетесь инжинирингом данных? Ознакомьтесь с этим обзором встроенных модулей Python, которые пригодятся вам для задач инжиниринга данных. https://www.kdnuggets.com/10-built-in-python-modules-every-data-engineer-should-know

KDnuggets

10 Built-In Python Modules Every Data Engineer Should Know - KDnuggets

Interested in data engineering? Check out this round-up of built-in Python modules that'll come in handy for data engineering tasks.

634 views12:58

Big data world

This media is not supported in your browser

VIEW IN TELEGRAM

DepthCrafter , новый подход к оценке глубины видео, используя модели диффузии видео. Он может генерировать временные последовательности длинных глубин с мелкозернистыми деталями

https://depthcrafter.github.io/

506 views13:50

Big data world

Пример использования генеративного ИИ: использование LLM для оценки разговоров с клиентами
Недавно мы поговорили с Киллианом Фарреллом, главным специалистом по данным в стартапе по страхованию AssuranceIQ, чтобы узнать, как его команда создала продукт на основе LLM для структурирования неструктурированных данных и оценки разговоров с клиентами для развития отделов продаж и поддержки клиентов... Читайте дальше, чтобы узнать, что они сделали и чему научились!... https://www.montecarlodata.com/blog-generative-ai-use-case-assurance

Monte Carlo Data

Generative AI Use Case: Using LLMs To Score Customer Conversations

Learn how the AssuranceIQ team built a generative AI use case to structure unstructured data and score customer conversations for developing their sales and customer support teams.

515 views06:37

Big data world

Проектирование подсказок ИИ: глубокое погружение
Некоторые эксперты Anthropic по проектированию подсказок — Аманда Аскелл (Alignment Finetuning), Алекс Альберт (Developer Relations), Дэвид Херши (Applied AI) и Зак Виттен (Prompt Engineering) — размышляют о том, как развивалась разработка подсказок, дают практические советы и думают о том, как подсказки могут измениться по мере развития возможностей ИИ… https://www.youtube.com/watch?v=T9aRN5JkmL8

YouTube

AI prompt engineering: A deep dive

Some of Anthropic's prompt engineering experts—Amanda Askell (Alignment Finetuning), Alex Albert (Developer Relations), David Hershey (Applied AI), and Zack Witten (Prompt Engineering)—reflect on how prompt engineering has evolved, practical tips, and thoughts…

517 views08:36

Big data world

Простой рецепт анализа ошибок модели

Анализ ошибок — мощный инструмент в машинном обучении, о котором мы мало говорим. Каждая модель прогнозирования допускает ошибки. Идея анализа ошибок заключается в анализе точечных ошибок и выявлении закономерностей ошибок. Если вы найдете закономерности ошибок, это может помочь улучшить и отладить модель и лучше понять неопределенность… https://mindfulmodeler.substack.com/p/a-simple-recipe-for-model-error-analysis

Mindful Modeler

A simple recipe for model error analysis

Error analysis is a powerful tool in machine learning that we don’t talk about enough.

575 views10:38

Big data world

supertree - Interactive Decision Tree Visualization

supertree - это пакет Python, разработанный для визуализации деревьев решений в интерактивном и удобном для пользователя виде в Jupyter Notebooks, Jupyter Lab, Google Colab и любых других блокнотах, поддерживающих HTML-рендеринг. С помощью этого инструмента вы можете не только отображать деревья решений, но и взаимодействовать с ними напрямую в среде блокнота. https://github.com/mljar/supertree

GitHub

GitHub - mljar/supertree: Visualize decision trees in Python

Visualize decision trees in Python. Contribute to mljar/supertree development by creating an account on GitHub.

653 views13:39

Big data world

Forwarded from Добро пожаловать в мир Python

Mini-Omni
Mini-Omni — это многомодельная большая языковая модель с открытым исходным кодом, которая может слышать, говорить и думать. Включает в себя сквозной речевой ввод в реальном времени и возможности потокового аудиовывода для разговора. https://github.com/gpt-omni/mini-omni

GitHub

GitHub - gpt-omni/mini-omni: open-source multimodal large language model that can hear, talk while thinking. Featuring real-time…

open-source multimodal large language model that can hear, talk while thinking. Featuring real-time end-to-end speech input and streaming audio output conversational capabilities. - GitHub - gpt-o...

603 views06:27

Big data world

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества. https://habr.com/ru/companies/ods/articles/839694/

Хабр

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем...

👍1

652 views06:17

Big data world

Как создать приложение для рекомендации фильмов без сложностей векторных баз данных

Используйте Streamlit-Weaviate Connection для интеграции векторной базы данных https://blog.streamlit.io/how-to-recommendation-app-vector-database-weaviate

710 views08:12

Big data world

Визуализируйте свою модель машинного обучения
Mycelium — это библиотека для создания графических визуализаций моделей машинного обучения или любых других направленных ациклических графов. Она также поддерживает просмотрщик графов системы визуализации и оптимизации моделей Talaria… https://apple.github.io/ml-mycelium

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества. https://habr.com/ru/companies/ods/articles/839694/

Хабр

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

731 views07:02

Big data world

Llama теперь может видеть и работать на вашем устройстве — встречайте Llama 3.2

https://huggingface.co/blog/llama32

StoryMaker: на пути к целостным последовательным персонажам при создании изображений из текста

https://github.com/redaigc/storymaker

Проектирование систем машинного обучения и обучения по программе LLM: 450 примеров, из которых можно извлечь уроки

База данных из 450 примеров из более чем 100 компаний… https://www.evidentlyai.com/ml-system-design

Langfun - OO для LLM
Langfun - это библиотека на основе PyGlove, которая призвана сделать работу с языковыми моделями (LM) увлекательной. Ее центральный принцип - обеспечить бесшовную интеграцию между естественным языком и программированием, рассматривая язык как функции. Благодаря внедрению объектно-ориентированных подсказок Langfun позволяет пользователям подсказывать LLM, используя объекты и типы, предлагая улучшенный контроль и упрощая разработку агентов... Langfun совместим с популярными LLM, такими как Gemini, GPT, Claude, и все это без необходимости дополнительной тонкой настройки... https://github.com/google/langfun

huggingface.co

Llama can now see and run on your device - welcome Llama 3.2

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

637 views12:23

Big data world

TensorHue — это библиотека Python, которая позволяет визуализировать тензоры прямо в консоли, что упрощает понимание и отладку содержимого тензоров.

https://github.com/epistoteles/TensorHue

GitHub

GitHub - epistoteles/TensorHue: TensorHue is a Python library that allows you to visualize tensors right in your console, making…

TensorHue is a Python library that allows you to visualize tensors right in your console, making understanding and debugging tensor contents easier. - epistoteles/TensorHue

559 views14:08

Big data world

Выбор между фреймворками LLM Agent

https://towardsdatascience.com/choosing-between-llm-agent-frameworks-69019493b259

Medium

Choosing Between LLM Agent Frameworks

The tradeoffs between building bespoke code-based agents and the major agent frameworks.

605 views13:21

Big data world

Трансформатор Колмогорова-Арнольда: реализация PyTorch с ядром CUDA

https://github.com/Adamdad/kat