101 фрагмент кода Python для повседневного использования для специалистов по данным
https://python.plainenglish.io/101-advanced-everyday-python-for-data-scientists-669c9b417707
https://python.plainenglish.io/101-advanced-everyday-python-for-data-scientists-669c9b417707
Medium
101 Advanced Everyday Python for Data Scientists (Part 1)
#3 of 101-Awesome Python Guides by Tushar Aggarwal
Тензорный оптимизатор Mirage (репозиторий GitHub)
Mirage — это супероптимизатор тензорной алгебры, который автоматически находит высокооптимизированные тензорные программы для DNN. Mirage автоматически идентифицирует и проверяет сложные оптимизации, многие из которых требуют совместной оптимизации на уровне ядра, блока потоков и потоков иерархии вычислений графического процессора. https://github.com/mirage-project/mirage
Mirage — это супероптимизатор тензорной алгебры, который автоматически находит высокооптимизированные тензорные программы для DNN. Mirage автоматически идентифицирует и проверяет сложные оптимизации, многие из которых требуют совместной оптимизации на уровне ядра, блока потоков и потоков иерархии вычислений графического процессора. https://github.com/mirage-project/mirage
GitHub
GitHub - mirage-project/mirage: Mirage Persistent Kernel: Compiling LLMs into a MegaKernel
Mirage Persistent Kernel: Compiling LLMs into a MegaKernel - mirage-project/mirage
4 продвинутых алгоритма RAG, которые вам необходимо знать
https://medium.com/decodingml/the-4-advanced-rag-algorithms-you-must-know-to-implement-5d0c7f1199d2
https://medium.com/decodingml/the-4-advanced-rag-algorithms-you-must-know-to-implement-5d0c7f1199d2
Medium
The 4 Advanced RAG Algorithms You Must Know to Implement
Implement from scratch 4 advanced RAG methods to optimize your retrieval and post-retrieval algorithm
This media is not supported in your browser
VIEW IN TELEGRAM
Книга по линейной алгебре с полностью интерактивными фигурами.
https://immersivemath.com/ila/index.html
https://immersivemath.com/ila/index.html
Понимание математики, лежащей в основе глубокого обучения, важно, если вы хотите овладеть методами машинного обучения.
14-часовой курс глубокого обучения на YouTube-канале freeCodeCamp.org. Этот курс специально разработан для превращения новичков в опытных разработчиков в области глубокого обучения. Если вы хотите понять основные концепции или хотите применить глубокое обучение к реальным задачам, этот курс поможет вам. https://www.freecodecamp.org/news/deep-learning-course-math-and-applications
14-часовой курс глубокого обучения на YouTube-канале freeCodeCamp.org. Этот курс специально разработан для превращения новичков в опытных разработчиков в области глубокого обучения. Если вы хотите понять основные концепции или хотите применить глубокое обучение к реальным задачам, этот курс поможет вам. https://www.freecodecamp.org/news/deep-learning-course-math-and-applications
freeCodeCamp.org
Deep Learning Course – Math and Applications
Understanding the math behind deep learning is important if you want to become proficient in machine learning techniques. We just published a 14-hour deep learning course on the freeCodeCamp.org YouTube channel. This course is specifically tailored t...
Фреймворк с открытым исходным кодом для голосового и мультимодального разговорного искусственного интеллекта
https://github.com/pipecat-ai/pipecat
https://github.com/pipecat-ai/pipecat
GitHub
GitHub - pipecat-ai/pipecat: Open Source framework for voice and multimodal conversational AI
Open Source framework for voice and multimodal conversational AI - pipecat-ai/pipecat
Интерактивные инструменты для машинного обучения, глубокого обучения и математики
https://github.com/Machine-Learning-Tokyo/Interactive_Tools
https://github.com/Machine-Learning-Tokyo/Interactive_Tools
GitHub
GitHub - Machine-Learning-Tokyo/Interactive_Tools: Interactive Tools for Machine Learning, Deep Learning and Math
Interactive Tools for Machine Learning, Deep Learning and Math - Machine-Learning-Tokyo/Interactive_Tools
⚡️ Как эффективно использовать явный и неявный фидбек в рекомендательных системах?
Расскажет опытный эксперт на открытом практическом уроке от OTUS, где вы:
— познакомитесь с двумя типами фидбека от пользователя: явным и неявным;
— обучите рекомендательные модели на разных типах фидбека;
— сравните их качество.
📌 Вебинар будет полезен дата-сайентистам и ML-спецам, которые хотят расширить область знаний и технологический стек.
Встречаемся 23 мая в 20:00 мск в преддверии старта курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджера OTUS!
💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/Aixz/?erid=LjN8KJRiu
Расскажет опытный эксперт на открытом практическом уроке от OTUS, где вы:
— познакомитесь с двумя типами фидбека от пользователя: явным и неявным;
— обучите рекомендательные модели на разных типах фидбека;
— сравните их качество.
📌 Вебинар будет полезен дата-сайентистам и ML-спецам, которые хотят расширить область знаний и технологический стек.
Встречаемся 23 мая в 20:00 мск в преддверии старта курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджера OTUS!
💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/Aixz/?erid=LjN8KJRiu
Алгоритмы машинного обучения
Минимальные и понятные примеры реализации алгоритмов машинного обучения
https://github.com/rushter/MLAlgorithms
llama3.np — это чистая реализация NumPy для модели Llama 3.
https://github.com/likejazz/llama3.np
Минимальные и понятные примеры реализации алгоритмов машинного обучения
https://github.com/rushter/MLAlgorithms
llama3.np — это чистая реализация NumPy для модели Llama 3.
https://github.com/likejazz/llama3.np
GitHub
GitHub - rushter/MLAlgorithms: Minimal and clean examples of machine learning algorithms implementations
Minimal and clean examples of machine learning algorithms implementations - rushter/MLAlgorithms
PySheets предоставляет пользовательский интерфейс электронных таблиц для Python. Используйте Pandas, создавайте диаграммы, импортируйте листы Excel, анализируйте данные и создавайте отчеты.
py2wasm преобразует программы Python в WebAssembly и запускает их в 3 раза быстрее, чем CPython.
databonsai — это библиотека Python, которая использует LLM для задач очистки данных, таких как категоризация, преобразование и извлечение.
py2wasm преобразует программы Python в WebAssembly и запускает их в 3 раза быстрее, чем CPython.
databonsai — это библиотека Python, которая использует LLM для задач очистки данных, таких как категоризация, преобразование и извлечение.
wasmer.io
Announcing py2wasm: A Python to Wasm compiler · Blog · Wasmer
Since starting Wasmer five years ago we've been obsessed with empowering more languages to target the web and beyond through Webassembly.
One of the ...
One of the ...
Использование идей теории игр для повышения надежности языковых моделей
Новая «консенсусная игра», разработанная исследователями MIT CSAIL, повышает навыки ИИ в понимании и генерации текста.
https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514
Новая «консенсусная игра», разработанная исследователями MIT CSAIL, повышает навыки ИИ в понимании и генерации текста.
https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514
MIT News
Using ideas from game theory to improve the reliability of language models
A new "consensus game," an MIT-developed game-theoretic procedure for decoding language models, enhances text generation by converging generative and discriminative querying into coherent predictions.
Доказательство обучения в области машинного обучения/ИИ
Прежде чем приступить к какой-либо математической разработке, мы должны сначала понять основу обучения и то, как оно тесно связано с концепцией ошибки.
https://towardsdatascience.com/the-proof-of-learning-in-machine-learning-ai-4faae3c85fe6
Прежде чем приступить к какой-либо математической разработке, мы должны сначала понять основу обучения и то, как оно тесно связано с концепцией ошибки.
https://towardsdatascience.com/the-proof-of-learning-in-machine-learning-ai-4faae3c85fe6
Medium
The Proof of Learning in Machine Learning/AI
Before any mathematical development, we must first understand the foundation of learning and how it is closely linked to the concept of…
10 бесплатных обязательных курсов по науке о данных, чтобы начать работу
Хотите начать свое путешествие в науку о данных? Тогда позвольте этим курсам помочь вам в этом путешествии. https://www.kdnuggets.com/10-free-must-take-data-science-courses-to-get-started
Хотите начать свое путешествие в науку о данных? Тогда позвольте этим курсам помочь вам в этом путешествии. https://www.kdnuggets.com/10-free-must-take-data-science-courses-to-get-started
KDnuggets
10 Free Must-Take Data Science Courses to Get Started
Want to start your data science journey? Then, let these courses guide you on that trip.
Создайте свою собственную среду глубокого обучения на основе C/C++, CUDA и Python с поддержкой графического процессора и автоматической дифференциацией.
https://towardsdatascience.com/recreating-pytorch-from-scratch-with-gpu-support-and-automatic-differentiation-8f565122a3cc
https://towardsdatascience.com/recreating-pytorch-from-scratch-with-gpu-support-and-automatic-differentiation-8f565122a3cc
Medium
Recreating PyTorch from Scratch (with GPU Support and Automatic Differentiation)
Build your own deep learning framework based on C/C++, CUDA and Python, with GPU support and automatic differentiation!
Полное руководство по BERT с кодом
История, архитектура, предварительная подготовка и тонкая настройка
https://towardsdatascience.com/a-complete-guide-to-bert-with-code-9f87602e4a11
История, архитектура, предварительная подготовка и тонкая настройка
https://towardsdatascience.com/a-complete-guide-to-bert-with-code-9f87602e4a11
Medium
A Complete Guide to BERT with Code
History, Architecture, Pre-training, and Fine-tuning
Mamba — это сильная альтернатива Transformer, которая набирает обороты благодаря своей способности использовать меньшее количество FLOP при сохранении производительности. Однако для некоторых приложений это может не потребоваться. Эта работа показывает, что хорошо настроенная базовая линия CNN превосходит Mamba в ряде задач по зрению.
https://github.com/yuweihao/mambaout
https://github.com/yuweihao/mambaout
GitHub
GitHub - yuweihao/MambaOut: MambaOut: Do We Really Need Mamba for Vision? (CVPR 2025)
MambaOut: Do We Really Need Mamba for Vision? (CVPR 2025) - yuweihao/MambaOut
Большие языковые модели гораздо линейнее, чем мы думали
https://habr.com/ru/companies/airi/articles/816125/
https://habr.com/ru/companies/airi/articles/816125/
Хабр
Большие языковые модели гораздо линейнее, чем мы думали
Хабр, привет! Это снова Антон Разжигаев, аспирант Сколтеха и научный сотрудник лаборатории FusionBrain в Институте AIRI, где мы продолжаем углубляться в изучение языковых моделей. В прошлый раз мы...
👍2
10 репозиториев GitHub для разработки мастер-данных
Изучите инженерию данных с помощью бесплатных курсов, учебных пособий, книг, инструментов, руководств, дорожных карт, практических упражнений, проектов и других ресурсов. https://www.kdnuggets.com/10-github-repositories-to-master-data-engineering
Изучите инженерию данных с помощью бесплатных курсов, учебных пособий, книг, инструментов, руководств, дорожных карт, практических упражнений, проектов и других ресурсов. https://www.kdnuggets.com/10-github-repositories-to-master-data-engineering
KDnuggets
10 GitHub Repositories to Master Data Engineering - KDnuggets
Learn data engineering through free courses, tutorials, books, tools, guides, roadmaps, practice exercises, projects, and other resources.
Обучение машин с градиентным усилением может занять некоторое время, но есть внутренний трюк, который мы можем применить, чтобы обучение деревьев было намного быстрее. Оказывается, гистограмма — это все, что нам нужно!..
https://www.youtube.com/watch?v=5okmBJaE0kY
https://www.youtube.com/watch?v=5okmBJaE0kY
YouTube
Histograms for faster boosting
Gradient boosted machines can take a while to train, but there is an internal trick that we can pull off to make it a whole lot faster to train trees. It turns out that a histogram may be all we need!
If you're curious about the code, you can find the notebook…
If you're curious about the code, you can find the notebook…
Обучение с подкреплением: глубокие Q-сети
https://towardsdatascience.com/reinforcement-learning-from-scratch-deep-q-networks-0a8d33ce165b
https://towardsdatascience.com/reinforcement-learning-from-scratch-deep-q-networks-0a8d33ce165b
Medium
Reinforcement Learning: Deep Q-Networks
Teaching a shuttle to land on the moon using Deep Q-Networks in Python. A mathematical deep dive into Reinforcement Learning.
Прогнозирование диабета 1 типа у детей с использованием электронных медицинских карт в первичной медико-санитарной помощи в Великобритании: разработка и проверка алгоритма машинного обучения
Детей, поступающих в первичную медицинскую помощь с подозрением на диабет 1 типа, следует немедленно направлять в вторичную помощь, чтобы избежать опасного для жизни диабетического кетоацидоза . Однако раннее выявление детей с диабетом 1 типа является сложной задачей. У детей могут отсутствовать классические симптомы, или симптомы могут быть связаны с более распространенными заболеваниями. У четверти детей наблюдается диабетический кетоацидоз, причем эта пропорция не меняется в течение 25 лет. Нашей целью было выяснить, может ли алгоритм машинного обучения привести к более раннему выявлению диабета 1 типа в учреждениях первичной медико-санитарной помощи…
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00050-5/fulltext
Детей, поступающих в первичную медицинскую помощь с подозрением на диабет 1 типа, следует немедленно направлять в вторичную помощь, чтобы избежать опасного для жизни диабетического кетоацидоза . Однако раннее выявление детей с диабетом 1 типа является сложной задачей. У детей могут отсутствовать классические симптомы, или симптомы могут быть связаны с более распространенными заболеваниями. У четверти детей наблюдается диабетический кетоацидоз, причем эта пропорция не меняется в течение 25 лет. Нашей целью было выяснить, может ли алгоритм машинного обучения привести к более раннему выявлению диабета 1 типа в учреждениях первичной медико-санитарной помощи…
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00050-5/fulltext
The Lancet Digital Health
Predicting type 1 diabetes in children using electronic health records in primary care in the UK: development and validation of…
If implemented into primary care settings, this predictive algorithm could substantially
reduce the proportion of patients with new-onset type 1 diabetes presenting in diabetic
ketoacidosis. Acceptability of alert thresholds should be explored in primary…
reduce the proportion of patients with new-onset type 1 diabetes presenting in diabetic
ketoacidosis. Acceptability of alert thresholds should be explored in primary…