Big data world

Используем HTTP API Gemini 2.0 бесплатно

https://habr.com/ru/articles/876566/

Используем HTTP API Gemini 2.0 thinking бесплатно

Давно не писал статей на хабр, потому что редко находится что-то действительно полезное. Я подписан в Telegram на десяток новостных каналов про ИИ, но только недавно с удивлением для себя обнаружил,...

923 views11:04

Big data world

Основы компьютерного зрения

https://yashshahh.notion.site/CV-Basics-1-163464be31028096bad4ffa3aca9851e

Yash's Notion on Notion

CV Basics - 1 | Notion

by: Twitter Yash 🍱 (@deeplearnerd) on X

👍2

1.35K views11:08

Big data world

Beyond Jupyter — это сборник материалов для самостоятельного изучения проектирования программного обеспечения, в котором особое внимание уделяется приложениям машинного обучения. Он демонстрирует, как грамотное проектирование программного обеспечения может ускорить как разработку, так и эксперименты. https://transferlab.ai/trainings/beyond-jupyter

transferlab.ai

Beyond Jupyter | TransferLab — appliedAI Institute

Beyond Jupyter is a collection of self-study materials on software design, with a specific focus on machine learning applications, which demonstrates how sound software design can accelerate both development and experimentation.

1.16K views13:09

Big data world

Как использовать DeepSeek R1 бесплатно в Visual Studio Code с Cline или Roo Code

https://dev.to/dwtoledo/how-to-use-deepseek-r1-for-free-in-visual-studio-code-with-cline-or-roo-code-3an9

DEV Community

How to Use DeepSeek R1 for Free in Visual Studio Code with Cline or Roo Code

If you're looking for an AI that excels in reasoning and is also free because it's open source, the...

1.23K views05:21

Big data world

Масштабирование во время тестирования — это многообещающий новый подход к языковому моделированию, который использует дополнительные вычисления во время тестирования для повышения производительности. Недавно модель OpenAI o1 продемонстрировала эту возможность, но не поделилась своей методологией публично, что привело к многочисленным попыткам репликации. Мы ищем самый простой подход для достижения масштабирования во время тестирования и высокой производительности рассуждений.

https://github.com/simplescaling/s1

GitHub

GitHub - simplescaling/s1: s1: Simple test-time scaling

s1: Simple test-time scaling. Contribute to simplescaling/s1 development by creating an account on GitHub.

1.18K views10:41

Big data world

Kimi k1.5: Масштабирование обучения с подкреплением с LLM

https://github.com/MoonshotAI/Kimi-k1.5

GitHub

GitHub - MoonshotAI/Kimi-k1.5

Contribute to MoonshotAI/Kimi-k1.5 development by creating an account on GitHub.

1.22K views12:45

Big data world

DeepSeek-R1 для чайников

https://habr.com/ru/companies/airi/articles/879178/

Хабр

DeepSeek-R1 для чайников

В последние месяцы всё чаще слышим про «reasoning-модели», способные не просто продолжать текст, а действительно шаг за шагом решать сложнейшие задачи цепочкой рассуждений (chain-of-thought). Впервые...

1.33K views13:20

Big data world

Все, что вам нужно знать для создания собственного приложения RAG

https://github.com/bRAGAI/bRAG-langchain

GitHub

GitHub - bragai/bRAG-langchain: Everything you need to know to build your own RAG application

Everything you need to know to build your own RAG application - bragai/bRAG-langchain

👍1

1.49K views14:47

Big data world

Ваша машина, ваш искусственный интеллект — наилучший локальный пакет производительности с Ollama

https://blog.det.life/your-machine-your-ai-the-ultimate-local-productivity-stack-with-ollama-7a118f271479

Data Engineer Things

Things learned in our data engineering journey and ideas on data and engineering.

1.95K views15:48

Big data world

Vision Search Assistant: Расширьте возможности моделей Vision-Language в качестве мультимодальных поисковых систем

https://cnzzx.github.io/VSA

2.35K views06:40

Big data world

Изучите пять шаблонов проектирования агентского ИИ, которые повышают эффективность агентов ИИ

https://blog.dailydoseofds.com/p/5-agentic-ai-design-patterns

Dailydoseofds

5 Agentic AI Design Patterns

...explained visually

2.73K views08:35

Big data world

Агентские и RAG-системы обычно испытывают трудности с обновлением знаний в режиме реального времени и быстрым поиском данных.

Сегодня давайте обсудим недавнюю статью Zep , в которой представлена интересная архитектура графа знаний с учетом времени, призванная решить эту проблему. https://blog.dailydoseofds.com/p/build-human-like-memory-for-your

Dailydoseofds

Build Human-like Memory for Your AI Agents

A must-read research paper on Agents!

3.32K views09:36

Big data world

Обнаружение аномалий в машинном обучении с использованием Python

https://blog.jetbrains.com/pycharm/2025/01/anomaly-detection-in-machine-learning

The JetBrains Blog

Anomaly Detection in Machine Learning Using Python | The PyCharm Blog

Learn how to detect anomalies in machine learning using Python. Explore key techniques with code examples and visualizations in PyCharm for data science tasks.

👍1

3.82K views11:37

Big data world

20 важных статистических подходов, которые знает каждый специалист по данным🐱‍🚀

https://medium.com/@sarowar.saurav10/20-advanced-statistical-approaches-every-data-scientist-should-know-ccc70ae4df28

Medium

20 Important Statistical Approaches Every Data Scientist Knows🐱‍🚀

Data science is a multidisciplinary field that combines mathematics, statistics, computer science, and domain expertise to extract…

3.31K views08:58

Big data world

Какой лучший PDF Extractor для RAG? Я пробовал LlamaParse, Unstructured и Vectorize

https://levelup.gitconnected.com/whats-the-best-pdf-extractor-for-rag-i-tried-llamaparse-unstructured-and-vectorize-4abbd57b06e0

Medium

What’s the Best PDF Extractor for RAG? I Tried LlamaParse, Unstructured and Vectorize

If you’re building retrieval augmented generation (RAG) applications, you will eventually need to work with documents that are in PDF form.

1.6K views08:55

Big data world

Новые тенденции в создании продуктов GenAI

По мере того, как мы перемещаем программные продукты, использующие технологию генеративного ИИ, из проверки концепций в производственные системы, мы обнаруживаем ряд общих шаблонов. Оценки играют центральную роль в обеспечении того, чтобы эти недетерминированные системы работали в разумных границах. Большие языковые модели нуждаются в улучшении, чтобы предоставлять информацию за пределами общего и статического обучающего набора. В большинстве случаев мы можем сделать это с помощью Retrieval Augmented Generation (RAG), хотя базовый подход RAG требует нескольких шаблонов для преодоления своих ограничений. Когда RAG недостаточно, становится полезной тонкая настройка.

https://martinfowler.com/articles/gen-ai-patterns

martinfowler.com

Emerging Patterns in Building GenAI Products

Patterns from our colleagues' work building with Generative AI

2.29K views08:59

Big data world

olmOCR: разблокировка триллионов токенов в PDF-файлах с помощью моделей Vision Language

https://github.com/allenai/olmocr

GitHub

GitHub - allenai/olmocr: Toolkit for linearizing PDFs for LLM datasets/training

Toolkit for linearizing PDFs for LLM datasets/training - allenai/olmocr

937 views15:25

Big data world

Понимание внимания в LLM
Существует множество отличных статей и руководств по ИИ, которые объясняют модель внимания в больших языковых моделях. Но эта по сути простая модель часто затемняется деталями реализации и оптимизациями. В этом посте я постараюсь перейти к сути.

https://bartoszmilewski.com/2025/03/06/understanding-attention-in-llms

Bartosz Milewski's Programming Cafe

Understanding Attention in LLMs

There are many excellent AI papers and tutorials that explain the attention pattern in Large Language Models. But this essentially simple pattern is often obscured by implementation details and opt…

1.09K views15:27

Big data world

AMD побеждает в открытом исходном коде, GNOME завершает поддержку Wayland Новости Linux и Open Source

https://www.youtube.com/watch?v=3d65Mnr8onE

YouTube

AMD wins at open source, GNOME completes Wayland support Linux & Open Source News

Head to https://squarespace.com/thelinuxexperiment to save 10% off your first purchase of a website or domain using code thelinuxexperiment

Grab a brand new laptop or desktop running Linux: https://www.tuxedocomputers.com/en#

👏 SUPPORT THE CHANNEL:
Get…

1.35K views16:29

Big data world

Создайте своего помощника с искусственным интеллектом Second Brain
Использование агентов, систем RAG, LLMOps и LLM

https://decodingml.substack.com/p/build-your-second-brain-ai-assistant

Substack

Build your Second Brain AI assistant

Using agents, RAG, LLMOps and LLM systems

2.11K views08:17

About

Blog

Apps

Platform