Интересное что-то

4️⃣

5️⃣

6️⃣

Как WB сделал «Поиск по фото»

Продолжаю рассказывать про прикольные проекты коллег. В этот раз прикольную фичу — поиск по фото, которой я сам частенько пользуюсь. Особенно если нашел какую-то прикольную вещь в рилсах, или буквально недавно нашел чайник-термос в одном заведении.

С точки зрения юзера схема супер простая: Заскринил — загрузил — выделил нужный объект — выбрал нужный товар. Кстати прикольно, что у нас есть OCR по объектам, я такого в других местах не встречал. Можно по одному фото сразу несколько вещей найти.

Под капотом там не просто CLIP, сначала YOLO вырезает объект, OCR снимает артикулы/текст, потом SigLIP-эмбеддинги улетают в векторный поиск Qdrant (HNSW). Товары лежат уже в эмбеддингах заранее.

Самое интересное — мультимодальная логика: поиск живёт не только в изображении. Фото обогащают тегами, которые заранее сгенерированы LLM офлайн по описаниям и визуальным признакам.

Пост у ребят получился достаточно понятным, почти все технические детали разобрали, мне было легко читать.

➡️

Почитать можно тут

❗Ставьте 🔥 огонек если пользуетесь поиском по фото

MADE IN @researchoshnaya

Please open Telegram to view this post

VIEW IN TELEGRAM

68 views14:10

Интересное что-то

#llm #rag #petproject

70 views14:42

Интересное что-то

Forwarded from Artyom Zemlyak

Привет!
Хотел бы поделиться проектом:
https://github.com/ArtyomZemlyak/tg-note

Если кратко:
- агент автоматически обновляет базу знаний по сообщениям от пользователя
- агент по умолчанию это qwen code cli
- интерфейс это бот в телеге
- как базу знаний можно использовать репу GitHub

Идея: закидывать посты из разных каналов репостами в бота, а он уже будет все раскидывать по базе знаний.

Может кому-то будет интересно.

81 views14:42

Интересное что-то

#llm #petproject

69 views14:59

Интересное что-то

Forwarded from Data Secrets

О, новый релиз от Андрея Карпаты

Это один из самых безумных репозиториев, которые я когда-либо писал

Сразу ссылка: github.com/karpathy/nanochat

nanochat – это что-то типа продолжения легендарного nanoGPT. Но если nanoGPT – это, по сути, только предобучение, то здесь у нас полностью готовый конвейер для обучения и инференса целого мини-клона ChatGPT.

В лучших традициях кода Карпаты – совсем немного строк (всего 8к) и минимальное количество зависимостей. Вы просто открываете проект на любом облачном GPU-сервере, запускаете один скрипт, и уже через 4 часа можете общаться с LLM-кой в собственном ChatGPT.

В пересчете на аренду GPU это будет стоить примерно 100 долларов. Если готовы потратить больше, то можно масштабировать и получать лучшие результаты.

Моя цель – собрать весь «сильный базовый» стек в один связный, минималистичный, читаемый и максимально форкаемый репозиторий. nanochat станет итоговым проектом LLM101n <мы об этом курсе писали тут>. Думаю, у него также есть потенциал стать исследовательским инструментом или бенчмарком, подобным ранее существовавшему nanoGPT.

Технические детали о том, что просходит внутри проекта, можно почитать здесь.

Огонь же?

90 views14:59

Интересное что-то

#llm

85 views17:04

Интересное что-то

Forwarded from Maxim.ML - канал

🔍 Что скрывается под капотом Perplexity?

Когда AI отказывается выполнить задачу, ссылаясь на "лимиты ресурсов", возникает вопрос: а что это за лимиты? Со мной случился как раз такой кейс.

Я решил выяснить, что происходит внутри Perplexity, когда он выполняет код. Попросил AI проанализировать собственные логи и окружение. И он буквально сам рассказал: "Я работаю в Docker-контейнере на Linux 6.1, у меня 2 CPU и 1GB RAM..." и далее выдал полную базу, вплоть до локации своего сервера (кстати, США, штат Орегон)

Perplexity использует E2B Sandbox - специализированную платформу для AI-агентов. Каждый ваш запрос с кодом запускается в контейнере.

🔵 Архитектура: FastAPI ↔ WebSocket ↔ Jupyter Kernel
🔵 Оптимизация: uvloop + orjson + httptools

Это объясняет, почему AI иногда "отказывается" - не из-за технических лимитов, а из-за бизнес-логики системы. Ведь критически важно быстро отдавать пользователю результат - это основной приоритет таких решений

GitHub Copilot, Replit, CodeSandbox - все используют похожие решения

Зная архитектуру подобных решений, можно:
🔜 Правильно использовать контекст
🔜 Оптимизировать запросы под систему (и манипулировать системой)
🔜 Понимать реальные ограничения и бизнес-логику

Понимание внутреннего устройства AI-систем становится критически важным навыком. Это не просто любопытство - это практический инструмент для более эффективной работы

📖 Полное исследование на Habr

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

97 views17:04

Интересное что-то

#softskills #career

90 views09:53

Интересное что-то

Forwarded from Руковожоп

Хочу уволить всех к херам

🔪

Сегодня обсуждаем вместе вопрос из анонимного инбокса Руковожопа

«Я пришла в новый проект выстраивать маркетинг.
Там уже есть команда, которая и по результатам, и по моему мнению работает плохо.
На первой же планёрке захотелось уволить всех к хренам,
но так нельзя — тогда вообще некому будет работать.
Как сберечь нервные клетки и при этом выстроить маркетинг здорового человека?»

У меня такое было: приходишь в новую команду и от бардака кровь из глаз, а люди в этом живут как в уютном доме 🤨

Но увольнять всех — реально нельзя, ни стратегически, ни этически.

Что делать:

🔴

Не ставим диагнозы

Сначала смотрим, почему они работают плохо.
Иногда там не «ленивые дураки», а просто отсутствие системности и много руководителей, которые всё пускали на самотёк

🔴

Ищем союзника

В идеале сильного — наш +1 или негласный лидер команды.
Тот человек, который хочет лучше.
С ним начинаем тянуть команду вверх, и постепенно к нему подтянутся остальные

🔴

Новым правилам — 👍,но не ломаем старые в ноль

Любая реформа без контекста воспринимается как агрессия.
Вместо «с завтрашнего дня всё по-новому» — идём в «давайте попробуем так, а потом решим, что лучше»
К этому моменту у нас должно быть на счету несколько маленьких побед, чтобы команда уже дала кредит доверия

🔴

Шлюпки нет, используем дверь

Не пытаемся сразу спасать весь маркетинг, а берём один блок. Делаем там идеальный порядок, показываем результат — и используем его как доказательство, что подход работает

🔴

Крепко держимся друг за друга

Частая ошибка: видишь, что команда работает как из жопы и в болоте дна не разглядеть — отделяешься от всех максимально. Ни то обида, ни то злость 🔫

Вот здесь надо включить кота Леопольда и поддерживать изо всех сил команду: давать корректирующую обратную связь, подсвечивать проблемы и всячески показывать готовность решать это сообща

📌Сначала понять, потом структурировать и поддержать,
и только потом менять.

Любой другой порядок превратит из строителя в Руковожопа с бензопилой

Жду ваши мысли по теме и напоминаю, что вопрос можно задать тут, вы только пишите, это вопрос в зал или чисто 1+1 пощебечем?😘

Please open Telegram to view this post

VIEW IN TELEGRAM

101 views09:53

Интересное что-то

#llm

108 views13:21

Интересное что-то

Forwarded from Agentic World

Привет! И еще один перевод феноменальной статьи, на этот раз про особенности архитектур открытых LLM. Картиночки у автора (с прекрасной фамилией Рашка) просто огненные. Максимально рекомендую полистать хотя бы просто для общего развития.

Там будет DeepSeek V3/R1, OLMo 2, Gemma 3, Mistral Small 3.1, Llama 4, Qwen3, SmolLM3, Kimi K2, GPT-OSS, Grok 2.5, GLM-4.5, Qwen3-Next.

https://habr.com/ru/articles/958880/

Хабр

Большое сравнение архитектур LLM

Это перевод классной статьи с детальным обзором архитектур главных опенсорсных LLM: очень структурировано, доходчиво и с изумительными картиночками. И такой обзор просто обязан быть на русском языке....

118 views13:21

Интересное что-то

#dl #nlp #interview

98 views14:07

Интересное что-то

Forwarded from ML Baldini • Nikita Boyandin (Nikita Boyandin)

МЛ алгосы: вторая часть или mlleetcode ultrahard💃

В этом посте я собрал весь код по статье Attention is All You Need, и также накинул картиночек с формулами для большего понимания. Надеюсь, вам понравится

💗

Please open Telegram to view this post

VIEW IN TELEGRAM

105 views14:07

About

Blog

Apps

Platform