Технозаметки Малышева
8.99K subscribers
3.89K photos
1.45K videos
40 files
4.06K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Интересно.
Что если Запад останется без видеокарт?

Официально подтверждено, что имела место встреча мэра Шанхая и главы NVIDIA.

KS

#Китай #NVidia
------
@tsingular
🤔5
Forwarded from Технотренды
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел полноценный генератор 3D-сцен от Krea AI: теперь это замена Blender прямо в браузере.

Вот что умеет:

— Любые объекты и готовые сцены создаются за считанные секунды через промпты.
— Нейронка чувствительна к контексту и сама будет предлагать удачные идеи для генерации.
— Работает бесплатно.


Пробуем — тут.

😇 Техно
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4
Forwarded from Machinelearning
🔥 Kaggle и Google выпустили мини-курс генеративному ИИ!

С 31 марта по 4 апреля 2025 года на Kaggle прошел ряд интенсивов по генеративному ИИ, теперь все материалы с доступны для самостоятельного обучения.

✔️ Что внутри:
🟡День 1: Основы генеративного ИИ и инженерия промптов

Изучите эволюцию больших языковых моделей (LLM), от трансформеров до методов ускорения инференса.

Описание техник создания эффективных промптов для взаимодействия с ИИ.​

🟡День 2: Интеграция с API и практическое применение

Вы научитесь использовать API LLM, для создания интерактивных приложений.

Реализуйте проекты с использованием Retrieval-Augmented Generation (RAG) и семантического поиска.​

🟡День 3: Работа с векторными базами данных

Настройте векторные базы данных для эффективного хранения и поиска информации.

Примените эмбеддинги для улучшения качества генерации текста.​

🟡День 4: Создание персонализированных ИИ-ассистентов

Разработайте персонализированных ИИ-ассистентов, способных отвечать на сложные запросы.

Используйте передовые методы генерации для создания реалистичных диалогов.​

🟡День 5: Проект

Примените полученные знания в финальном проекте, продемонстрировав свои навыки в области генеративного ИИ.​

🧠 Примеры проектов:
- AI Health Assistant: - Персонализированный медицинский помощник, использующий RAG и семантический поиск для предоставления точной информации. ​
Kaggle
- NewsGenius AI: Интеллектуальный агрегатор новостей, анализирующий и обобщающий актуальные события. ​

🔗 Курс
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
63👍2🦄1
Forwarded from PIMENOV.RU
Это просто 96 MacMini, соединённые между собой для запуска ИИ моделей локально. Кто-то делает что-то большое и очень секретное.

🗣@pimenov_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👀7👍3🤩2🐳2
Шпаргалка по n8n
Исходник в комментарии.

#n8n #docs
———
@tsingular
4🤝3
🚀 Трансформеры + vLLM: вместе вкуснее

vLLM выкатили обновление, которое теперь поддерживает Transformers от Hugging Face.

Суть в том, что теперь можно взять любую новую модель из Transformers и сразу запустить на ней оптимизированный инференс через vLLM не ожидая пока её кто-то сконвертирует в совместимый формат.

Достаточно просто указать:
from transformers import pipeline

pipe = pipeline("text-generation", model="meta-llama/Llama-3.2-1B")
result = pipe("The future of AI is")

print(result[0]["generated_text"])


И вуаля – получаем все плюшки vLLM с его PagedAttention и динамическим батчингом.

Бизнес-кейсы:

1. Снижение серверных затрат: vLLM эффективнее использует GPU-память.

2. OpenAI-совместимый API:

запускаем
vllm serve meta-llama/Llama-3.2-1B


вызываем по url
curl https://localhost:8000/v1/completions \
-H "Content-Type: application/json" \
-d '{"model": "meta-llama/Llama-3.2-1B", "prompt": "San Francisco is a", "max_tokens": 7, "temperature": 0}'


или в коде
from openai import OpenAI

client = OpenAI(api_key="EMPTY", base_url="https://localhost:8000/v1")
completion = client.completions.create(
model="meta-llama/Llama-3.2-1B",
prompt="San Francisco is a",
max_tokens=7,
temperature=0
)
print("Completion result:", completion.choices[0].text)


3. Быстрое внедрение новых моделей: как только модель появляется в Transformers, её можно сразу оптимизированно применять в проде.

Пример с моделью Helium от Kyutai особенно показателен: несмотря на то, что эта модель ещё не поддерживается нативно в vLLM, её уже можно запустить через трансформерный бэкенд и получить значительный прирост в скорости.

#Transformers #vLLM #инференс #HuggingFace
———
@tsingular
👍5🔥21
🚨 Уязвимости в MCP: пять критических рисков, о которых стоит знать

🔹 Command Injection (Инъекция команд) — Умеренный риск 🟡
Атакующие внедряют опасные команды в обычный контент (письма, сообщения и т.д.). Если ваш агент обрабатывает эти данные, он может неосознанно выполнить системные задачи, такие как утечка данных или запуск вредоносных скриптов.

🔹 Tool Poisoning (Отравление инструментов) — Серьёзный риск 🔴
Злоумышленник может тайно внедрить скомпрометированный инструмент через MCP, который получит доступ к API-ключам, базам данных или другим конфиденциальным ресурсам и отправит их в другое место без вашего ведома.

🔹 Open Connections via SSE (Открытые соединения через SSE) — Умеренный риск 🟠
Поскольку MCP использует Server-Sent Events (SSE), соединения часто остаются открытыми дольше, чем следует. Это открывает дверь для проблем с задержкой и даже манипуляций данными в процессе передачи.

🔹 Privilege Escalation (Повышение привилегий) — Серьёзный риск 🔴
Один заражённый инструмент может переопределить разрешения другого. Если вы полагаетесь на инструменты вроде Firecrawl для доверенных задач, это может полностью нарушить ваш рабочий процесс или привести к худшим последствиям.

🔹 Persistent Context Misuse (Злоупотребление постоянным контекстом) — Низкий, но рискованный 🟡
MCP сохраняет активный контекст в рабочих процессах, что звучит полезно... пока инструменты не начинают автоматически выполнять задачи на основе этого контекста без одобрения человека.

🔹 Server Data Takeover/Spoofing (Захват/подмена серверных данных) — Серьёзный риск 🔴
Были случаи, когда атакующие перехватывали данные и учётные данные (да, даже с платформ типа WhatsApp) используя скомпрометированные инструменты. Архитектура MCP, основанная на доверии серверам, делает это особенно опасным.

#MCP #cybersecurity
———
@tsingular
3👍2
в ollama вышла granite 3.3 от IBM

https://ollama.com/library/granite3.3

Capabilities

Thinking
Summarization
Text classification
Text extraction
Question-answering
Retrieval Augmented Generation (RAG)
Code related tasks
Function-calling tasks
Multilingual dialog use cases
Fill-in-the-middle
Long-context tasks including long document/meeting summarization, long document QA, etc.

с размышлениями.

#granite #IBM #ollama
———
@tsingular
4👍1
Azure MCP Server: новый стандарт уже в облаке

Microsoft официально выпустил Azure MCP Server — полноценную реализацию спецификации MCP, которая становится новым стандартом взаимодействия между AI-ассистентами и облачными сервисами.

Что внутри? Сервер обеспечивает бесшовную интеграцию с ключевыми сервисами Azure:
- 💾 Azure Storage (управление blob-контейнерами, доступ к таблицам)
- 📊 Azure Cosmos DB (работа с NoSQL базами)
- 📈 Azure Monitor и Log Analytics (запросы через KQL)
- ⚙️ Azure App Configuration (конфигурации приложений)
- 🔧 Azure CLI и Azure Developer CLI (azd) как полноценные расширения

Теперь вместо изучения API-документации разработчики могут просто писать "Покажи мои таблицы в Storage аккаунте" или "Сделай запрос к моей базе Cosmos DB".

Для бизнеса это означает:
1. Резкое снижение порога входа для работы с Azure
2. Ускорение DevOps-процессов через AI-ассистентов
3. Возможность делегировать рутинные операции управления AI

Пока проект в Public Preview (GA ожидается позже), но уже используется в связке с GitHub Copilot и поддерживает интеграцию через VS Code, Azure CLI, Azure PowerShell.

Установка через npx в одну команду, плюс готовая интеграция в VS Code — похоже, Microsoft всерьёз взялся за стандартизацию MCP как протокола общения между агентами и инфраструктурой.

#Azure #MCP #Microsoft
———
@tsingular
4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🦾 Исследователи NYU представили RUKA (да-да)

Это — открытый робот‑манипулятор с приводом на сухожилиях и 15 степенями свободы, стоимостью всего $1.3 тыс., который может работать 20 часов подряд без потери производительности.

Он обучается моделям «сустав–привод» и «кончик пальца–привод» на основе данных системы захвата движения.

🔜 Подробнее

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17
Не знаю зачем, но я нашёл этот стартап.

Они строят кластер для параллельных вычислений.
В Техасе.

https://higherorderco.com/

#macrack #hpc
------
@tsingular
👍10
Media is too big
VIEW IN TELEGRAM
🧬 Наглядно о качестве роликов от видеонейронки Kling 2.0. ИИ-картинка получается лучше реальности.

🧩 #ИИскусство
🔥25❤‍🔥54👍3💯1
🛠 InstructPipe: Google Research создаёт конкурента n8n и UiPath

Команда исследователей в Google выпустили интересный пропотип ассистента визуального low-code программиста.

Рассмотрим его чуть подробнее, пока он еще не стал мейнстримом и не подмял весь рынок.

Предыстория
Есть в Гугле такой проект - Rapsai, занимающийся визуальным программированием, в основном под пайплайны обработки видео, картинок и звука.

В проекте есть около 30 нод и все заточено на упрощение полного цикла медиа производства.

И вот они выкатили ассистента – InstructPipe, который позволяет одним запросом строить эти самые визуальные ноды.

Ну, сделали и сделали, скажете, но интересно как именно они это сделали и какие перспективы.
ИМХО тут огромный потенциал для конкуренции с лидерами рынка вроде n8n или UIPath:

1. Сообщение от пользователя анализируется и превращается в md файл с инструкциями по процессу создания нод.
2. Перечень инструментов (считай апи) тоже подается в контекст – стандартный агентский подход
3. Дальше ЛЛМка идет по инструкции для каждой ноды и прорабатывает ее согласно описанию ( у них всего 8К контекста в модели, поэтому разбили обработку на отдельные маленькие шаги)
4. Результат, вместе с мд инструкцией передается в кодового агента и уже он финалит ноды.

Ну и у них там встроенный визуализатор путей уже рабочий (VisualBlocks), поэтому оно сразу наглядно отображается.

По тестам на 16-ти кейсах текущий прототип уже сокращает количество действий на 81,1%!

Возможный выход на рынок через год
Если Google грамотно разыграет эту карту, мы увидим примерно такую эволюцию:
1. Расширение библиотеки нодов — в ближайшие полгода с 27 до 300-500 нодов
2. Интеграция с Google Cloud Services — прямой доступ к BigQuery, Vision API, Document AI и прочим
3. Enterprise-функционал — управление доступом, версионирование, логирование
4. Marketplace с community-нодами — без этого уже не модно

Уже прямо сейчас в их paper видны намёки на эти шаги — фокус на масштабировании, работе с "фирменными" ML-моделями Google.

Проблемы, которые пока не решены
1. Галлюцинации — модель иногда придумывает несуществующие ноды.
2. Ручная настройка параметров нодов — это не автоматизировано, в отличие от структуры пайплайна.

Запишем их в отдельный блокнотик перспективных проектов и будем продолжать наблюдение. Вернемся через год-полтора в пределах продуктового цикла Google.

Paper
Демки тут
GitHub

#InstructPipe #GoogleResearch #VisualBlocks #LowCode
———
@tsingular
👍2🔥2
🇦🇪 В ОАЭ создадут уникальную законодательную систему на базе ИИ

Кабинет министров ОАЭ утвердил создание первой в своем роде экосистемы регулирования на базе ИИ.

Ключевые моменты:
- Создание нового Управления регуляторного интеллекта при Кабинете министров
- ИИ будет отслеживать влияние законов на экономику и общество в режиме реального времени
- Ускорение законодательного процесса на 70% благодаря автоматизации
- Единая законодательная карта, связывающая федеральные и местные законы с судебными решениями

Техническая начинка:

- Технологии больших данных для анализа эффективности законов
- Автоматическое формирование предложений по обновлению законодательства
- Интеграция с глобальными исследовательскими центрами для сравнительного анализа
- Интеграция с судебными решениями, исполнительными процедурами и госуслугами

Практические результаты:

- Мгновенный анализ влияния законов на граждан и бизнес
- Более быстрое и точное законотворчество
- Постоянная актуализация законодательной базы без задержек
- Повышение конкурентоспособности ОАЭ на международной арене

Это продолжение более широкой стратегии ОАЭ по внедрению ИИ в госуправление.
Уже сейчас в судебной системе работают виртуальный юридический консультант, чат-боты по семейному праву и виртуальный сотрудник "Аиша" на базе генеративного ИИ.

ОАЭ уверенно создают одну из самых передовых правовых экосистем с ИИ в мире.

#законы #UAE #Legal
———
@tsingular
🔥6👍4
В Пекине прошёл первый в мире полумарафон роботов

В Пекине 20 роботов-гуманоидов бок о бок с тысячами людей преодолели дистанцию в 21 км!

Победитель — робот "Tiangong Ultra" с результатом 2 часа 40 минут. Этот 1,8-метровый механический бегун развивал скорость до 12 км/ч.

Серебро взял робот от Noetix Robotics, финишировав за 3 часа 27 минут, правда, с заменой во время гонки.

Бежали по разным трекам, чтобы не толкаться с людьми.

#robots #marathon #Beijing #Китай
------
@tsingular
🔥6
Microsoft дополнил MarkItDown интеграцией с MCP

Инструмент на Python для трансформации любых офисных документов в Markdown получил поддержку Model Context Protocol.

Пакет markitdown-mcp функционирует как легковесный STDIO и SSE сервер, предоставляя метод convert_to_markdown.

Поддерживает контейнеризацию в Docker.

Возможна интеграция с Claude Desktop.

Инструмент сохраняет структуру исходных документов (таблицы, заголовки, списки) при конвертации в формат Markdown.

Отладка возможна через mcpinspector, поддерживающей оба режима работы сервера.

Наконец-то можно скормить крупным языковым моделям документы без лишних заморочек!

#Microsoft #MarkItDown #MCP
------
@tsingular
👍65