Интересно.
Что если Запад останется без видеокарт?
KS
#Китай #NVidia
------
@tsingular
Что если Запад останется без видеокарт?
Официально подтверждено, что имела место встреча мэра Шанхая и главы NVIDIA.
KS
#Китай #NVidia
------
@tsingular
🤔5
Forwarded from Технотренды
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел полноценный генератор 3D-сцен от Krea AI: теперь это замена Blender прямо в браузере.
Вот что умеет:
Пробуем — тут.
😇 Техно
Вот что умеет:
— Любые объекты и готовые сцены создаются за считанные секунды через промпты.
— Нейронка чувствительна к контексту и сама будет предлагать удачные идеи для генерации.
— Работает бесплатно.
Пробуем — тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4
Forwarded from Machinelearning
С 31 марта по 4 апреля 2025 года на Kaggle прошел ряд интенсивов по генеративному ИИ, теперь все материалы с доступны для самостоятельного обучения.
Изучите эволюцию больших языковых моделей (LLM), от трансформеров до методов ускорения инференса.
Описание техник создания эффективных промптов для взаимодействия с ИИ.
Вы научитесь использовать API LLM, для создания интерактивных приложений.
Реализуйте проекты с использованием Retrieval-Augmented Generation (RAG) и семантического поиска.
Настройте векторные базы данных для эффективного хранения и поиска информации.
Примените эмбеддинги для улучшения качества генерации текста.
Разработайте персонализированных ИИ-ассистентов, способных отвечать на сложные запросы.
Используйте передовые методы генерации для создания реалистичных диалогов.
Примените полученные знания в финальном проекте, продемонстрировав свои навыки в области генеративного ИИ.
🧠 Примеры проектов:
- AI Health Assistant: - Персонализированный медицинский помощник, использующий RAG и семантический поиск для предоставления точной информации.
Kaggle
- NewsGenius AI: Интеллектуальный агрегатор новостей, анализирующий и обобщающий актуальные события.
🔗 Курс
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6✍3👍2🦄1
Forwarded from PIMENOV.RU
Это просто 96 MacMini, соединённые между собой для запуска ИИ моделей локально. Кто-то делает что-то большое и очень секретное.
🗣 @pimenov_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👀7👍3🤩2🐳2
🚀 Трансформеры + vLLM: вместе вкуснее
vLLM выкатили обновление, которое теперь поддерживает Transformers от Hugging Face.
Суть в том, что теперь можно взять любую новую модель из Transformers и сразу запустить на ней оптимизированный инференс через vLLM не ожидая пока её кто-то сконвертирует в совместимый формат.
Достаточно просто указать:
И вуаля – получаем все плюшки vLLM с его PagedAttention и динамическим батчингом.
Бизнес-кейсы:
1. Снижение серверных затрат: vLLM эффективнее использует GPU-память.
2. OpenAI-совместимый API:
запускаем
вызываем по url
или в коде
3. Быстрое внедрение новых моделей: как только модель появляется в Transformers, её можно сразу оптимизированно применять в проде.
Пример с моделью Helium от Kyutai особенно показателен: несмотря на то, что эта модель ещё не поддерживается нативно в vLLM, её уже можно запустить через трансформерный бэкенд и получить значительный прирост в скорости.
#Transformers #vLLM #инференс #HuggingFace
———
@tsingular
vLLM выкатили обновление, которое теперь поддерживает Transformers от Hugging Face.
Суть в том, что теперь можно взять любую новую модель из Transformers и сразу запустить на ней оптимизированный инференс через vLLM не ожидая пока её кто-то сконвертирует в совместимый формат.
Достаточно просто указать:
from transformers import pipeline
pipe = pipeline("text-generation", model="meta-llama/Llama-3.2-1B")
result = pipe("The future of AI is")
print(result[0]["generated_text"])
И вуаля – получаем все плюшки vLLM с его PagedAttention и динамическим батчингом.
Бизнес-кейсы:
1. Снижение серверных затрат: vLLM эффективнее использует GPU-память.
2. OpenAI-совместимый API:
запускаем
vllm serve meta-llama/Llama-3.2-1B
вызываем по url
curl https://localhost:8000/v1/completions \
-H "Content-Type: application/json" \
-d '{"model": "meta-llama/Llama-3.2-1B", "prompt": "San Francisco is a", "max_tokens": 7, "temperature": 0}'
или в коде
from openai import OpenAI
client = OpenAI(api_key="EMPTY", base_url="https://localhost:8000/v1")
completion = client.completions.create(
model="meta-llama/Llama-3.2-1B",
prompt="San Francisco is a",
max_tokens=7,
temperature=0
)
print("Completion result:", completion.choices[0].text)
3. Быстрое внедрение новых моделей: как только модель появляется в Transformers, её можно сразу оптимизированно применять в проде.
Пример с моделью Helium от Kyutai особенно показателен: несмотря на то, что эта модель ещё не поддерживается нативно в vLLM, её уже можно запустить через трансформерный бэкенд и получить значительный прирост в скорости.
#Transformers #vLLM #инференс #HuggingFace
———
@tsingular
👍5🔥2❤1
🚨 Уязвимости в MCP: пять критических рисков, о которых стоит знать
🔹 Command Injection (Инъекция команд) — Умеренный риск 🟡
Атакующие внедряют опасные команды в обычный контент (письма, сообщения и т.д.). Если ваш агент обрабатывает эти данные, он может неосознанно выполнить системные задачи, такие как утечка данных или запуск вредоносных скриптов.
🔹 Tool Poisoning (Отравление инструментов) — Серьёзный риск 🔴
Злоумышленник может тайно внедрить скомпрометированный инструмент через MCP, который получит доступ к API-ключам, базам данных или другим конфиденциальным ресурсам и отправит их в другое место без вашего ведома.
🔹 Open Connections via SSE (Открытые соединения через SSE) — Умеренный риск 🟠
Поскольку MCP использует Server-Sent Events (SSE), соединения часто остаются открытыми дольше, чем следует. Это открывает дверь для проблем с задержкой и даже манипуляций данными в процессе передачи.
🔹 Privilege Escalation (Повышение привилегий) — Серьёзный риск 🔴
Один заражённый инструмент может переопределить разрешения другого. Если вы полагаетесь на инструменты вроде Firecrawl для доверенных задач, это может полностью нарушить ваш рабочий процесс или привести к худшим последствиям.
🔹 Persistent Context Misuse (Злоупотребление постоянным контекстом) — Низкий, но рискованный 🟡
MCP сохраняет активный контекст в рабочих процессах, что звучит полезно... пока инструменты не начинают автоматически выполнять задачи на основе этого контекста без одобрения человека.
🔹 Server Data Takeover/Spoofing (Захват/подмена серверных данных) — Серьёзный риск 🔴
Были случаи, когда атакующие перехватывали данные и учётные данные (да, даже с платформ типа WhatsApp) используя скомпрометированные инструменты. Архитектура MCP, основанная на доверии серверам, делает это особенно опасным.
#MCP #cybersecurity
———
@tsingular
🔹 Command Injection (Инъекция команд) — Умеренный риск 🟡
Атакующие внедряют опасные команды в обычный контент (письма, сообщения и т.д.). Если ваш агент обрабатывает эти данные, он может неосознанно выполнить системные задачи, такие как утечка данных или запуск вредоносных скриптов.
🔹 Tool Poisoning (Отравление инструментов) — Серьёзный риск 🔴
Злоумышленник может тайно внедрить скомпрометированный инструмент через MCP, который получит доступ к API-ключам, базам данных или другим конфиденциальным ресурсам и отправит их в другое место без вашего ведома.
🔹 Open Connections via SSE (Открытые соединения через SSE) — Умеренный риск 🟠
Поскольку MCP использует Server-Sent Events (SSE), соединения часто остаются открытыми дольше, чем следует. Это открывает дверь для проблем с задержкой и даже манипуляций данными в процессе передачи.
🔹 Privilege Escalation (Повышение привилегий) — Серьёзный риск 🔴
Один заражённый инструмент может переопределить разрешения другого. Если вы полагаетесь на инструменты вроде Firecrawl для доверенных задач, это может полностью нарушить ваш рабочий процесс или привести к худшим последствиям.
🔹 Persistent Context Misuse (Злоупотребление постоянным контекстом) — Низкий, но рискованный 🟡
MCP сохраняет активный контекст в рабочих процессах, что звучит полезно... пока инструменты не начинают автоматически выполнять задачи на основе этого контекста без одобрения человека.
🔹 Server Data Takeover/Spoofing (Захват/подмена серверных данных) — Серьёзный риск 🔴
Были случаи, когда атакующие перехватывали данные и учётные данные (да, даже с платформ типа WhatsApp) используя скомпрометированные инструменты. Архитектура MCP, основанная на доверии серверам, делает это особенно опасным.
#MCP #cybersecurity
———
@tsingular
✍3👍2
в ollama вышла granite 3.3 от IBM
https://ollama.com/library/granite3.3
Capabilities
Thinking
Summarization
Text classification
Text extraction
Question-answering
Retrieval Augmented Generation (RAG)
Code related tasks
Function-calling tasks
Multilingual dialog use cases
Fill-in-the-middle
Long-context tasks including long document/meeting summarization, long document QA, etc.
с размышлениями.
#granite #IBM #ollama
———
@tsingular
https://ollama.com/library/granite3.3
Capabilities
Thinking
Summarization
Text classification
Text extraction
Question-answering
Retrieval Augmented Generation (RAG)
Code related tasks
Function-calling tasks
Multilingual dialog use cases
Fill-in-the-middle
Long-context tasks including long document/meeting summarization, long document QA, etc.
с размышлениями.
#granite #IBM #ollama
———
@tsingular
✍4👍1
Azure MCP Server: новый стандарт уже в облаке
Microsoft официально выпустил Azure MCP Server — полноценную реализацию спецификации MCP, которая становится новым стандартом взаимодействия между AI-ассистентами и облачными сервисами.
Что внутри? Сервер обеспечивает бесшовную интеграцию с ключевыми сервисами Azure:
- 💾 Azure Storage (управление blob-контейнерами, доступ к таблицам)
- 📊 Azure Cosmos DB (работа с NoSQL базами)
- 📈 Azure Monitor и Log Analytics (запросы через KQL)
- ⚙️ Azure App Configuration (конфигурации приложений)
- 🔧 Azure CLI и Azure Developer CLI (azd) как полноценные расширения
Теперь вместо изучения API-документации разработчики могут просто писать "Покажи мои таблицы в Storage аккаунте" или "Сделай запрос к моей базе Cosmos DB".
Для бизнеса это означает:
1. Резкое снижение порога входа для работы с Azure
2. Ускорение DevOps-процессов через AI-ассистентов
3. Возможность делегировать рутинные операции управления AI
Пока проект в Public Preview (GA ожидается позже), но уже используется в связке с GitHub Copilot и поддерживает интеграцию через VS Code, Azure CLI, Azure PowerShell.
Установка через npx в одну команду, плюс готовая интеграция в VS Code — похоже, Microsoft всерьёз взялся за стандартизацию MCP как протокола общения между агентами и инфраструктурой.
#Azure #MCP #Microsoft
———
@tsingular
Microsoft официально выпустил Azure MCP Server — полноценную реализацию спецификации MCP, которая становится новым стандартом взаимодействия между AI-ассистентами и облачными сервисами.
Что внутри? Сервер обеспечивает бесшовную интеграцию с ключевыми сервисами Azure:
- 💾 Azure Storage (управление blob-контейнерами, доступ к таблицам)
- 📊 Azure Cosmos DB (работа с NoSQL базами)
- 📈 Azure Monitor и Log Analytics (запросы через KQL)
- ⚙️ Azure App Configuration (конфигурации приложений)
- 🔧 Azure CLI и Azure Developer CLI (azd) как полноценные расширения
Теперь вместо изучения API-документации разработчики могут просто писать "Покажи мои таблицы в Storage аккаунте" или "Сделай запрос к моей базе Cosmos DB".
Для бизнеса это означает:
1. Резкое снижение порога входа для работы с Azure
2. Ускорение DevOps-процессов через AI-ассистентов
3. Возможность делегировать рутинные операции управления AI
Пока проект в Public Preview (GA ожидается позже), но уже используется в связке с GitHub Copilot и поддерживает интеграцию через VS Code, Azure CLI, Azure PowerShell.
Установка через npx в одну команду, плюс готовая интеграция в VS Code — похоже, Microsoft всерьёз взялся за стандартизацию MCP как протокола общения между агентами и инфраструктурой.
#Azure #MCP #Microsoft
———
@tsingular
✍4👍1
Forwarded from Анализ данных (Data analysis)
This media is not supported in your browser
VIEW IN TELEGRAM
🦾 Исследователи NYU представили RUKA (да-да)
Это — открытый робот‑манипулятор с приводом на сухожилиях и 15 степенями свободы, стоимостью всего $1.3 тыс., который может работать 20 часов подряд без потери производительности.
Он обучается моделям «сустав–привод» и «кончик пальца–привод» на основе данных системы захвата движения.
🔜 Подробнее
@data_analysis_ml
Это — открытый робот‑манипулятор с приводом на сухожилиях и 15 степенями свободы, стоимостью всего $1.3 тыс., который может работать 20 часов подряд без потери производительности.
Он обучается моделям «сустав–привод» и «кончик пальца–привод» на основе данных системы захвата движения.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17
Не знаю зачем, но я нашёл этот стартап.
Они строят кластер для параллельных вычислений.
В Техасе.
https://higherorderco.com/
#macrack #hpc
------
@tsingular
Они строят кластер для параллельных вычислений.
В Техасе.
https://higherorderco.com/
#macrack #hpc
------
@tsingular
👍10
Forwarded from Точка сингулярности💥
Media is too big
VIEW IN TELEGRAM
🧬 Наглядно о качестве роликов от видеонейронки Kling 2.0. ИИ-картинка получается лучше реальности.
🧩 #ИИскусство
🧩 #ИИскусство
🔥25❤🔥5⚡4👍3💯1
🛠 InstructPipe: Google Research создаёт конкурента n8n и UiPath
Команда исследователей в Google выпустили интересный пропотип ассистента визуального low-code программиста.
Рассмотрим его чуть подробнее, пока он еще не стал мейнстримом и не подмял весь рынок.
Предыстория
Есть в Гугле такой проект - Rapsai, занимающийся визуальным программированием, в основном под пайплайны обработки видео, картинок и звука.
В проекте есть около 30 нод и все заточено на упрощение полного цикла медиа производства.
И вот они выкатили ассистента – InstructPipe, который позволяет одним запросом строить эти самые визуальные ноды.
Ну, сделали и сделали, скажете, но интересно как именно они это сделали и какие перспективы.
ИМХО тут огромный потенциал для конкуренции с лидерами рынка вроде n8n или UIPath:
1. Сообщение от пользователя анализируется и превращается в md файл с инструкциями по процессу создания нод.
2. Перечень инструментов (считай апи) тоже подается в контекст – стандартный агентский подход
3. Дальше ЛЛМка идет по инструкции для каждой ноды и прорабатывает ее согласно описанию ( у них всего 8К контекста в модели, поэтому разбили обработку на отдельные маленькие шаги)
4. Результат, вместе с мд инструкцией передается в кодового агента и уже он финалит ноды.
Ну и у них там встроенный визуализатор путей уже рабочий (VisualBlocks), поэтому оно сразу наглядно отображается.
По тестам на 16-ти кейсах текущий прототип уже сокращает количество действий на 81,1%!
Возможный выход на рынок через год
Если Google грамотно разыграет эту карту, мы увидим примерно такую эволюцию:
1. Расширение библиотеки нодов — в ближайшие полгода с 27 до 300-500 нодов
2. Интеграция с Google Cloud Services — прямой доступ к BigQuery, Vision API, Document AI и прочим
3. Enterprise-функционал — управление доступом, версионирование, логирование
4. Marketplace с community-нодами — без этого уже не модно
Уже прямо сейчас в их paper видны намёки на эти шаги — фокус на масштабировании, работе с "фирменными" ML-моделями Google.
Проблемы, которые пока не решены
1. Галлюцинации — модель иногда придумывает несуществующие ноды.
2. Ручная настройка параметров нодов — это не автоматизировано, в отличие от структуры пайплайна.
Запишем их в отдельный блокнотик перспективных проектов и будем продолжать наблюдение. Вернемся через год-полтора в пределах продуктового цикла Google.
Paper
Демки тут
GitHub
#InstructPipe #GoogleResearch #VisualBlocks #LowCode
———
@tsingular
Команда исследователей в Google выпустили интересный пропотип ассистента визуального low-code программиста.
Рассмотрим его чуть подробнее, пока он еще не стал мейнстримом и не подмял весь рынок.
Предыстория
Есть в Гугле такой проект - Rapsai, занимающийся визуальным программированием, в основном под пайплайны обработки видео, картинок и звука.
В проекте есть около 30 нод и все заточено на упрощение полного цикла медиа производства.
И вот они выкатили ассистента – InstructPipe, который позволяет одним запросом строить эти самые визуальные ноды.
Ну, сделали и сделали, скажете, но интересно как именно они это сделали и какие перспективы.
ИМХО тут огромный потенциал для конкуренции с лидерами рынка вроде n8n или UIPath:
1. Сообщение от пользователя анализируется и превращается в md файл с инструкциями по процессу создания нод.
2. Перечень инструментов (считай апи) тоже подается в контекст – стандартный агентский подход
3. Дальше ЛЛМка идет по инструкции для каждой ноды и прорабатывает ее согласно описанию ( у них всего 8К контекста в модели, поэтому разбили обработку на отдельные маленькие шаги)
4. Результат, вместе с мд инструкцией передается в кодового агента и уже он финалит ноды.
Ну и у них там встроенный визуализатор путей уже рабочий (VisualBlocks), поэтому оно сразу наглядно отображается.
По тестам на 16-ти кейсах текущий прототип уже сокращает количество действий на 81,1%!
Возможный выход на рынок через год
Если Google грамотно разыграет эту карту, мы увидим примерно такую эволюцию:
1. Расширение библиотеки нодов — в ближайшие полгода с 27 до 300-500 нодов
2. Интеграция с Google Cloud Services — прямой доступ к BigQuery, Vision API, Document AI и прочим
3. Enterprise-функционал — управление доступом, версионирование, логирование
4. Marketplace с community-нодами — без этого уже не модно
Уже прямо сейчас в их paper видны намёки на эти шаги — фокус на масштабировании, работе с "фирменными" ML-моделями Google.
Проблемы, которые пока не решены
1. Галлюцинации — модель иногда придумывает несуществующие ноды.
2. Ручная настройка параметров нодов — это не автоматизировано, в отличие от структуры пайплайна.
Запишем их в отдельный блокнотик перспективных проектов и будем продолжать наблюдение. Вернемся через год-полтора в пределах продуктового цикла Google.
Paper
Демки тут
GitHub
#InstructPipe #GoogleResearch #VisualBlocks #LowCode
———
@tsingular
👍2🔥2
🇦🇪 В ОАЭ создадут уникальную законодательную систему на базе ИИ
Кабинет министров ОАЭ утвердил создание первой в своем роде экосистемы регулирования на базе ИИ.
Ключевые моменты:
- Создание нового Управления регуляторного интеллекта при Кабинете министров
- ИИ будет отслеживать влияние законов на экономику и общество в режиме реального времени
- Ускорение законодательного процесса на 70% благодаря автоматизации
- Единая законодательная карта, связывающая федеральные и местные законы с судебными решениями
Техническая начинка:
- Технологии больших данных для анализа эффективности законов
- Автоматическое формирование предложений по обновлению законодательства
- Интеграция с глобальными исследовательскими центрами для сравнительного анализа
- Интеграция с судебными решениями, исполнительными процедурами и госуслугами
Практические результаты:
- Мгновенный анализ влияния законов на граждан и бизнес
- Более быстрое и точное законотворчество
- Постоянная актуализация законодательной базы без задержек
- Повышение конкурентоспособности ОАЭ на международной арене
Это продолжение более широкой стратегии ОАЭ по внедрению ИИ в госуправление.
Уже сейчас в судебной системе работают виртуальный юридический консультант, чат-боты по семейному праву и виртуальный сотрудник "Аиша" на базе генеративного ИИ.
ОАЭ уверенно создают одну из самых передовых правовых экосистем с ИИ в мире.
#законы #UAE #Legal
———
@tsingular
Кабинет министров ОАЭ утвердил создание первой в своем роде экосистемы регулирования на базе ИИ.
Ключевые моменты:
- Создание нового Управления регуляторного интеллекта при Кабинете министров
- ИИ будет отслеживать влияние законов на экономику и общество в режиме реального времени
- Ускорение законодательного процесса на 70% благодаря автоматизации
- Единая законодательная карта, связывающая федеральные и местные законы с судебными решениями
Техническая начинка:
- Технологии больших данных для анализа эффективности законов
- Автоматическое формирование предложений по обновлению законодательства
- Интеграция с глобальными исследовательскими центрами для сравнительного анализа
- Интеграция с судебными решениями, исполнительными процедурами и госуслугами
Практические результаты:
- Мгновенный анализ влияния законов на граждан и бизнес
- Более быстрое и точное законотворчество
- Постоянная актуализация законодательной базы без задержек
- Повышение конкурентоспособности ОАЭ на международной арене
Это продолжение более широкой стратегии ОАЭ по внедрению ИИ в госуправление.
Уже сейчас в судебной системе работают виртуальный юридический консультант, чат-боты по семейному праву и виртуальный сотрудник "Аиша" на базе генеративного ИИ.
ОАЭ уверенно создают одну из самых передовых правовых экосистем с ИИ в мире.
#законы #UAE #Legal
———
@tsingular
🔥6👍4
В Пекине прошёл первый в мире полумарафон роботов
В Пекине 20 роботов-гуманоидов бок о бок с тысячами людей преодолели дистанцию в 21 км!
Победитель — робот "Tiangong Ultra" с результатом 2 часа 40 минут. Этот 1,8-метровый механический бегун развивал скорость до 12 км/ч.
Серебро взял робот от Noetix Robotics, финишировав за 3 часа 27 минут, правда, с заменой во время гонки.
Бежали по разным трекам, чтобы не толкаться с людьми.
#robots #marathon #Beijing #Китай
------
@tsingular
В Пекине 20 роботов-гуманоидов бок о бок с тысячами людей преодолели дистанцию в 21 км!
Победитель — робот "Tiangong Ultra" с результатом 2 часа 40 минут. Этот 1,8-метровый механический бегун развивал скорость до 12 км/ч.
Серебро взял робот от Noetix Robotics, финишировав за 3 часа 27 минут, правда, с заменой во время гонки.
Бежали по разным трекам, чтобы не толкаться с людьми.
#robots #marathon #Beijing #Китай
------
@tsingular
🔥6
Microsoft дополнил MarkItDown интеграцией с MCP
Инструмент на Python для трансформации любых офисных документов в Markdown получил поддержку Model Context Protocol.
Пакет markitdown-mcp функционирует как легковесный STDIO и SSE сервер, предоставляя метод convert_to_markdown.
Поддерживает контейнеризацию в Docker.
Возможна интеграция с Claude Desktop.
Инструмент сохраняет структуру исходных документов (таблицы, заголовки, списки) при конвертации в формат Markdown.
Отладка возможна через mcpinspector, поддерживающей оба режима работы сервера.
Наконец-то можно скормить крупным языковым моделям документы без лишних заморочек!
#Microsoft #MarkItDown #MCP
------
@tsingular
Инструмент на Python для трансформации любых офисных документов в Markdown получил поддержку Model Context Protocol.
Пакет markitdown-mcp функционирует как легковесный STDIO и SSE сервер, предоставляя метод convert_to_markdown.
Поддерживает контейнеризацию в Docker.
Возможна интеграция с Claude Desktop.
Инструмент сохраняет структуру исходных документов (таблицы, заголовки, списки) при конвертации в формат Markdown.
Отладка возможна через mcpinspector, поддерживающей оба режима работы сервера.
Наконец-то можно скормить крупным языковым моделям документы без лишних заморочек!
#Microsoft #MarkItDown #MCP
------
@tsingular
👍6✍5