Microsoft добавляет в Блокнот функцию AI-редактирования текста
Функция Rewrite появится в базовом Блокноте Windows.
Утилита позволяет перефразировать предложения, настраивать тональность и изменять размер текста.
Нововведение на данный момент доступно пользователям Windows Insiders в США, Великобритании, Франции, Канаде, Италии и Германии.
Работа системы требует облачной авторизации через учетную запись. В России только через смену страны привязки профиля и VPN.
Функционал дополняет недавно внедренную проверку орфографии и автокоррекцию.
Параллельно компания тестирует ИИ-инструменты для редактирования изображений в Paint.
ИИ становится базовой функцией офисных ПК.
#Microsoft #Notepad #Rewrite
-------
@tsingular
Функция Rewrite появится в базовом Блокноте Windows.
Утилита позволяет перефразировать предложения, настраивать тональность и изменять размер текста.
Нововведение на данный момент доступно пользователям Windows Insiders в США, Великобритании, Франции, Канаде, Италии и Германии.
Работа системы требует облачной авторизации через учетную запись. В России только через смену страны привязки профиля и VPN.
Функционал дополняет недавно внедренную проверку орфографии и автокоррекцию.
Параллельно компания тестирует ИИ-инструменты для редактирования изображений в Paint.
ИИ становится базовой функцией офисных ПК.
#Microsoft #Notepad #Rewrite
-------
@tsingular
🔥3
Microsoft представила Magentic-One: мульти-агентную систему следующего поколения
Microsoft Research анонсировала передовую мульти-агентную систему на базе AutoGen framework.
Ключевая особенность - пять специализированных агентов под управлением главного оркестратора.
Система демонстрирует state-of-the-art результаты в тестах GAIA, AssistantBench и WebArena.
Архитектура включает работу с файлами, веб-навигацию, программирование и выполнение кода.
Оркестратор: главный агент, который разбивает задачи на части, планирует работу, руководит остальными агентами и следит, чтобы всё шло по плану. Если что-то идёт не так - вносит исправления.
WebSurfer: агент на базе LLM, который умеет управлять браузером на основе Chromium. Когда получает запрос - выполняет действие в браузере и докладывает, что изменилось на странице. Что умеет делать:
- переходить по ссылкам и искать в интернете
- кликать и печатать на страницах
- читать контент (делать краткие выжимки, отвечать на вопросы)
Для работы использует дерево доступности браузера и специальные промпты с метками.
FileSurfer: агент на базе LLM, который работает с программой просмотра файлов в формате markdown. Может читать почти любые локальные файлы. Умеет просматривать содержимое папок и перемещаться между ними.
Coder: агент на базе LLM, заточенный на написание кода. Анализирует информацию от других агентов и создаёт новые файлы/программы.
ComputerTerminal: дает команде доступ к консоли, где можно запускать программы от Coder'а и ставить новые библиотеки.
Task Ledger и Progress Ledger обеспечивают отслеживание задач и прогресса.
Поддерживает различные LLM модели, включая GPT-4o и OpenAI o1-preview.
Особое внимание уделено безопасности - система работает в изолированных контейнерах с проверкой.
Выглядит очень интересно. Пробуем.
#Microsoft #MagenticOne #AutoGen
-------
@tsingular
Microsoft Research анонсировала передовую мульти-агентную систему на базе AutoGen framework.
Ключевая особенность - пять специализированных агентов под управлением главного оркестратора.
Система демонстрирует state-of-the-art результаты в тестах GAIA, AssistantBench и WebArena.
Архитектура включает работу с файлами, веб-навигацию, программирование и выполнение кода.
Оркестратор: главный агент, который разбивает задачи на части, планирует работу, руководит остальными агентами и следит, чтобы всё шло по плану. Если что-то идёт не так - вносит исправления.
WebSurfer: агент на базе LLM, который умеет управлять браузером на основе Chromium. Когда получает запрос - выполняет действие в браузере и докладывает, что изменилось на странице. Что умеет делать:
- переходить по ссылкам и искать в интернете
- кликать и печатать на страницах
- читать контент (делать краткие выжимки, отвечать на вопросы)
Для работы использует дерево доступности браузера и специальные промпты с метками.
FileSurfer: агент на базе LLM, который работает с программой просмотра файлов в формате markdown. Может читать почти любые локальные файлы. Умеет просматривать содержимое папок и перемещаться между ними.
Coder: агент на базе LLM, заточенный на написание кода. Анализирует информацию от других агентов и создаёт новые файлы/программы.
ComputerTerminal: дает команде доступ к консоли, где можно запускать программы от Coder'а и ставить новые библиотеки.
Task Ledger и Progress Ledger обеспечивают отслеживание задач и прогресса.
Поддерживает различные LLM модели, включая GPT-4o и OpenAI o1-preview.
Особое внимание уделено безопасности - система работает в изолированных контейнерах с проверкой.
Выглядит очень интересно. Пробуем.
#Microsoft #MagenticOne #AutoGen
-------
@tsingular
🔥3
небольшой оффтопик, - а ведь сейчас за 4 года можно было бы двинуть отличную тему,- ИИ в президенты 2028.
У Маска сейчас карт-бланш, технологии готовы, в принципе. why not?
#выборы #США
———
@tsingular
У Маска сейчас карт-бланш, технологии готовы, в принципе. why not?
#выборы #США
———
@tsingular
🤣6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Mochi видео генератор, которому пару недель назад нужно было 4 H100 для запуска, поднялся у меня на локальном серваке на 2х4090.
И теперь, не выходя в интернет, можно уверенно вот такие ролики по 120 кадров создавать 24х7.
Это текст2видео, но, наверное, через клипвижн можно и картинку2видео сделать. Ip-адаптеров пока нет только, так что точного переноса формы пока не сделать, но, думаю, скоро подтянутся.
Вообще фантастика, как за год мы от облачных Уилл Смитов с макаронами перешли к вполне консистентному видеоряду на локальных ПК.
#видео #ComfyUI #mochi #нейрорендер
———
@tsingular
И теперь, не выходя в интернет, можно уверенно вот такие ролики по 120 кадров создавать 24х7.
Это текст2видео, но, наверное, через клипвижн можно и картинку2видео сделать. Ip-адаптеров пока нет только, так что точного переноса формы пока не сделать, но, думаю, скоро подтянутся.
Вообще фантастика, как за год мы от облачных Уилл Смитов с макаронами перешли к вполне консистентному видеоряду на локальных ПК.
#видео #ComfyUI #mochi #нейрорендер
———
@tsingular
🔥12
Первая в мире нейроинтеграция ИИ с мозгом живого существа
Отечественные нейробиологи достигли исторического прорыва в области прямого подключения искусственного интеллекта к биологическому мозгу.
Эксперимент включал разработку специального импланта для интеграции нейронных сетей с живой нервной тканью.
Подопытная особь демонстрирует стабильный отклик на нейроинтерфейс, что подтверждает успешность технологии.
Достижение открывает перспективы развития биокибернетических систем и нейропротезирования.
Похоже, киборги уже не фантастика. Главное, чтобы крысы не захватили мир через нейросеть! 🐀🤖
Крыса с нейроимплантом выбирает правильные ответы. Идеально для голосований 😀
#neuroscience #biotech #implant
-------
@tsingular
Отечественные нейробиологи достигли исторического прорыва в области прямого подключения искусственного интеллекта к биологическому мозгу.
Эксперимент включал разработку специального импланта для интеграции нейронных сетей с живой нервной тканью.
Подопытная особь демонстрирует стабильный отклик на нейроинтерфейс, что подтверждает успешность технологии.
Достижение открывает перспективы развития биокибернетических систем и нейропротезирования.
Похоже, киборги уже не фантастика. Главное, чтобы крысы не захватили мир через нейросеть! 🐀🤖
Крыса с нейроимплантом выбирает правильные ответы. Идеально для голосований 😀
#neuroscience #biotech #implant
-------
@tsingular
🔥12✍2🆒2
Forwarded from Denis Sexy IT 🤖
Поигрался тут с новой моделью генерации картинок Flux Pro 1.1 Ultra Raw, количество деталей – мое почтение
16 картинок стоят $1
Если будете с ней играться, то имейте ввиду что ей нужны простыни текста в виде промптов – я свои с o1-mini делал
Скоро подключим в нейролав со своим промптингом
16 картинок стоят $1
Если будете с ней играться, то имейте ввиду что ей нужны простыни текста в виде промптов – я свои с o1-mini делал
Скоро подключим в нейролав со своим промптингом
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
ReCapture: революция в пересъёмке видео с любого ракурса
Исследователи Google представили поразительный новый метод - ReCapture, позволяющий генерировать новые версии существующих видео с различных углов съёмки!
Технология использует комбинацию диффузионных моделей и облака точек для создания промежуточного кадра, который затем улучшается специальным алгоритмом.
Система способна достраивать невидимые части сцены и добавлять кинематографические движения камеры, сохраняя исходную динамику.
Обработка занимает всего 5 минут на GPU A100 при разрешении 384×256 пикселей.
Был такой фильм - «Дежа вю» (Déjà Vu) 2006 года про взрыв парома в будущем, если кто помнит. Один в один получается.
Разрешение чуть поднять и будет отлично. 🎬
Помнится лет 10 назад обсуждали так же в плане футурологии, что скоро фотоаппараты как таковые будут не нужны.
Когда весь мир будет покрыт 8К камерами, - можно просто вернуться в любой момент времени, развернуть нужный ракурс и снять картинку, а ИИ дорисует как было, достроит недостающие детали.
И получается не нужно будет самому копаться во всех инструментах, - просто просим бота, а он уже мгновенно показывает нам картинку или видео ряд из прошлого, а там, глядишь и из будущего.
#ReCapture #VideoProcessing #DiffusionModels
-------
@tsingular
Исследователи Google представили поразительный новый метод - ReCapture, позволяющий генерировать новые версии существующих видео с различных углов съёмки!
Технология использует комбинацию диффузионных моделей и облака точек для создания промежуточного кадра, который затем улучшается специальным алгоритмом.
Система способна достраивать невидимые части сцены и добавлять кинематографические движения камеры, сохраняя исходную динамику.
Обработка занимает всего 5 минут на GPU A100 при разрешении 384×256 пикселей.
Был такой фильм - «Дежа вю» (Déjà Vu) 2006 года про взрыв парома в будущем, если кто помнит. Один в один получается.
Разрешение чуть поднять и будет отлично. 🎬
Помнится лет 10 назад обсуждали так же в плане футурологии, что скоро фотоаппараты как таковые будут не нужны.
Когда весь мир будет покрыт 8К камерами, - можно просто вернуться в любой момент времени, развернуть нужный ракурс и снять картинку, а ИИ дорисует как было, достроит недостающие детали.
И получается не нужно будет самому копаться во всех инструментах, - просто просим бота, а он уже мгновенно показывает нам картинку или видео ряд из прошлого, а там, глядишь и из будущего.
#ReCapture #VideoProcessing #DiffusionModels
-------
@tsingular
👍5🤯2
Минобороны США внедряет Claude для анализа разведданных
Anthropic, Palantir и AWS заключили партнерство для интеграции Claude в оборонные ведомства США.
Развертывание происходит в AWS GovCloud с высшим уровнем защиты IL6 для секретных данных.
Система будет анализировать разведданные, выявлять скрытое влияние и предупреждать о военных угрозах.
Госконтракты на ИИ-решения выросли на 1200% в марте 2024.
Amazon, крупнейший инвестор Anthropic, оценивает компанию в $40 млрд.
Нужен суверенный ИИ. Без вопросов.
#Anthropic #Palantir #Claude
-------
@tsingular
Anthropic, Palantir и AWS заключили партнерство для интеграции Claude в оборонные ведомства США.
Развертывание происходит в AWS GovCloud с высшим уровнем защиты IL6 для секретных данных.
Система будет анализировать разведданные, выявлять скрытое влияние и предупреждать о военных угрозах.
Госконтракты на ИИ-решения выросли на 1200% в марте 2024.
Amazon, крупнейший инвестор Anthropic, оценивает компанию в $40 млрд.
Нужен суверенный ИИ. Без вопросов.
#Anthropic #Palantir #Claude
-------
@tsingular
👍19💯16
This media is not supported in your browser
VIEW IN TELEGRAM
You.com запускает ARR - исследователя
Advanced Research & Reasoning преобразует отдельные поисковые запросы в полноценные исследовательские процессы.
(один в один, как у меня в ботах год назад было сделано :) )
Система анализирует до 200 источников на каждый запрос, демонстрируя ход размышлений в реальном времени.
Пользователи получают возможность проверять первоисточники и отслеживать весь путь исследования пошагово.
Надо сказать очень детально и развёрнуто получается.
Объём генерации тянет на документ, а не просто на короткий ответ.
p.s. Работает бесплатно и без VPN (3 таких запроса в день)
#You #research
———
@tsingular
Advanced Research & Reasoning преобразует отдельные поисковые запросы в полноценные исследовательские процессы.
(один в один, как у меня в ботах год назад было сделано :) )
Система анализирует до 200 источников на каждый запрос, демонстрируя ход размышлений в реальном времени.
Пользователи получают возможность проверять первоисточники и отслеживать весь путь исследования пошагово.
Надо сказать очень детально и развёрнуто получается.
Объём генерации тянет на документ, а не просто на короткий ответ.
p.s. Работает бесплатно и без VPN (3 таких запроса в день)
#You #research
———
@tsingular
🔥5✍3
Media is too big
VIEW IN TELEGRAM
XPENG в рамках XPENG AI DAY 2024 запускает гуманоидного робота Iron
Китайский автопроизводитель XPENG представил человекоподобного помощника Iron ростом 178 см и весом 70 кг.
Механический ассистент оснащён тактильными датчиками в руках с 15 степенями свободы и более 60 суставами.
Устройство функционирует на базе процессора Turing AI с 40 ядрами, поддерживающего нейросети до 30 млрд параметров.
Платформа Canghai обеспечивает автономное управление уровня L4, ускоряя обработку данных в 33 раза.
Робот уже трудится на автомобильном заводе компании, используя те же технологии, что и в транспортных средствах XPENG.
Китайцы не отстают от Tesla - скоро роботы будут собирать роботов! 🤖🏭
#XPENG #Iron #Китай
———
@tsingular
Китайский автопроизводитель XPENG представил человекоподобного помощника Iron ростом 178 см и весом 70 кг.
Механический ассистент оснащён тактильными датчиками в руках с 15 степенями свободы и более 60 суставами.
Устройство функционирует на базе процессора Turing AI с 40 ядрами, поддерживающего нейросети до 30 млрд параметров.
Платформа Canghai обеспечивает автономное управление уровня L4, ускоряя обработку данных в 33 раза.
Робот уже трудится на автомобильном заводе компании, используя те же технологии, что и в транспортных средствах XPENG.
Китайцы не отстают от Tesla - скоро роботы будут собирать роботов! 🤖🏭
#XPENG #Iron #Китай
———
@tsingular
🔥5👍1
CrowdStrike запускает AI Red Team - службу безопасности систем искусственного интеллекта
Компания запустила комплексный сервис AI Red Team Services для защиты генеративных моделей и LLM.
Специалисты фокусируются на семи ключевых направлениях: утечки данных, уязвимости API, риски интеграций, атаки через отравление данных, выполнение вредоносного кода и манипуляции с конфиденциальной информацией.
Методология включает пентесты, Red Team задачи и тестирование по OWASP Top 10 для LLM-приложений.
Подход основан на проактивной оценке рисков и кастомизации под конкретные сценарии применения искусственного интеллекта.
Полезный сервис, кстати, у среднего и малого бизнеса не всегда до такого руки доходят.
У нас бы тоже ИБшному крупняку подумать над подобными сервисами было бы полезно.
Каспер или Позитив могли бы вполне запустить подобное. 🤖🔐
#CrowdStrike #RedTeam #cybersecurity
-------
@tsingular
Компания запустила комплексный сервис AI Red Team Services для защиты генеративных моделей и LLM.
Специалисты фокусируются на семи ключевых направлениях: утечки данных, уязвимости API, риски интеграций, атаки через отравление данных, выполнение вредоносного кода и манипуляции с конфиденциальной информацией.
Методология включает пентесты, Red Team задачи и тестирование по OWASP Top 10 для LLM-приложений.
Подход основан на проактивной оценке рисков и кастомизации под конкретные сценарии применения искусственного интеллекта.
Полезный сервис, кстати, у среднего и малого бизнеса не всегда до такого руки доходят.
У нас бы тоже ИБшному крупняку подумать над подобными сервисами было бы полезно.
Каспер или Позитив могли бы вполне запустить подобное. 🤖🔐
#CrowdStrike #RedTeam #cybersecurity
-------
@tsingular
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Ollama добавила визуальную модель Llama 3.2!
Фреймворк Ollama интегрировал мультимодальную Llama 3.2 Vision в две конфигурации.
Компактная версия 11B функционирует на видеокартах от 8GB VRAM, мощная 90B требует 64GB видеопамяти (чёрно завидуем Маководам!).
Аллилуйя!! Убежал тестировать.
11b-instruct-fp16 - 21GB
90b-instruct-q4_K_M 55GB
90b-instruct-fp16 177GB!!!
В общем, если у вас 24Гига - берите llava34b все-таки.
если меньше - llama 3.2-vision:11b
#Ollama #Llama #Vision
———
@tsingular
Фреймворк Ollama интегрировал мультимодальную Llama 3.2 Vision в две конфигурации.
Компактная версия 11B функционирует на видеокартах от 8GB VRAM, мощная 90B требует 64GB видеопамяти (чёрно завидуем Маководам!).
Аллилуйя!! Убежал тестировать.
11b-instruct-fp16 - 21GB
90b-instruct-q4_K_M 55GB
90b-instruct-fp16 177GB!!!
В общем, если у вас 24Гига - берите llava34b все-таки.
если меньше - llama 3.2-vision:11b
#Ollama #Llama #Vision
———
@tsingular
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
CogVideoX1.5: революция в генерации видео
THUDM выпустила обновлённую версию генеративной модели для создания видеоконтента из текста и изображений.
Улучшенная версия CogVideoX1.5-5B-SAT поддерживает формирование 10-секундных роликов с высоким разрешением.
Инструмент включает модули Text-to-Video и Image-to-Video с гибкими настройками параметров.
Оригинальные веса требуют 66+ видеопамяти, но умельцы уже нарезали пайплайны под ComfyUI и даже собрали что-то под 10 гигабайт.
5 минут на локальную генерацию вот примерно такого качества, но в документации пишут, что можно "вообще любое разрешение", причём не исходное, а именно в финальном видео!
В общем, Китай всех делает.
Думал брать подписку на какой-нибудь Минимакс, но уже, похоже не нужно.
В заставке - результат локальной генерации из статической картинки.
UPD: оказывается это под 1.1 старую модель был процесс. Новую ещё ждём.
GitHub
ComfyUI-CogVideoXWrapper
#CogVideo #THUDM #videoGeneration #Китай
———
@tsingular
THUDM выпустила обновлённую версию генеративной модели для создания видеоконтента из текста и изображений.
Улучшенная версия CogVideoX1.5-5B-SAT поддерживает формирование 10-секундных роликов с высоким разрешением.
Инструмент включает модули Text-to-Video и Image-to-Video с гибкими настройками параметров.
Оригинальные веса требуют 66+ видеопамяти, но умельцы уже нарезали пайплайны под ComfyUI и даже собрали что-то под 10 гигабайт.
5 минут на локальную генерацию вот примерно такого качества, но в документации пишут, что можно "вообще любое разрешение", причём не исходное, а именно в финальном видео!
В общем, Китай всех делает.
Думал брать подписку на какой-нибудь Минимакс, но уже, похоже не нужно.
В заставке - результат локальной генерации из статической картинки.
UPD: оказывается это под 1.1 старую модель был процесс. Новую ещё ждём.
GitHub
ComfyUI-CogVideoXWrapper
#CogVideo #THUDM #videoGeneration #Китай
———
@tsingular
⚡4❤1