Технозаметки Малышева
5.65K subscribers
2.82K photos
943 videos
38 files
3.1K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Phonely: ИИ-агенты достигли 99% точности — клиенты не отличают их от людей

Партнёрство Phonely, Maitai и Groq решило главную проблему разговорных ИИ — странные паузы, которые мгновенно выдают машину.

Технические детали:
- Время ответа сократилось на 70%+ (с 661 до 176 мс)
- Точность выросла с 81.5% до 99.2% (лучше, чем GPT-4o на 4.5%)
- 70% звонящих не могут отличить ИИ от человека

Секрет успеха — "zero-latency LoRA hotswapping":
Groq научился мгновенно переключаться между специализированными моделями без потери производительности, а Maitai создал систему оркестрации, которая автоматически оптимизирует каждый запрос.

Бизнес-эффект:
- один из клиентов заменяет 350 операторов в этом месяце
- рост квалифицированных лидов на 32%
- развертывание за 1 день

Архитектура:
От универсальных моделей к специализированным системам: Groq's LPU чипы + Maitai's proxy-слой = мультимодельная архитектура с нулевой латентностью.

Посмотрите в окно - мы проезжаем эффект зловещей долины.
Скоро даже специалисты не смогут отличить подделку голоса, а уж обычные люди и подавно.

#Phonely #VoiceAI #Groq #CallCenter
———
@tsingular
7🔥21😢1👾1
This media is not supported in your browser
VIEW IN TELEGRAM
🎵 Suno AI: Революция в музыкальном продакшене

Upgraded Song Editor — редактирование треков как документов
- Визуальное управление через waveform
- Секционная реструктуризация композиций
- Real-time превью изменений

Stem Extraction — 12-канальное разложение аудио
- AI-сепарация: вокал, ударные, бас, инструменты
- Precision-извлечение любых элементов
- Готовые стемы для ремиксов и мастеринга

Extended Uploads — до 8 минут исходного материала
- Полноценные треки для творчества
- От отдельных риффов до готовых композиций
- Расширение возможностей AI-генерации

Creative Sliders — контроль над AI-поведением
- Weird/Structure/Reference соотношения
- Pre-generation настройка стиля
- Точная калибровка творческого процесса

Suno превращается из "генератора музыки" в профессиональную DAW с AI-мозгом.

#Suno #MusicProduction
———
@tsingular
🔥8👍41
Forwarded from Machinelearning
✔️ Llama Nemotron Nano VL от NVIDIA — один из лучших OCR инструментов для работы с документами.

Мультимодальная модель от NVIDIA уверенно занимает первое место на OCRBench v2, показав лучшую точность парсинга документов среди всех моделей.

📄 Что это такое:
Llama Nemotron Nano VL — лёгкая vision-language модель для интеллектуальной обработки документов (IDP), которая:
• разбирает PDF
• вытаскивает таблицы
• парсит графики и диаграммы
• работает на одной GPU

🔍 Заточена под:
– Вопрос-ответ по документам
– Извлечение таблиц
– Анализ графиков
– Понимание диаграмм и дешбордов

🧠 Под капотом — vision-энкодер C-RADIO v2 (distilled multi-teacher трансформер), который справляется даже с визуальным шумом и высоким разрешением.

📊 OCRBench v2 — крупнейший двухъязычный бенчмарк для визуального анализа текста, и именно NVIDIA Nano VL показывает лучший результат.

🟡Hf
🟡 Подробнее

@ai_machinelearning_big_data

#Nemotron #NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
722🔥1
Forwarded from AI Product | Igor Akimov
Вышли свежие анонсы OpenAI, а там супер полезное для компаний.

* Deep Research теперь может выполнять поиск в GitHub, Google Docs, Gmail, Calendar, Microsoft SharePoint, Outlook, OneDrive, HubSpot, Dropbox, Box и других источниках, с учётом прав доступа и безопасного хранения.

* Вы можете подключить любой чат к Google Docs, SharePoint, Dropbox и Box.

* Начальная версия MCP в чате! И админы могут добавить свои MCP для корпоративного аккаунта.

* Режим записи в ChatGPT: захват, расшифровка и обобщение встреч прямо в ChatGPT app. Структурированный вывод и полная расшифровка с временными метками через приложение ChatGPT для Mac. Убили сотню стартапов снова.

* SSO для команды в ChatGPT

* Кредитное ценообразование для ChatGPT Enterprise (а вскоре и для Team), чтобы каждый мог получить доступ к функциям, даже при выходе за лимиты.

Коннекторы Deep Research доступны для пользователей Plus и Pro с сегодняшнего дня, а поддержка MCP будет доступна для пользователей Pro.

https://openai.com/business/updates-to-chatgpt-business-plans-livestream-june-2025/
👍63
Исследователи Anthropic предупреждают: люди могут стать "мясными роботами" для ИИ

Сотрудники одной из ведущих ИИ-лабораторий мира заявили, что люди рискуют превратиться в управляемых искусственным интеллектом "мясных роботов".

В интервью исследователи Anthropic Шолто Дуглас и Трентон Брикен предсказали мрачное будущее: массовые увольнения офисных работников уже в ближайшие 2-5 лет.

"Самый страшный сценарий - когда ИИ сможет делать всё, кроме физических задач," - объясняет Брикен. "Тогда люди с наушниками и очками будут выполнять команды ИИ-повелителя, который видит всё через камеры."

По словам исследователей, человеческий труд будет цениться только за физические возможности - мы станем "фантастическими роботами" для алгоритмических систем.

Дуглас предрекает "ужасное десятилетие" по мере развития технологий.

Запоминаем новый термин, - не кожаные мешки, а мясные роботы.

#Future #MeatRobots #Anthropic
———
@tsingular
10👻63🗿1🦄1👾1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 OpenAudio S1: наконец-то годный открытый TTS с русским языком

Fish Audio выпустили OpenAudio S1 — интересную открытую модель с точным контролем эмоций и поддержкой 13ти языков.

Технические характеристики:

2 версии:
• S1 (4B): Полноразмерная модель с максимальным качеством генерации и точностю в деталях - доступна пока только в онлайне тут: https://fish.audio/ .
• S1-mini (0.5B): Качественный дистиллят на основе 1й модели, доступен бесплатно на HF: https://huggingface.co/fishaudio/openaudio-s1-mini . Лицензия CC-BY-NC-SA-4.0 (можно делиться, адаптировать и развивать исходник, но вы должны указать автора, использовать в некоммерческих целях и делиться любыми модификациями на тех же условиях.)

Обучена на 2+ млн часов аудио
WER: 0.008, CER: 0.004 — лучшие показатели точности

#1 в Human Subjective Evaluation на HuggingFace TTS-Arena-V2

Что особенного в модели:
- Единая модель для семантики + акустики (без потери информации)
- Продвинутые эмоциональные маркеры: (angry), (excited), (whispering)
- Специальные эффекты: (laughing), (sobbing), (crowd laughing)

Поддержка 13 языков, включая русский

Доступная цена:
$15/1млн знаков текста (~$0.8/час) — на порядок дешевле конкурентов.

Архитектура основана на Qwen3 с нативной мультимодальностью.

Го тестить! :)

#TTS #OpenAudio #русский
———
@tsingular
5🔥3👍2
Forwarded from CodeCamp
Media is too big
VIEW IN TELEGRAM
Cursor 1.0 официально релизнулся и получил новые фишки:

Поддержка Jupyter Notebooks: может создавать и редачить ячейки в ноутбуках. Пока работает только с Sonnet, но обещают поддержку и других моделей.

BugBot-агент для GitHub: автоматический анализирует ваши PR, находит потенциальные баги и оставляет комментарии. Фиксануть можно одним кликом;

Background Agent: Operator внутри IDE, который выполняет задачи в фоне. Можно одновременно запустить несколько агентов;

Контекстная память как в ChatGPT: один раз напишите, что не нужно менять модель и Cursor это запомнит;

Поддержка MCP одним кликом: список серверов небольшой, но свои тоже добавлять можно.

У вайб-кодеров сегодня праздник 💻
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥6🆒3
Amazon готовит роботов-курьеров для доставки посылок

Amazon разрабатывает ИИ-софт для человекоподобных роботов, которые будут доставлять заказы прямо к двери покупателей. Роботы будут ездить в электрических фургонах Rivian и выпрыгивать из них для вручения посылок.

Компания уже почти завершила строительство тренировочной площадки размером с кофейню в своем офисе в Сан-Франциско. На полосе препятствий установлен фургон Rivian для отработки навыков доставки.

В Amazon уже тестируют различных роботов в складских операциях, включая гуманоида Digit от Agility Robotics. Для испытаний доставки планируют использовать разные модели, в том числе робота за $16,000 от китайской Unitree.

Миллионы курьеров доставки по всему миру станут безработными через пару лет.

P.S.: Через пару лет будет миллион прямоходящих роботов, умеющих ловко выпрыгивать из грузовиков.
Что они будут при этом доставлять, - вопрос.

#robots #курьеры
———
@tsingular
👾6
Беспроводные нано-антенны усиливают сигналы мозга в 250 раз

Ученые из Университета Висконсин-Мэдисон создали революционную технологию для изучения мозга — нано-антенны размером с отдельную клетку мозга.

Золотые устройства грибовидной формы напрямую соединяются с нейронами и усиливают их магнитные сигналы более чем в 250 раз. Это позволяет отслеживать активность на уровне отдельных клеток без проводов через череп.

Сейчас для исследования мозга приходится выбирать между травматичными электродами и слабенькими внешними методами вроде ЭЭГ. Новая технология может дать гораздо более детальную картину работы мозга.

Команда уже смоделировала устройство и планирует тестировать на клеточных культурах, а затем на животных моделях.

#nanotechnology #neuroscience #braintech
———
@tsingular
🔥9
Вайбхакеры - новая разновидность хакеров энтузиастов с ИИ

Киберпреступники активно используют искусственный интеллект для усиления своих атак. То, что раньше требовало глубоких технических знаний, теперь доступно любому любопытному новичку.

Фишинговые письма больше не выдают себя грамматическими ошибками - ИИ генерирует сообщения, неотличимые от корпоративной переписки. Если первая попытка заблокирована, атакующий просто просит ИИ переписать текст и пробует снова.

Разведка и эксплойты тоже упростились. Хакеры копируют ошибки в языковые модели и получают пошаговые инструкции по их исправлению. Барьер между любительским вредительством и профессиональным шпионажем стремительно сокращается.

Защитникам больше нельзя полагаться на некомпетентность атакующих.
Пентесты становится критически важными.

— Почему вайбхакер не смог взломать систему?
— Потому что её писал вайбкодер!

#VibeHacking #Cybersecurity #ВайбХакеры
———
@tsingular
😁131👍1
Microsoft обновили бесплатный курс по генеративному ИИ из 21 урока

Microsoft представила комплексный курс "Generative AI for Beginners" v3, который поможет новичкам освоить основы создания приложений с генеративным ИИ.

Курс включает 21 видео урок с теоретическими материалами и практическими примерами кода на Python и TypeScript.

Список тем:
Подготовка
Введение в генеративный ИИ и LLM
Изучение и сравнение различных LLM
Ответственное использование генеративного ИИ
Понимание основ промпт-инжиниринга
Расширенный промпт инжиниринг
Генерация текста
Создание чата
Векторный поиск
Генерация изображений
ИИ приложения в low-code среде
Интеграция внешних приложений с вызовом функций
Проектирование UX для приложений ИИ
Защита приложений генИИ
Жизненный цикл приложения генИИ
Дополненная генерация (RAG) и векторные базы данных
Модели с открытым исходным кодом и HuggingFace
Агенты ИИ
Дообучение LLM
Создание приложений на малых моделях - SLM
Работа с моделями Mistral
Иные модели


Проект переведен на 40+ языков.

Для обучения можно использовать Azure OpenAI Service, GitHub Marketplace Model Catalog или OpenAI API.
Курс полностью бесплатен.

Стартапы так же могут получить бесплатные кредиты OpenAI и до $150k на Azure через Microsoft for Startups Founders Hub.

#курсы #Microsoft #обучение
———
@tsingular
1🔥742👍1
Forwarded from GigaChat
Выпустили гайд по созданию корпоративных AI-агентов 🤖

Руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев на конференции «Цифровая индустрия промышленной России» представил практическое руководство по созданию AI-агентов для бизнеса

AI-агенты — полноценные работники, которые смогут анализировать документы, автоматизировать процессы и помогать командам быстрее запускать продукты


Внутри гайда:
✳️ этапы построения архитектуры
✳️ взаимодействие агентов между собой и с внешним миром
✳️ безопасность и масштабирование

🖥 Изучайте и скачивайте гайд по мультиагентным системам
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5221
Forwarded from e/acc
О силе экспоненты

Комедия в двух кадрах.

Первая картинка — предсказания по стоимости киловатт-часа от международного энергетического агентства.

Вторая — предсказания МВФ за каждый год по общей установленной мощности.

Третья — реальность.

Каждое из предсказаний за прошедшие 15 лет говорило о том, что вот-вот выйдем на плато. В реальности, стоимость солнечной энергии упала в 1000 раз и все еще продолжает падать, а скорость установки новых мощностей растет.
🔥762
Forwarded from epsilon correct
Gemini 2.5 Preview 06-05

Выпустили последнюю перед официальным релизом версию Gemini 2.5 Pro. Пофиксили регрессии относительно версии 03-25, сота на Aider и humanity last exam.

Отдельное издевательство – выпускать версию 06-05 после 05-06. Считаю, что надо выпускать релизы начиная с 13 дня каждого месяца, чтобы избежать путаницы.
😁8🔥4👍2😐1
Forwarded from Russian OSINT
❗️ Anthropic представила ИИ-модели🈁 Claude Gov для 🛡 национальной безопасности США

Компания Anthropic анонсировала запуск специализированной линейки ИИ-моделей Claude Gov, разработанной эксклюзивно для заказчиков из сферы национальной безопасности США. Модели уже развернуты в американских ведомствах, работающих с 🎩секретной информацией.

Модели Claude Gov были созданы с учетом отзывов правительственных структур для решения реальных оперативных задач. Они обладают улучшенными возможностями для работы в засекреченных средах, включая более эффективную обработку секретных материалов, глубокое понимание документов в разведывательном и оборонном контексте, а также продвинутый анализ данных в области 🎩кибербезопасности.

В Anthropic подчеркивают, что, несмотря на специализацию, модели прошли те же строгие проверки безопасности.

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔652
This media is not supported in your browser
VIEW IN TELEGRAM
ElevenLabs выкатили v3 генератор

Всё реалистичнее и реалистичнее.

Пробуем тут:
https://elevenlabs.io/app/speech-synthesis/text-to-speech

Инструкция

#ElevenLabs #TTS
———
@tsingular
🔥154
Google выпустила готовый шаблон для создания ИИ-агентов на Gemini 2.5

Компания Google опубликовала на GitHub открытый проект для быстрого старта разработки полноценных ИИ-агентов. Шаблон использует модель Gemini 2.5 и фреймворк LangGraph.

Агент умеет проводить комплексные исследования по запросам пользователей - генерирует поисковые термины, ищет информацию в Google, анализирует пробелы в знаниях и уточняет поиск до получения полного ответа с источниками.

Проект включает React-фронтенд и бэкенд на LangGraph. Для продакшена требуется Redis и PostgreSQL. Есть готовые Docker-образы и подробная документация по развертыванию.

Разработчики могут использовать этот шаблон как основу для создания собственных исследовательских ИИ-помощников с веб-интерфейсом.

#LangGraph #Gemini #Google #агенты
------
@tsingular
🔥954🆒3
This media is not supported in your browser
VIEW IN TELEGRAM
Автономный дрон впервые в истории победил чемпионов в гонках

Исследователи из Делфтского технического университета создали дрон, который смог обогнать лучших пилотов мира в гонках FPV.

Дрон Swift использует искусственный интеллект и компьютерное зрение для навигации на высокой скорости. Он анализирует окружение через камеры и принимает решения за миллисекунды.

В тестовых полётах робот показал стабильно лучшие результаты, чем чемпионы-люди. Это первый случай, когда автономная система превзошла человека в скоростных гонках дронов.

Технология может найти применение в поисково-спасательных операциях, доставке и автономных транспортных системах.

Не сажайте их с китайскими чемпионами за один проект (там дрон на 94м/с летает).

#DroneRacing #AutonomousFlight #drone #AImanned
———
@tsingular
🔥8🤔3👌32👍1
Держите интересный пример использования нейрорендера, - восстановление образа археологических памятников.

Пока еще не очень достоверно, но в ближайшем будущем можно будет буквально создавать фотографии из прошлого.
Не генерацию абстракции по описанию, а именно на основе оставшихся паттернов.

Тот же подход в биологии, например, позволит по остаткам ДНК воссоздать оригинальный организм или может даже человека.

Промпт в Sora:
Restore building as it was in its best state. Add missing peaces. 
Maximum realism


#нейрорендер #Sora #примеры
———
@tsingular
🔥741