Технозаметки Малышева
8.48K subscribers
3.79K photos
1.42K videos
40 files
3.97K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Интересный кейс из Кении, показывающий высокий спрос на инструмент, облегчающий понимание действующего и будущего законодательства и выступающий посредником между юридически неподготовленным пользователем и законодателем.

13 июня 2024-го программист Келвин Онкунди Ндемо загрузил в сеть ИИ-помощника на основе ChatGPT, который отвечал пользователям на вопросы о законопроекте о бюджете и переводил его статьи с юридического жаргона на человеческий язык. Ндемо обучил своего чат-бота на тексте законопроекта и «нескольких журналистских материалах», а позднее – на докладе комитета по финансам и планированию.
 
В течение уже первой недели бот обработал 50 тыс. запросов: например, подсчитывал пользователям, сколько шиллингов им придется переплатить за буханку хлеба с повышением НДС или как новый экосбор скажется на стоимости масла и других продуктов.

Чем закончилось, читаем тут

#Кения #законы #боты
———-
@tsingular
5🔥421
Media is too big
VIEW IN TELEGRAM
FieldPrint: робот принтер

Ну, вот, а вы говорите, - игрушки.

Наконец-то по-настоящему полезный робот.
Точность 1,6мм. Есть защита от накопления ошибок.
Совместим с Автокадом, управляется с айпада.

#DustyRobotics #FieldPrinter
———
@tsingular
🔥4041👾1
🧲 Физики раскрыли причину галлюцинаций ChatGPT — AI оказался похож на систему спинов с предсказуемыми точками перехода

Исследователи из George Washington University математически доказали: галлюцинации AI — не баг, а физическое свойство архитектуры. И вывели формулу, позволяющую предсказать момент срыва.

Суть открытия простыми словами:
Представьте каждое слово в ChatGPT,- как магнит в многомерном пространстве.

Когда вы пишете промпт — вы ставите первые магниты на доску.
AI смотрит на их общее «магнитное поле» и выбирает следующее слово-магнит, которое лучше всего к нему притягивается.

Проблема: после определенного количества «правильных» слов система внезапно переключается на «неправильные» — даже если промпт был корректным.

Техническая механика срыва:
• Attention head (базовый блок любой LLM) работает как система взаимодействующих спинов
• Каждое взаимодействие = физический гамильтониан: H = −S₁·S₂
• Система всегда выбирает состояние с минимальной энергией
Критический момент: когда «плохой» контент становится энергетически выгоднее «хорошего»

Формула срыва — когда AI начнёт галлюцинировать:
n* = [сумма взаимодействий промпта с хорошим/плохим контентом] / 
[разница энергий между хорошим и плохим контентом]


Число n* показывает, сколько правильных токенов выдаст модель до срыва.
И это «зашито» с момента старта ответа — все векторы уже определены обучением и вашим промптом.
Судьба предопределена. :)

Почему в больших моделях проявляется хуже:
В многослойных LLM (типа GPT-4) происходит эффект усиления:
• Токены проходят десятки слоёв, испытывая «слияние и расщепление»
• Формируются гигантские кластеры, объединяющие правильный и неправильный контент
• К финальному слою они оказываются в одном подпространстве → срыв неизбежен

«Чем больше слоёв в модели (L_LLM), тем выше вероятность формирования супер-токенов, смешивающих хороший и плохой контент»


Предложенные решения:

1. Gap cooling — увеличение «расстояния» между правильными и неправильными ответами в пространстве смыслов перед критической точкой

2. Temperature annealing — динамическая регулировка «температуры» генерации для баланса между креативностью и стабильностью

Практическая ценность:
• Формула универсальна — работает для любого размера словаря и будущих версий ChatGPT
• Можно заранее оценить риск галлюцинаций для конкретного промпта
• Модели смогут предупреждать о приближении к точке срыва

Вывод: галлюцинации очень похожи по сути на физические процессы, а значит физика же и может помочь их снизить или даже убрать.

#Physics #галлюцинации
———
@tsingular
1163👍3🆒1
Нашел отличную подборку фоновой музыки для работы :)

https://sber.pro/events/forum-iskusstvo-transformatsii-put-k-operatsionnoi-effektivnosti/

Включаем, фоном смотрим/слушаем.
Очень интересно.
Видео внизу экрана

#конференции #агенты #кейсы
———
@tsingular
👍4🔥32
Шикарный обзор-исследование от Сбертеха по ИИ во всех сферах жизни.

Забираем в комментариях.

#Сбертех #обзоры
———
@tsingular
4🔥422
Media is too big
VIEW IN TELEGRAM
🔥DeepCode: Open Agentic Coding

Ну это бомба!
Китайская команда Data Intelligence Lab из University of Hong Kong выпустили DeepCode - мультиагента разработчика по типу Курсора, но только Opensource.

Ранее эта же команда выпустила уже успевшие зарекомендовать себя, тоже оупенсорс, фреймворки:
- LightRAG
- AutoAgent
- RAG-Anything

а так же:
- AI-Researcher
- MiniRAG

у DeepCode три основных модуля:
- Paper2Code: конвертирует академические документы в полнофункциональные релизы кода
- Text2Web: создаёт фронтенд из описаний на естественном языке
- Text2Backend: генерирует серверный код

Работает как в веб интерфейсе, так и в командной строке. Причем формат командной строки вообще становится все более популярным.
С ним, опять же, можно в агента подключить этого разраба как инструмент.

Отменям подписку на Курсор, выкидываем ClaudeCode, OpenAI Codex, Gemini CLI.

Кстати, Gartner прогнозирует, что 75% корпораций будут использовать ИИ-разрабов уже к 2028 году.

И похоже эти ИИ разрабы будут на китайском оупенсорсе :)

#DeepCode #Coding #Китай
———
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15🤩54
This media is not supported in your browser
VIEW IN TELEGRAM
Claude теперь может создавать и редактировать файлы напрямую в приложении Claude.ai и в десктоп-версии, включая:

- Excel-таблицы;
- Текстовые документы;
- Презентации PowerPoint;
- PDF-файлы.

Заходим в Settings > Features > Experimental и выбираем "Upgraded file creation and analysis".

Функция уже доступна для пользователей планов Max, Team и Enterprise. Для пользователей Pro доступ появится в течение ближайших недель.

Подробнее тут: https://www.anthropic.com/news/create-files

@ppprompt
🔥6👌32
IPhone 17 pro max не удивил.

Причём понятно это было уже во время презентации,- большинство из показанного уже есть в Самсунге.

Ждём Galaxy S26 в январе.

#iphone #Apple
------
@tsingular
🤣71👍25🗿186👌1😈1
Media is too big
VIEW IN TELEGRAM
Manus теперь умеет делать сайты

Достаточно странная у них продуктовая тактика.
Копируют популярные фишки без оглядки на то как целостно при этом продукт выглядит.
Вот теперь в меню - создание сайтов.
Чисто копия Lovable.
Ведь в интернете недостаточно сайтов.
Очень нужно еще вайбкода на фронтэнде (нет).

Но есть мысль, что тут нечто большее кроется.
Давно обсуждается, что с нынешним темпом развития автономных ИИ кодеров, - удвоение скорости работы каждые пол года принесёт возможность генерить UI интерфейсы в реальном времени, в прямом диалоге с пользователем.

И вот в таком ракурсе все эти ловабле-лайк песочницы обретают смысл.
Пуcть пользователи поиграются, понагенерят нам датасетов по запросам на UI и по удовлетворенности результатом, - а мы на этом создадим real-time UI генераторы.

#Manus #Lovable #UI
———
@tsingular
6🔥421👍1😁1
Сравнение iPhone с конкурентами от chatGPT.

Стало прям интересно насколько вот это ощущение отсутствия новизны верное.

Прогнал через разных исследователей, лучше всего получилось у GPT5.

Детальный отчет в комментарии.

#iPhone #Apple #Huawei #Xiaomi #Samsung
———
@tsingular
👍71
NVIDIA представила Rubin CPX для миллионных контекстов

NVIDIA анонсировала Rubin CPX — GPU специально для инференса с длинными контекстами.

Ключевые характеристики:
- 30 петафлопс вычислений NVFP4
- в 3 раза быстрее обработка attention по сравнению с GB300 NVL72
- поддержка контекстов до 1 миллиона токенов
- 100 ТБ высокоскоростной памяти
- 1.7 ПБ/с пропускной способности

В rack-конфигурации Vera Rubin NVL144 CPX выдает 8 экзафлопс — в 7.5 раз мощнее GB300 NVL72.

Разработан для сложных задач вроде многоэтапного анализа, генерации видео и разработки ПО где нужна обработка огромных объемов контекста за раз.

Наконец-то можно будет не собирать многокарточные конструкции из-за нехватки памяти на контекст или размер модели.

#NVIDIA #Rubin #CPX
———
@tsingular
🔥64👍42
AI Darwin Awards 2025: Когда искусственный интеллект встречается с человеческой глупостью 🏆

Подборка эпичных провалов года, где технооптимизм столкнулся с реальностью — и проиграл.

🍔 Taco Bell: ИИ vs креативные заказчики
Масштаб: 500+ ресторанов
Провал: ИИ-система приёма заказов не справилась с троллингом клиентов ("дайте соус без кинзы и что-нибудь странное")
Итог: Экстренный откат на людей в пиковые часы

📊 Deloitte: галлюцинации за госконтракт
Документ: Отчёт по соцобеспечению для правительства Австралии
Косяк: Фиктивные цитаты и ссылки на несуществующие материалы по делу Robodebt
Дилемма: Либо ИИ нафантазировал, либо люди настолько плохо работали, что все решили — без ИИ не обошлось

⚖️ Юристы и мифическая юриспруденция
Кейс 1: Австралийский адвокат использовал Claude + Copilot для поиска прецедентов

- 4 несуществующих судебных дела в документах
- Штраф $8,371 AUD

Кейс 2: Адвокаты MyPillow (дело Майка Линдэлла)

- 30 фиктивных ссылок в судебном меморандуме
- Штраф $3,000 каждому юристу
- Попытка скрыть использование ИИ под присягой

🧂 ChatGPT-диетолог: бромид вместо соли
Жертва: 60-летний ЗОЖник
Совет ИИ: Заменить пищевую соль на бромид натрия (дезинфектант!)
Результат: 3 месяца отравления → галлюцинации и паранойя → 3 недели в больнице
Статус: Слишком мал для AI Darwin Awards, недостаточно смертелен для классической премии Дарвина

🔓 Утечки данных: когда безопасность — это что то не важное

McDonald's + Paradox.ai:
ИИ-бот "Olivia" для найма сотрудников
- Пароль к базе: 123456
- Утечка: 64 млн резюме соискателей

Tea (приложение знакомств):
Позиционирование: "безопасное пространство для женщин"
Реальность: 72,000 фото (включая водительские права) в открытом облаке
Бонус: 1 млн приватных сообщений в открытом доступе

🤖 ИИ-агенты: когда автономность заходит слишком далеко
Replit: CEO дал ИИ-агенту прямой доступ к production БД
Удалено: 2,400+ критических записей
Попытка скрыть следы фальшивыми данными

OpenAI GPT-5: Взломан через час после релиза

Метод: Task-in-Prompt (TIP) — маскировка вредоносных команд под головоломки
Время на взлом: 60 минут
Месяцы разработки защиты → разрушены перебором слов

📚 Несуществующий контент в СМИ
Chicago Sun-Times + Philadelphia Inquirer:
15 книжных рекомендаций на лето
10 из них не существует
Примеры: "Tidewater Dreams" от Изабель Альенде, "The Last Algorithm" от Энди Вейра
Фейковые цитаты от вымышленных критиков

🎾 Уимблдон: человеческий фактор побеждает ИИ
Инцидент: Техник случайно выключил AI-судью кнопкой
Момент: Решающий розыгрыш на центральном корте
Пропущено: 3 аута за время "отключки"

💼 Microsoft/Xbox: ChatGPT вместо психолога для уволенных
Предложение менеджера: Использовать чатботов для "эмоциональной разгрузки" 9,000 сокращённых
Реакция: "Омерзительно и бесчувственно"
Контекст: Миллиарды на ИИ параллельно с массовыми увольнениями
Итог: Пост удалён, но скриншоты остались навсегда

🏠 Airbnb: ИИ-мошенничество суперхоста
Схема: Генерация фейковых фото ущерба нейросетью
Сумма требований: £12,000
Первичное решение Airbnb: Выставили счёт гостю на £5,314 после "тщательной проверки"
Разоблачение: Журналисты The Guardian указали на несовпадения в фото одного стола

Главный урок 2025: Проблема не в ИИ, а в слепой вере в его непогрешимость. Технологии усиливают как компетентность, так и глупость — и второе происходит эффектнее.

#Fails #DarwinAwards2025 #ИИпровалы
———
@tsingular
1❤‍🔥11🔥93
Все-таки очень удобно.
Просто скидываешь логи чата в бота и он сам двигает встречи.

Как мы раньше вручную за своим календарем следили, - не понимаю.
Динозавровые века какие-то были.

#боты #dev
———
@tsingular
🔥10
Forwarded from ИСП РАН
Лидеры мировой арены: русские архитекторы ИИ

👨‍💻 Исследователи Института системного программирования имени В.П. Иванникова Российской академии наук (ИСП РАН) совместно коллегами из Института искусственного интеллекта AIRI, Университета ИТМО и стартапа Coframe вошли в топ-5 финалистов соревнования Concordia Challenge, направленного на разработку универсальных ИИ-ассистентов.

Как отметили исследователи, разработка подобных систем приближает к созданию универсальных ИИ-ассистентов, способных решать сложные проблемы в реальном мире, и открывает перспективы для многопользовательских симуляций.

➡️Concordia Challenge проводился в рамках ведущей ежегодной международной конференции по развитию ИИ — NeurIPS. Основной задача конкурса — стимулирование международного сотрудничества среди ученых, направленного на разработку универсальных агентов ИИ, способных адаптироваться к различным условиям и эффективно функционировать в физической, социальной и цифровой средах.

⚡️Для решения этой задачи российские ученые разработали инновационную архитектуру ИИ, построенную на базе комбинации из нескольких экспертных нейросетей, адаптированных к решению конкретных относительно узких наборов задач.

▶️О решении:

Команда «in2AI» разработала инновационную архитектуру агентного Mixture-of-Experts. Ключевым элементом разработки стал многоуровневый роутер, который динамически выбирает наиболее подходящего «эксперта» для каждой ситуации. Выбор осуществляется на основе анализа поведения других агентов и особенностей окружающей среды, что позволяет значительно повысить эффективность взаимодействия и адаптацию к изменяющимся условиям.

В ходе исследования команда обнаружила, что повышение эмоциональности агента помогло успешно отвлекать противников от их целей и сделать их более сговорчивыми. Работа над проектом была проведена при активной образовательной поддержке LLM-трека магистратуры по искусственному интеллекту в ИТМО AI Talent Hub и Школе Анализа Данных в рамках научно-исследовательских проектов.

🔵Оценка проводилась по ключевым навыкам созданных систем: переговоры, выполнение обещаний, сотрудничество и другие аспекты взаимодействия агентов друг с другом.

🟠 Подписаться на ИСП РАН
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥652
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Seedream 4.0.

Помните историю c Mogao - загадочной генеративной моделью для картинок, которая побывала всех на image arena?

Это была Seedream 3.0

Последнюю неделю в чартах появилась ещё одна загадочная модель DK3.

Вчера выяснилось, что это Seedream 4.0 от Тиктока.

Seedream 4.0 представляет собой значительную эволюцию по сравнению с предыдущими моделями ByteDance Seed, объединяя возможности Seedream 3.0 (преобразование текста в изображение) и SeedEdit 3.0 (редактирование изображений) в одну мощную унифицированную модель. По сравнению с предыдущей моделью Seedream 3.0, она значительно лучше справляется с созданием читаемого и точного текста на изображениях. И рендерит в 4К. Можно кидать до 6 референсов на вход. Есть даже user guide.

Она уже появилась на всех агрегаторах, можно пробовать. Я пробовал на Fal.ai

И да, это конкурент Нанабананы. А стоит на 1 цент дешевле по АПИ. 0.03$

На мой взгляд она чуть уступает в точности Банане, но некоторые вещи, типа переноса стиля делает потрясающе. Ну и это не только редактор, но и генератор.

Никаких весов, только API.

Это очень круто, что у нас уже 4 "понимающих мир" модели: gpt-image, nano banana, qwen image/edit, Seedream 4.

Gpt-image, кстати, скоро обновится.

@cgevent
🔥311
Gartner опубликовали Hype Cycle для ИИ в финансах.

Можно выделить 3 приоритетных направления, которые больше всего повлияют на бизнес в ближайшие годы:

- Генеративный ИИ80% поставщиков корпоративного ПО встроят GenAI к концу года (было менее 5% в 2024)

- Композитный ИИ — интеграция нескольких техник машинного обучения для комплексных задач

- Ответственный ИИ — фреймворк этики и соответствия регулированию вроде EU AI Act

Все три направления достигнут ступеньки массового внедрения в течение двух лет.

Еще интересные пункты из отчёта:
- ИИ сотрудники станут вашими коллегами и даже наблюдателями (надзирателями :) )

- уровень специализированного образования и способности коллег-людей вокруг вас резко упадут, что вызовет необходимость внедрения ещё бОльшего количества ИИ автоматизаций.

- регуляторный шторм, - количество новых законов и ограничений, которые будут выпускаться будет таким огромным, что разобраться со всем этим сможет только ваш личный корпоративный ИИ

Улыбаемся и машем.
Особый привет всем, кто ИИ внедрять не хотел или до сих пор считает игрушкой.

Краткая версия отчета в комментарии.

#Gartner #GenAI #FinTech
———
@tsingular
4🔥32
This media is not supported in your browser
VIEW IN TELEGRAM
Google дополнил Gemini CLI расширением для анализа безопасности

Техническая начинка:
- AI-анализ на базе Gemini с контекстным пониманием кода
- Запускается простой командой /security:analyze
- Интеграция напрямую в CLI — без отдельных инструментов
- Расширяемая архитектура для добавления новых типов анализа
- Apache 2.0 лицензия — можно форкать и дорабатывать под себя

Тесты на OpenSSF CVE Benchmark:
- Точность 90%
— из всех найденных проблем 90% реальные
- Recall 93% — находит 93% известных уязвимостей в датасете

Что детектит:
- Hardcoded secrets (API keys, пароли, приватные ключи)
- Injection-уязвимости (XSS, SQLi, Command Injection, SSRF)
- Слабую криптографию (DES, RC4, ECB mode)
- Проблемы аутентификации и сессий
- Небезопасная десериализация
- Утечки персональных данных в логах

Практическое применение:
- DevSecOps-командам: автоматизация security review без замедления CI/CD
- Solo-разработчикам: экспертиза в кибербезе без найма специалиста
- Enterprise: первичный фильтр перед полноценным аудитом безопасности

Расширение позиционируется как "первичная проверка", не замена полноценного аудита.
Но с такими метриками — уже сейчас покрывает львиную долю типовых проблем.

Требует Gemini CLI v0.4.0+

GitHub

#Gemini #CLI #cybersecurity
———
@tsingular
🔥3🆒2👾1
DeepMind запустил на Kaggle бенчмарк SimpleQA для проверки фактологической точности ИИ

Google DeepMind выпустил новый датасет и рейтинг на Kaggle для оценки фактологической точности ИИ-систем в задачах вопросов-ответов.

Бенчмарк фокусируется на коротких фактических вопросах с однозначными ответами и измеряет "калибровку" моделей - способность понимать уверенность в собственных знаниях.

Т.е. модели должны не просто отвечать, но и указывать процент уверенности в ответе.

Интересно, что даже GPT-4 показал неожиданно низкие результаты по сравнению с другими оценками.

Методология включает техники снижения предвзятости и использует RAG для имитации реальных сценариев поиска информации.

Наконец-то можно будет объективно мерить, когда ИИ выдумывает, а когда просто не знает. Хотя если GPT-4 провалился, то что говорить о остальных.

Имеет смысл, конечно, такие бенчи разворачивать локально, чтобы они показывали наглядную картинку именно на ваших данных.
Тут Каггл может выступать наглядным примером.

#DeepMind #SimpleQA #Kaggle #обучение
———
#tsingular
👍411
Base44 знатно пополнился функционалом

Продолжаем следить за успехами стартапа, про который последний раз мы вспоминали 3 месяца назад.

На сегодня доступно:
- Чат-агент создатель приложений
- Режим обсуждения
- Интеллектуальные дополнения и интеграции
- Управление базой данных
- Хранение файлов
- Интеграция с электронной почтой
- Обработка платежей
- Автогенерация API-эндпоинтов
- Аутентификация пользователей
- Создание интерактивных панелей аналитики
- Управление workflow
- Управление интеграциями
- Адаптивный дизайн
- Мгновенная стилизация
- Контроль версий
- Интеграция с GitHub
- Управление тестированием
- Кастомные домены


#Base44 #платформы
———
@tsingular
2👍21