Интересный кейс из Кении, показывающий высокий спрос на инструмент, облегчающий понимание действующего и будущего законодательства и выступающий посредником между юридически неподготовленным пользователем и законодателем.
13 июня 2024-го программист Келвин Онкунди Ндемо загрузил в сеть ИИ-помощника на основе ChatGPT, который отвечал пользователям на вопросы о законопроекте о бюджете и переводил его статьи с юридического жаргона на человеческий язык. Ндемо обучил своего чат-бота на тексте законопроекта и «нескольких журналистских материалах», а позднее – на докладе комитета по финансам и планированию.
В течение уже первой недели бот обработал 50 тыс. запросов: например, подсчитывал пользователям, сколько шиллингов им придется переплатить за буханку хлеба с повышением НДС или как новый экосбор скажется на стоимости масла и других продуктов.
Чем закончилось, читаем тут
#Кения #законы #боты
———-
@tsingular
13 июня 2024-го программист Келвин Онкунди Ндемо загрузил в сеть ИИ-помощника на основе ChatGPT, который отвечал пользователям на вопросы о законопроекте о бюджете и переводил его статьи с юридического жаргона на человеческий язык. Ндемо обучил своего чат-бота на тексте законопроекта и «нескольких журналистских материалах», а позднее – на докладе комитета по финансам и планированию.
В течение уже первой недели бот обработал 50 тыс. запросов: например, подсчитывал пользователям, сколько шиллингов им придется переплатить за буханку хлеба с повышением НДС или как новый экосбор скажется на стоимости масла и других продуктов.
Чем закончилось, читаем тут
#Кения #законы #боты
———-
@tsingular
✍5🔥4⚡2❤1
Media is too big
VIEW IN TELEGRAM
FieldPrint: робот принтер
Ну, вот, а вы говорите, - игрушки.
Наконец-то по-настоящему полезный робот.
Точность 1,6мм. Есть защита от накопления ошибок.
Совместим с Автокадом, управляется с айпада.
#DustyRobotics #FieldPrinter
———
@tsingular
Ну, вот, а вы говорите, - игрушки.
Наконец-то по-настоящему полезный робот.
Точность 1,6мм. Есть защита от накопления ошибок.
Совместим с Автокадом, управляется с айпада.
#DustyRobotics #FieldPrinter
———
@tsingular
🔥40⚡4❤1👾1
🧲 Физики раскрыли причину галлюцинаций ChatGPT — AI оказался похож на систему спинов с предсказуемыми точками перехода
Исследователи из George Washington University математически доказали: галлюцинации AI — не баг, а физическое свойство архитектуры. И вывели формулу, позволяющую предсказать момент срыва.
Суть открытия простыми словами:
Представьте каждое слово в ChatGPT,- как магнит в многомерном пространстве.
Когда вы пишете промпт — вы ставите первые магниты на доску.
AI смотрит на их общее «магнитное поле» и выбирает следующее слово-магнит, которое лучше всего к нему притягивается.
Проблема: после определенного количества «правильных» слов система внезапно переключается на «неправильные» — даже если промпт был корректным.
Техническая механика срыва:
• Attention head (базовый блок любой LLM) работает как система взаимодействующих спинов
• Каждое взаимодействие = физический гамильтониан: H = −S₁·S₂
• Система всегда выбирает состояние с минимальной энергией
• Критический момент: когда «плохой» контент становится энергетически выгоднее «хорошего»
Формула срыва — когда AI начнёт галлюцинировать:
Число n* показывает, сколько правильных токенов выдаст модель до срыва.
И это «зашито» с момента старта ответа — все векторы уже определены обучением и вашим промптом.
Судьба предопределена. :)
Почему в больших моделях проявляется хуже:
В многослойных LLM (типа GPT-4) происходит эффект усиления:
• Токены проходят десятки слоёв, испытывая «слияние и расщепление»
• Формируются гигантские кластеры, объединяющие правильный и неправильный контент
• К финальному слою они оказываются в одном подпространстве → срыв неизбежен
Предложенные решения:
1. Gap cooling — увеличение «расстояния» между правильными и неправильными ответами в пространстве смыслов перед критической точкой
2. Temperature annealing — динамическая регулировка «температуры» генерации для баланса между креативностью и стабильностью
Практическая ценность:
• Формула универсальна — работает для любого размера словаря и будущих версий ChatGPT
• Можно заранее оценить риск галлюцинаций для конкретного промпта
• Модели смогут предупреждать о приближении к точке срыва
Вывод: галлюцинации очень похожи по сути на физические процессы, а значит физика же и может помочь их снизить или даже убрать.
#Physics #галлюцинации
———
@tsingular
Исследователи из George Washington University математически доказали: галлюцинации AI — не баг, а физическое свойство архитектуры. И вывели формулу, позволяющую предсказать момент срыва.
Суть открытия простыми словами:
Представьте каждое слово в ChatGPT,- как магнит в многомерном пространстве.
Когда вы пишете промпт — вы ставите первые магниты на доску.
AI смотрит на их общее «магнитное поле» и выбирает следующее слово-магнит, которое лучше всего к нему притягивается.
Проблема: после определенного количества «правильных» слов система внезапно переключается на «неправильные» — даже если промпт был корректным.
Техническая механика срыва:
• Attention head (базовый блок любой LLM) работает как система взаимодействующих спинов
• Каждое взаимодействие = физический гамильтониан: H = −S₁·S₂
• Система всегда выбирает состояние с минимальной энергией
• Критический момент: когда «плохой» контент становится энергетически выгоднее «хорошего»
Формула срыва — когда AI начнёт галлюцинировать:
n* = [сумма взаимодействий промпта с хорошим/плохим контентом] /
[разница энергий между хорошим и плохим контентом]
Число n* показывает, сколько правильных токенов выдаст модель до срыва.
И это «зашито» с момента старта ответа — все векторы уже определены обучением и вашим промптом.
Судьба предопределена. :)
Почему в больших моделях проявляется хуже:
В многослойных LLM (типа GPT-4) происходит эффект усиления:
• Токены проходят десятки слоёв, испытывая «слияние и расщепление»
• Формируются гигантские кластеры, объединяющие правильный и неправильный контент
• К финальному слою они оказываются в одном подпространстве → срыв неизбежен
«Чем больше слоёв в модели (L_LLM), тем выше вероятность формирования супер-токенов, смешивающих хороший и плохой контент»
Предложенные решения:
1. Gap cooling — увеличение «расстояния» между правильными и неправильными ответами в пространстве смыслов перед критической точкой
2. Temperature annealing — динамическая регулировка «температуры» генерации для баланса между креативностью и стабильностью
Практическая ценность:
• Формула универсальна — работает для любого размера словаря и будущих версий ChatGPT
• Можно заранее оценить риск галлюцинаций для конкретного промпта
• Модели смогут предупреждать о приближении к точке срыва
Вывод: галлюцинации очень похожи по сути на физические процессы, а значит физика же и может помочь их снизить или даже убрать.
#Physics #галлюцинации
———
@tsingular
⚡11✍6❤3👍3🆒1
Нашел отличную подборку фоновой музыки для работы :)
https://sber.pro/events/forum-iskusstvo-transformatsii-put-k-operatsionnoi-effektivnosti/
Включаем, фоном смотрим/слушаем.
Очень интересно.
Видео внизу экрана
#конференции #агенты #кейсы
———
@tsingular
https://sber.pro/events/forum-iskusstvo-transformatsii-put-k-operatsionnoi-effektivnosti/
Включаем, фоном смотрим/слушаем.
Очень интересно.
Видео внизу экрана
#конференции #агенты #кейсы
———
@tsingular
👍4🔥3⚡2
Шикарный обзор-исследование от Сбертеха по ИИ во всех сферах жизни.
Забираем в комментариях.
#Сбертех #обзоры
———
@tsingular
Забираем в комментариях.
#Сбертех #обзоры
———
@tsingular
✍4🔥4⚡2❤2
Media is too big
VIEW IN TELEGRAM
Ну это бомба!
Китайская команда Data Intelligence Lab из University of Hong Kong выпустили DeepCode - мультиагента разработчика по типу Курсора, но только Opensource.
Ранее эта же команда выпустила уже успевшие зарекомендовать себя, тоже оупенсорс, фреймворки:
- LightRAG
- AutoAgent
- RAG-Anything
а так же:
- AI-Researcher
- MiniRAG
у DeepCode три основных модуля:
- Paper2Code: конвертирует академические документы в полнофункциональные релизы кода
- Text2Web: создаёт фронтенд из описаний на естественном языке
- Text2Backend: генерирует серверный код
Работает как в веб интерфейсе, так и в командной строке. Причем формат командной строки вообще становится все более популярным.
С ним, опять же, можно в агента подключить этого разраба как инструмент.
Отменям подписку на Курсор, выкидываем ClaudeCode, OpenAI Codex, Gemini CLI.
Кстати, Gartner прогнозирует, что 75% корпораций будут использовать ИИ-разрабов уже к 2028 году.
И похоже эти ИИ разрабы будут на китайском оупенсорсе :)
#DeepCode #Coding #Китай
———
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15🤩5 4
Forwarded from Ppprompt | Sexy AI Prompts & Experiments | by @ponchiknews
This media is not supported in your browser
VIEW IN TELEGRAM
Claude теперь может создавать и редактировать файлы напрямую в приложении Claude.ai и в десктоп-версии, включая:
- Excel-таблицы;
- Текстовые документы;
- Презентации PowerPoint;
- PDF-файлы.
Заходим в Settings > Features > Experimental и выбираем "Upgraded file creation and analysis".
Функция уже доступна для пользователей планов Max, Team и Enterprise. Для пользователей Pro доступ появится в течение ближайших недель.
Подробнее тут: https://www.anthropic.com/news/create-files
@ppprompt
- Excel-таблицы;
- Текстовые документы;
- Презентации PowerPoint;
- PDF-файлы.
Заходим в Settings > Features > Experimental и выбираем "Upgraded file creation and analysis".
Функция уже доступна для пользователей планов Max, Team и Enterprise. Для пользователей Pro доступ появится в течение ближайших недель.
Подробнее тут: https://www.anthropic.com/news/create-files
@ppprompt
🔥6👌3✍2
IPhone 17 pro max не удивил.
Причём понятно это было уже во время презентации,- большинство из показанного уже есть в Самсунге.
Ждём Galaxy S26 в январе.
#iphone #Apple
------
@tsingular
Причём понятно это было уже во время презентации,- большинство из показанного уже есть в Самсунге.
Ждём Galaxy S26 в январе.
#iphone #Apple
------
@tsingular
🤣71👍25🗿18❤6👌1😈1
Media is too big
VIEW IN TELEGRAM
Manus теперь умеет делать сайты
Достаточно странная у них продуктовая тактика.
Копируют популярные фишки без оглядки на то как целостно при этом продукт выглядит.
Вот теперь в меню - создание сайтов.
Чисто копия Lovable.
Ведь в интернете недостаточно сайтов.
Очень нужно еще вайбкода на фронтэнде (нет).
Но есть мысль, что тут нечто большее кроется.
Давно обсуждается, что с нынешним темпом развития автономных ИИ кодеров, - удвоение скорости работы каждые пол года принесёт возможность генерить UI интерфейсы в реальном времени, в прямом диалоге с пользователем.
И вот в таком ракурсе все эти ловабле-лайк песочницы обретают смысл.
Пуcть пользователи поиграются, понагенерят нам датасетов по запросам на UI и по удовлетворенности результатом, - а мы на этом создадим real-time UI генераторы.
#Manus #Lovable #UI
———
@tsingular
Достаточно странная у них продуктовая тактика.
Копируют популярные фишки без оглядки на то как целостно при этом продукт выглядит.
Вот теперь в меню - создание сайтов.
Чисто копия Lovable.
Ведь в интернете недостаточно сайтов.
Очень нужно еще вайбкода на фронтэнде (нет).
Но есть мысль, что тут нечто большее кроется.
Давно обсуждается, что с нынешним темпом развития автономных ИИ кодеров, - удвоение скорости работы каждые пол года принесёт возможность генерить UI интерфейсы в реальном времени, в прямом диалоге с пользователем.
И вот в таком ракурсе все эти ловабле-лайк песочницы обретают смысл.
Пуcть пользователи поиграются, понагенерят нам датасетов по запросам на UI и по удовлетворенности результатом, - а мы на этом создадим real-time UI генераторы.
#Manus #Lovable #UI
———
@tsingular
✍6🔥4⚡2❤1👍1😁1
NVIDIA представила Rubin CPX для миллионных контекстов
NVIDIA анонсировала Rubin CPX — GPU специально для инференса с длинными контекстами.
Ключевые характеристики:
- 30 петафлопс вычислений NVFP4
- в 3 раза быстрее обработка attention по сравнению с GB300 NVL72
- поддержка контекстов до 1 миллиона токенов
- 100 ТБ высокоскоростной памяти
- 1.7 ПБ/с пропускной способности
В rack-конфигурации Vera Rubin NVL144 CPX выдает 8 экзафлопс — в 7.5 раз мощнее GB300 NVL72.
Разработан для сложных задач вроде многоэтапного анализа, генерации видео и разработки ПО где нужна обработка огромных объемов контекста за раз.
Наконец-то можно будет не собирать многокарточные конструкции из-за нехватки памяти на контекст или размер модели.
#NVIDIA #Rubin #CPX
———
@tsingular
NVIDIA анонсировала Rubin CPX — GPU специально для инференса с длинными контекстами.
Ключевые характеристики:
- 30 петафлопс вычислений NVFP4
- в 3 раза быстрее обработка attention по сравнению с GB300 NVL72
- поддержка контекстов до 1 миллиона токенов
- 100 ТБ высокоскоростной памяти
- 1.7 ПБ/с пропускной способности
В rack-конфигурации Vera Rubin NVL144 CPX выдает 8 экзафлопс — в 7.5 раз мощнее GB300 NVL72.
Разработан для сложных задач вроде многоэтапного анализа, генерации видео и разработки ПО где нужна обработка огромных объемов контекста за раз.
Наконец-то можно будет не собирать многокарточные конструкции из-за нехватки памяти на контекст или размер модели.
#NVIDIA #Rubin #CPX
———
@tsingular
🔥6⚡4👍4❤2
AI Darwin Awards 2025: Когда искусственный интеллект встречается с человеческой глупостью 🏆
Подборка эпичных провалов года, где технооптимизм столкнулся с реальностью — и проиграл.
🍔 Taco Bell: ИИ vs креативные заказчики
Масштаб: 500+ ресторанов
Провал: ИИ-система приёма заказов не справилась с троллингом клиентов ("дайте соус без кинзы и что-нибудь странное")
Итог: Экстренный откат на людей в пиковые часы
📊 Deloitte: галлюцинации за госконтракт
Документ: Отчёт по соцобеспечению для правительства Австралии
Косяк: Фиктивные цитаты и ссылки на несуществующие материалы по делу Robodebt
Дилемма: Либо ИИ нафантазировал, либо люди настолько плохо работали, что все решили — без ИИ не обошлось
⚖️ Юристы и мифическая юриспруденция
Кейс 1: Австралийский адвокат использовал Claude + Copilot для поиска прецедентов
- 4 несуществующих судебных дела в документах
- Штраф $8,371 AUD
Кейс 2: Адвокаты MyPillow (дело Майка Линдэлла)
- 30 фиктивных ссылок в судебном меморандуме
- Штраф $3,000 каждому юристу
- Попытка скрыть использование ИИ под присягой
🧂 ChatGPT-диетолог: бромид вместо соли
Жертва: 60-летний ЗОЖник
Совет ИИ: Заменить пищевую соль на бромид натрия (дезинфектант!)
Результат: 3 месяца отравления → галлюцинации и паранойя → 3 недели в больнице
Статус: Слишком мал для AI Darwin Awards, недостаточно смертелен для классической премии Дарвина
🔓 Утечки данных: когда безопасность — это что то не важное
McDonald's + Paradox.ai:
ИИ-бот "Olivia" для найма сотрудников
- Пароль к базе: 123456
- Утечка: 64 млн резюме соискателей
Tea (приложение знакомств):
Позиционирование: "безопасное пространство для женщин"
Реальность: 72,000 фото (включая водительские права) в открытом облаке
Бонус: 1 млн приватных сообщений в открытом доступе
🤖 ИИ-агенты: когда автономность заходит слишком далеко
Replit: CEO дал ИИ-агенту прямой доступ к production БД
Удалено: 2,400+ критических записей
Попытка скрыть следы фальшивыми данными
OpenAI GPT-5: Взломан через час после релиза
Метод: Task-in-Prompt (TIP) — маскировка вредоносных команд под головоломки
Время на взлом: 60 минут
Месяцы разработки защиты → разрушены перебором слов
📚 Несуществующий контент в СМИ
Chicago Sun-Times + Philadelphia Inquirer:
15 книжных рекомендаций на лето
10 из них не существует
Примеры: "Tidewater Dreams" от Изабель Альенде, "The Last Algorithm" от Энди Вейра
Фейковые цитаты от вымышленных критиков
🎾 Уимблдон: человеческий фактор побеждает ИИ
Инцидент: Техник случайно выключил AI-судью кнопкой
Момент: Решающий розыгрыш на центральном корте
Пропущено: 3 аута за время "отключки"
💼 Microsoft/Xbox: ChatGPT вместо психолога для уволенных
Предложение менеджера: Использовать чатботов для "эмоциональной разгрузки" 9,000 сокращённых
Реакция: "Омерзительно и бесчувственно"
Контекст: Миллиарды на ИИ параллельно с массовыми увольнениями
Итог: Пост удалён, но скриншоты остались навсегда
🏠 Airbnb: ИИ-мошенничество суперхоста
Схема: Генерация фейковых фото ущерба нейросетью
Сумма требований: £12,000
Первичное решение Airbnb: Выставили счёт гостю на £5,314 после "тщательной проверки"
Разоблачение: Журналисты The Guardian указали на несовпадения в фото одного стола
Главный урок 2025: Проблема не в ИИ, а в слепой вере в его непогрешимость. Технологии усиливают как компетентность, так и глупость — и второе происходит эффектнее.
#Fails #DarwinAwards2025 #ИИпровалы
———
@tsingular
Подборка эпичных провалов года, где технооптимизм столкнулся с реальностью — и проиграл.
🍔 Taco Bell: ИИ vs креативные заказчики
Масштаб: 500+ ресторанов
Провал: ИИ-система приёма заказов не справилась с троллингом клиентов ("дайте соус без кинзы и что-нибудь странное")
Итог: Экстренный откат на людей в пиковые часы
📊 Deloitte: галлюцинации за госконтракт
Документ: Отчёт по соцобеспечению для правительства Австралии
Косяк: Фиктивные цитаты и ссылки на несуществующие материалы по делу Robodebt
Дилемма: Либо ИИ нафантазировал, либо люди настолько плохо работали, что все решили — без ИИ не обошлось
⚖️ Юристы и мифическая юриспруденция
Кейс 1: Австралийский адвокат использовал Claude + Copilot для поиска прецедентов
- 4 несуществующих судебных дела в документах
- Штраф $8,371 AUD
Кейс 2: Адвокаты MyPillow (дело Майка Линдэлла)
- 30 фиктивных ссылок в судебном меморандуме
- Штраф $3,000 каждому юристу
- Попытка скрыть использование ИИ под присягой
🧂 ChatGPT-диетолог: бромид вместо соли
Жертва: 60-летний ЗОЖник
Совет ИИ: Заменить пищевую соль на бромид натрия (дезинфектант!)
Результат: 3 месяца отравления → галлюцинации и паранойя → 3 недели в больнице
Статус: Слишком мал для AI Darwin Awards, недостаточно смертелен для классической премии Дарвина
🔓 Утечки данных: когда безопасность — это что то не важное
McDonald's + Paradox.ai:
ИИ-бот "Olivia" для найма сотрудников
- Пароль к базе: 123456
- Утечка: 64 млн резюме соискателей
Tea (приложение знакомств):
Позиционирование: "безопасное пространство для женщин"
Реальность: 72,000 фото (включая водительские права) в открытом облаке
Бонус: 1 млн приватных сообщений в открытом доступе
🤖 ИИ-агенты: когда автономность заходит слишком далеко
Replit: CEO дал ИИ-агенту прямой доступ к production БД
Удалено: 2,400+ критических записей
Попытка скрыть следы фальшивыми данными
OpenAI GPT-5: Взломан через час после релиза
Метод: Task-in-Prompt (TIP) — маскировка вредоносных команд под головоломки
Время на взлом: 60 минут
Месяцы разработки защиты → разрушены перебором слов
📚 Несуществующий контент в СМИ
Chicago Sun-Times + Philadelphia Inquirer:
15 книжных рекомендаций на лето
10 из них не существует
Примеры: "Tidewater Dreams" от Изабель Альенде, "The Last Algorithm" от Энди Вейра
Фейковые цитаты от вымышленных критиков
🎾 Уимблдон: человеческий фактор побеждает ИИ
Инцидент: Техник случайно выключил AI-судью кнопкой
Момент: Решающий розыгрыш на центральном корте
Пропущено: 3 аута за время "отключки"
💼 Microsoft/Xbox: ChatGPT вместо психолога для уволенных
Предложение менеджера: Использовать чатботов для "эмоциональной разгрузки" 9,000 сокращённых
Реакция: "Омерзительно и бесчувственно"
Контекст: Миллиарды на ИИ параллельно с массовыми увольнениями
Итог: Пост удалён, но скриншоты остались навсегда
🏠 Airbnb: ИИ-мошенничество суперхоста
Схема: Генерация фейковых фото ущерба нейросетью
Сумма требований: £12,000
Первичное решение Airbnb: Выставили счёт гостю на £5,314 после "тщательной проверки"
Разоблачение: Журналисты The Guardian указали на несовпадения в фото одного стола
Главный урок 2025: Проблема не в ИИ, а в слепой вере в его непогрешимость. Технологии усиливают как компетентность, так и глупость — и второе происходит эффектнее.
#Fails #DarwinAwards2025 #ИИпровалы
———
@tsingular
1❤🔥11🔥9❤3
Все-таки очень удобно.
Просто скидываешь логи чата в бота и он сам двигает встречи.
Как мы раньше вручную за своим календарем следили, - не понимаю.
Динозавровые века какие-то были.
#боты #dev
———
@tsingular
Просто скидываешь логи чата в бота и он сам двигает встречи.
Как мы раньше вручную за своим календарем следили, - не понимаю.
Динозавровые века какие-то были.
#боты #dev
———
@tsingular
🔥10
Forwarded from ИСП РАН
Лидеры мировой арены: русские архитекторы ИИ
👨💻 Исследователи Института системного программирования имени В.П. Иванникова Российской академии наук (ИСП РАН) совместно коллегами из Института искусственного интеллекта AIRI, Университета ИТМО и стартапа Coframe вошли в топ-5 финалистов соревнования Concordia Challenge, направленного на разработку универсальных ИИ-ассистентов.
✅ Как отметили исследователи, разработка подобных систем приближает к созданию универсальных ИИ-ассистентов, способных решать сложные проблемы в реальном мире, и открывает перспективы для многопользовательских симуляций.
➡️ Concordia Challenge проводился в рамках ведущей ежегодной международной конференции по развитию ИИ — NeurIPS. Основной задача конкурса — стимулирование международного сотрудничества среди ученых, направленного на разработку универсальных агентов ИИ, способных адаптироваться к различным условиям и эффективно функционировать в физической, социальной и цифровой средах.
⚡️ Для решения этой задачи российские ученые разработали инновационную архитектуру ИИ, построенную на базе комбинации из нескольких экспертных нейросетей, адаптированных к решению конкретных относительно узких наборов задач.
▶️ О решении:
Команда «in2AI» разработала инновационную архитектуру агентного Mixture-of-Experts. Ключевым элементом разработки стал многоуровневый роутер, который динамически выбирает наиболее подходящего «эксперта» для каждой ситуации. Выбор осуществляется на основе анализа поведения других агентов и особенностей окружающей среды, что позволяет значительно повысить эффективность взаимодействия и адаптацию к изменяющимся условиям.
В ходе исследования команда обнаружила, что повышение эмоциональности агента помогло успешно отвлекать противников от их целей и сделать их более сговорчивыми. Работа над проектом была проведена при активной образовательной поддержке LLM-трека магистратуры по искусственному интеллекту в ИТМО AI Talent Hub и Школе Анализа Данных в рамках научно-исследовательских проектов.
🔵 Оценка проводилась по ключевым навыкам созданных систем: переговоры, выполнение обещаний, сотрудничество и другие аспекты взаимодействия агентов друг с другом.
🟠 Подписаться на ИСП РАН
Команда «in2AI» разработала инновационную архитектуру агентного Mixture-of-Experts. Ключевым элементом разработки стал многоуровневый роутер, который динамически выбирает наиболее подходящего «эксперта» для каждой ситуации. Выбор осуществляется на основе анализа поведения других агентов и особенностей окружающей среды, что позволяет значительно повысить эффективность взаимодействия и адаптацию к изменяющимся условиям.
В ходе исследования команда обнаружила, что повышение эмоциональности агента помогло успешно отвлекать противников от их целей и сделать их более сговорчивыми. Работа над проектом была проведена при активной образовательной поддержке LLM-трека магистратуры по искусственному интеллекту в ИТМО AI Talent Hub и Школе Анализа Данных в рамках научно-исследовательских проектов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6 5⚡2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Seedream 4.0.
Помните историю c Mogao - загадочной генеративной моделью для картинок, которая побывала всех на image arena?
Это была Seedream 3.0
Последнюю неделю в чартах появилась ещё одна загадочная модель DK3.
Вчера выяснилось, что это Seedream 4.0 от Тиктока.
Seedream 4.0 представляет собой значительную эволюцию по сравнению с предыдущими моделями ByteDance Seed, объединяя возможности Seedream 3.0 (преобразование текста в изображение) и SeedEdit 3.0 (редактирование изображений) в одну мощную унифицированную модель. По сравнению с предыдущей моделью Seedream 3.0, она значительно лучше справляется с созданием читаемого и точного текста на изображениях. И рендерит в 4К. Можно кидать до 6 референсов на вход. Есть даже user guide.
Она уже появилась на всех агрегаторах, можно пробовать. Я пробовал на Fal.ai
И да, это конкурент Нанабананы. А стоит на 1 цент дешевле по АПИ. 0.03$
На мой взгляд она чуть уступает в точности Банане, но некоторые вещи, типа переноса стиля делает потрясающе. Ну и это не только редактор, но и генератор.
Никаких весов, только API.
Это очень круто, что у нас уже 4 "понимающих мир" модели: gpt-image, nano banana, qwen image/edit, Seedream 4.
Gpt-image, кстати, скоро обновится.
@cgevent
Помните историю c Mogao - загадочной генеративной моделью для картинок, которая побывала всех на image arena?
Это была Seedream 3.0
Последнюю неделю в чартах появилась ещё одна загадочная модель DK3.
Вчера выяснилось, что это Seedream 4.0 от Тиктока.
Seedream 4.0 представляет собой значительную эволюцию по сравнению с предыдущими моделями ByteDance Seed, объединяя возможности Seedream 3.0 (преобразование текста в изображение) и SeedEdit 3.0 (редактирование изображений) в одну мощную унифицированную модель. По сравнению с предыдущей моделью Seedream 3.0, она значительно лучше справляется с созданием читаемого и точного текста на изображениях. И рендерит в 4К. Можно кидать до 6 референсов на вход. Есть даже user guide.
Она уже появилась на всех агрегаторах, можно пробовать. Я пробовал на Fal.ai
И да, это конкурент Нанабананы. А стоит на 1 цент дешевле по АПИ. 0.03$
На мой взгляд она чуть уступает в точности Банане, но некоторые вещи, типа переноса стиля делает потрясающе. Ну и это не только редактор, но и генератор.
Никаких весов, только API.
Это очень круто, что у нас уже 4 "понимающих мир" модели: gpt-image, nano banana, qwen image/edit, Seedream 4.
Gpt-image, кстати, скоро обновится.
@cgevent
🔥3❤1⚡1
Gartner опубликовали Hype Cycle для ИИ в финансах.
Можно выделить 3 приоритетных направления, которые больше всего повлияют на бизнес в ближайшие годы:
- Генеративный ИИ — 80% поставщиков корпоративного ПО встроят GenAI к концу года (было менее 5% в 2024)
- Композитный ИИ — интеграция нескольких техник машинного обучения для комплексных задач
- Ответственный ИИ — фреймворк этики и соответствия регулированию вроде EU AI Act
Все три направления достигнут ступеньки массового внедрения в течение двух лет.
Еще интересные пункты из отчёта:
- ИИ сотрудники станут вашими коллегами и даже наблюдателями (надзирателями :) )
- уровень специализированного образования и способности коллег-людей вокруг вас резко упадут, что вызовет необходимость внедрения ещё бОльшего количества ИИ автоматизаций.
- регуляторный шторм, - количество новых законов и ограничений, которые будут выпускаться будет таким огромным, что разобраться со всем этим сможет только ваш личный корпоративный ИИ
Улыбаемся и машем.
Особый привет всем, кто ИИ внедрять не хотел или до сих пор считает игрушкой.
Краткая версия отчета в комментарии.
#Gartner #GenAI #FinTech
———
@tsingular
Можно выделить 3 приоритетных направления, которые больше всего повлияют на бизнес в ближайшие годы:
- Генеративный ИИ — 80% поставщиков корпоративного ПО встроят GenAI к концу года (было менее 5% в 2024)
- Композитный ИИ — интеграция нескольких техник машинного обучения для комплексных задач
- Ответственный ИИ — фреймворк этики и соответствия регулированию вроде EU AI Act
Все три направления достигнут ступеньки массового внедрения в течение двух лет.
Еще интересные пункты из отчёта:
- ИИ сотрудники станут вашими коллегами и даже наблюдателями (надзирателями :) )
- уровень специализированного образования и способности коллег-людей вокруг вас резко упадут, что вызовет необходимость внедрения ещё бОльшего количества ИИ автоматизаций.
- регуляторный шторм, - количество новых законов и ограничений, которые будут выпускаться будет таким огромным, что разобраться со всем этим сможет только ваш личный корпоративный ИИ
Улыбаемся и машем.
Особый привет всем, кто ИИ внедрять не хотел или до сих пор считает игрушкой.
Краткая версия отчета в комментарии.
#Gartner #GenAI #FinTech
———
@tsingular
✍4🔥3⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
Google дополнил Gemini CLI расширением для анализа безопасности
Техническая начинка:
- AI-анализ на базе Gemini с контекстным пониманием кода
- Запускается простой командой /security:analyze
- Интеграция напрямую в CLI — без отдельных инструментов
- Расширяемая архитектура для добавления новых типов анализа
- Apache 2.0 лицензия — можно форкать и дорабатывать под себя
Тесты на OpenSSF CVE Benchmark:
- Точность 90% — из всех найденных проблем 90% реальные
- Recall 93% — находит 93% известных уязвимостей в датасете
Что детектит:
- Hardcoded secrets (API keys, пароли, приватные ключи)
- Injection-уязвимости (XSS, SQLi, Command Injection, SSRF)
- Слабую криптографию (DES, RC4, ECB mode)
- Проблемы аутентификации и сессий
- Небезопасная десериализация
- Утечки персональных данных в логах
Практическое применение:
- DevSecOps-командам: автоматизация security review без замедления CI/CD
- Solo-разработчикам: экспертиза в кибербезе без найма специалиста
- Enterprise: первичный фильтр перед полноценным аудитом безопасности
Расширение позиционируется как "первичная проверка", не замена полноценного аудита.
Но с такими метриками — уже сейчас покрывает львиную долю типовых проблем.
Требует Gemini CLI v0.4.0+
GitHub
#Gemini #CLI #cybersecurity
———
@tsingular
Техническая начинка:
- AI-анализ на базе Gemini с контекстным пониманием кода
- Запускается простой командой /security:analyze
- Интеграция напрямую в CLI — без отдельных инструментов
- Расширяемая архитектура для добавления новых типов анализа
- Apache 2.0 лицензия — можно форкать и дорабатывать под себя
Тесты на OpenSSF CVE Benchmark:
- Точность 90% — из всех найденных проблем 90% реальные
- Recall 93% — находит 93% известных уязвимостей в датасете
Что детектит:
- Hardcoded secrets (API keys, пароли, приватные ключи)
- Injection-уязвимости (XSS, SQLi, Command Injection, SSRF)
- Слабую криптографию (DES, RC4, ECB mode)
- Проблемы аутентификации и сессий
- Небезопасная десериализация
- Утечки персональных данных в логах
Практическое применение:
- DevSecOps-командам: автоматизация security review без замедления CI/CD
- Solo-разработчикам: экспертиза в кибербезе без найма специалиста
- Enterprise: первичный фильтр перед полноценным аудитом безопасности
Расширение позиционируется как "первичная проверка", не замена полноценного аудита.
Но с такими метриками — уже сейчас покрывает львиную долю типовых проблем.
Требует Gemini CLI v0.4.0+
GitHub
#Gemini #CLI #cybersecurity
———
@tsingular
🔥3🆒2👾1
DeepMind запустил на Kaggle бенчмарк SimpleQA для проверки фактологической точности ИИ
Google DeepMind выпустил новый датасет и рейтинг на Kaggle для оценки фактологической точности ИИ-систем в задачах вопросов-ответов.
Бенчмарк фокусируется на коротких фактических вопросах с однозначными ответами и измеряет "калибровку" моделей - способность понимать уверенность в собственных знаниях.
Т.е. модели должны не просто отвечать, но и указывать процент уверенности в ответе.
Интересно, что даже GPT-4 показал неожиданно низкие результаты по сравнению с другими оценками.
Методология включает техники снижения предвзятости и использует RAG для имитации реальных сценариев поиска информации.
Наконец-то можно будет объективно мерить, когда ИИ выдумывает, а когда просто не знает. Хотя если GPT-4 провалился, то что говорить о остальных.
Имеет смысл, конечно, такие бенчи разворачивать локально, чтобы они показывали наглядную картинку именно на ваших данных.
Тут Каггл может выступать наглядным примером.
#DeepMind #SimpleQA #Kaggle #обучение
———
#tsingular
Google DeepMind выпустил новый датасет и рейтинг на Kaggle для оценки фактологической точности ИИ-систем в задачах вопросов-ответов.
Бенчмарк фокусируется на коротких фактических вопросах с однозначными ответами и измеряет "калибровку" моделей - способность понимать уверенность в собственных знаниях.
Т.е. модели должны не просто отвечать, но и указывать процент уверенности в ответе.
Интересно, что даже GPT-4 показал неожиданно низкие результаты по сравнению с другими оценками.
Методология включает техники снижения предвзятости и использует RAG для имитации реальных сценариев поиска информации.
Наконец-то можно будет объективно мерить, когда ИИ выдумывает, а когда просто не знает. Хотя если GPT-4 провалился, то что говорить о остальных.
Имеет смысл, конечно, такие бенчи разворачивать локально, чтобы они показывали наглядную картинку именно на ваших данных.
Тут Каггл может выступать наглядным примером.
#DeepMind #SimpleQA #Kaggle #обучение
———
#tsingular
👍4⚡1✍1
Base44 знатно пополнился функционалом
Продолжаем следить за успехами стартапа, про который последний раз мы вспоминали 3 месяца назад.
На сегодня доступно:
- Чат-агент создатель приложений
- Режим обсуждения
- Интеллектуальные дополнения и интеграции
- Управление базой данных
- Хранение файлов
- Интеграция с электронной почтой
- Обработка платежей
- Автогенерация API-эндпоинтов
- Аутентификация пользователей
- Создание интерактивных панелей аналитики
- Управление workflow
- Управление интеграциями
- Адаптивный дизайн
- Мгновенная стилизация
- Контроль версий
- Интеграция с GitHub
- Управление тестированием
- Кастомные домены
#Base44 #платформы
———
@tsingular
Продолжаем следить за успехами стартапа, про который последний раз мы вспоминали 3 месяца назад.
На сегодня доступно:
- Чат-агент создатель приложений
- Режим обсуждения
- Интеллектуальные дополнения и интеграции
- Управление базой данных
- Хранение файлов
- Интеграция с электронной почтой
- Обработка платежей
- Автогенерация API-эндпоинтов
- Аутентификация пользователей
- Создание интерактивных панелей аналитики
- Управление workflow
- Управление интеграциями
- Адаптивный дизайн
- Мгновенная стилизация
- Контроль версий
- Интеграция с GitHub
- Управление тестированием
- Кастомные домены
#Base44 #платформы
———
@tsingular
⚡2👍2✍1