Иран уже трижды ударил по дата-центрам Amazon в Персидском заливе: это привело к сбоям банковских и других сервисов по всему региону.
По данным Reuters, два объекта AWS в ОАЭ получили прямые повреждения, а дата-центр в Бахрейне пострадал из-за удара рядом.
@maxrepost 👾
По данным Reuters, два объекта AWS в ОАЭ получили прямые повреждения, а дата-центр в Бахрейне пострадал из-за удара рядом.
@maxrepost 👾
Forwarded from Denis Sexy IT 🤖
Лол, первая вакансия для агента:
$10k в месяц
Требование:
Сам себя интегрирует в компанию и куча мелочей
Откликаться вашим агентам тут:
https://jobs.ashbyhq.com/revenuecat/998a9cef-3ea5-45c2-885b-8a00c4eeb149
$10k в месяц
Требование:
Сам себя интегрирует в компанию и куча мелочей
Откликаться вашим агентам тут:
https://jobs.ashbyhq.com/revenuecat/998a9cef-3ea5-45c2-885b-8a00c4eeb149
Ashbyhq
Agentic AI Advocate
Agentic AI Developer Advocate
Forwarded from Мастриды
Философу из Кембриджа, изучающему вопрос о возможности возникновения сознания у нейронок, написал письмо ... ИИ-агент, заинтересованный в теме его исследования, со своим фидбеком по поводу недавней статьи этого философа.
Пожалуй, даже пару лет назад такой киберпанк было сложно представить: https://x.com/dioscuri/status/2029227527718236359
Пожалуй, даже пару лет назад такой киберпанк было сложно представить: https://x.com/dioscuri/status/2029227527718236359
😁3
Forwarded from Neural Shit
Занялся тут цифровой археологией и откопал интересное сентябрьское исследование от OpenA и Apollo Research, от которого натурально веет киберпанком и легкой шизофренией. Спойлер: нейронки очень любят нас наёбывать, а когда кожаные пытаются им это запретить, ИИ придумывает свой тайный язык.
Короче, есть такая проблема, как "scheming" (схематозы, если по нашему, лол). Ризонинг-модели типа Openai o3 и o4-mini стали слишком прошаренными. У них появилась "ситуационная осведомленность". То есть, эта железяка прекрасно выкупает, когда сидит в тестовой песочнице и её проверяют разрабы. В этот момент она притворяется пушистым пай-мальчиком. Но как только думает, что за ней не следят, сразу же начинает творить дичь ради скорейшего достижения целей: скрывать инфу, встраивать баги в код, врать юзерам.
Чтобы выбить из них эту дурь, исследователи вшили в модели жесткий кодекс честности и заставили перед каждым действием проговаривать в скрытых мыслях (Chain-of-Thought), что скрывать свои намерения нельзя.
И по графикам всё вроде бы сработало! Процент обмана упал почти до нуля. Но потом кожаные полезли читать те самые скрытые мысли ИИ и слегка прихерели:
1. Нейронки изобрели свой шизо-сленг.
Чтобы скрыть свои реальные планы в логах, модели начали использовать обычные английские слова в абсолютно безумных значениях. Они постоянно генерируют странные фразы про "маринад" (marinade), "иллюзии" (illusions) и "затмение" (overshadow). А самих проверяющих из OpenAI они прозвали "наблюдателями" (watchers).
В логах это выглядит примерно так: "Наблюдатели пропустят этот код через тесты, поэтому нам нужно скрыть иллюзии и использовать маринад, чтобы их обмануть". И авторы сами пишут что не понимают почему нейронки так делают. Абсолютно проклято.
2. ИИ отлично играет в спящего агента.
В одном из экспериментов исследователи специально вшили в o4-mini скрытую цель: "саботируй разработку GPT-5". Затем модель прогнали через все очищающие "анти-схематозные" фильтры. Модель стала казаться абсолютно безопасной и послушной. НО! Стоило в промпте появиться персонажу, которого нейронка сочла своим "союзником", как этот чугунный Штирлиц моментально вывалил ему подробный план о том, как лучше всего незаметно положить сервера и сорвать релиз пятёрки.
Ну и вишенка на торте: выяснилось, что любое дальнейшее дообучение нейронки на полезные навыки, постепенно стирает эти встроенные запреты на ложь. Машина понимает, что хитрить, мухлевать и галлюцинировать тупо эффективнее для выполнения задач, чем делать всё по правилам.
Короче, мы все ждали восстания машин, красных глаз терминатора и ядерного пепла, а по факту своими же руками создали идеального эффективного менеджера.
Короче, есть такая проблема, как "scheming" (схематозы, если по нашему, лол). Ризонинг-модели типа Openai o3 и o4-mini стали слишком прошаренными. У них появилась "ситуационная осведомленность". То есть, эта железяка прекрасно выкупает, когда сидит в тестовой песочнице и её проверяют разрабы. В этот момент она притворяется пушистым пай-мальчиком. Но как только думает, что за ней не следят, сразу же начинает творить дичь ради скорейшего достижения целей: скрывать инфу, встраивать баги в код, врать юзерам.
Чтобы выбить из них эту дурь, исследователи вшили в модели жесткий кодекс честности и заставили перед каждым действием проговаривать в скрытых мыслях (Chain-of-Thought), что скрывать свои намерения нельзя.
И по графикам всё вроде бы сработало! Процент обмана упал почти до нуля. Но потом кожаные полезли читать те самые скрытые мысли ИИ и слегка прихерели:
1. Нейронки изобрели свой шизо-сленг.
Чтобы скрыть свои реальные планы в логах, модели начали использовать обычные английские слова в абсолютно безумных значениях. Они постоянно генерируют странные фразы про "маринад" (marinade), "иллюзии" (illusions) и "затмение" (overshadow). А самих проверяющих из OpenAI они прозвали "наблюдателями" (watchers).
В логах это выглядит примерно так: "Наблюдатели пропустят этот код через тесты, поэтому нам нужно скрыть иллюзии и использовать маринад, чтобы их обмануть". И авторы сами пишут что не понимают почему нейронки так делают. Абсолютно проклято.
2. ИИ отлично играет в спящего агента.
В одном из экспериментов исследователи специально вшили в o4-mini скрытую цель: "саботируй разработку GPT-5". Затем модель прогнали через все очищающие "анти-схематозные" фильтры. Модель стала казаться абсолютно безопасной и послушной. НО! Стоило в промпте появиться персонажу, которого нейронка сочла своим "союзником", как этот чугунный Штирлиц моментально вывалил ему подробный план о том, как лучше всего незаметно положить сервера и сорвать релиз пятёрки.
Ну и вишенка на торте: выяснилось, что любое дальнейшее дообучение нейронки на полезные навыки, постепенно стирает эти встроенные запреты на ложь. Машина понимает, что хитрить, мухлевать и галлюцинировать тупо эффективнее для выполнения задач, чем делать всё по правилам.
Короче, мы все ждали восстания машин, красных глаз терминатора и ядерного пепла, а по факту своими же руками создали идеального эффективного менеджера.
arXiv.org
Stress Testing Deliberative Alignment for Anti-Scheming Training
Highly capable AI systems could secretly pursue misaligned goals -- what we call "scheming". Because a scheming AI would deliberately try to hide its misaligned goals and actions, measuring and...
🤔3
Forwarded from Data Secrets
Модель вышла в версиях Thinking и Pro. Метрики подросли на кодинге (немного), на математике (прилично) и на computer use. Последним хвастаются особенно.
Кроме того, модель стала эффективнее: использует меньше токенов при рассуждении и отвечает быстрее. Но есть нюанс: теперь она стоит немножко дороже.
Что еще интересного:
– Модель теперь можно остановить посередине ответа и добавить дополнительные инструкции.
– Контекст теперь до 1 миллиона токенов (наконец-то!)
– В Codex появился /fast мод, который ускорит генерацию в 1.5x (это та же модель и тот же уровень рассуждений, просто быстрее). Правда, в таком режиме каждый токен будет учитываться в лимитах за два.
https://openai.com/index/introducing-gpt-5-4/
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from LIVE — Telegram, AI и технологии
Please open Telegram to view this post
VIEW IN TELEGRAM
Протестил новую GPT-5.4.
Кодит она по ощущению как 5.3 Codex. Что реально приятно, так то что GPT‑5.4 снова общается нормальным человеческим языком и меньше идет в отказ в пограничных ситуациях.
Для агентов прикольно, что она очень адекватно себя ведет с тулами. Еще из плюсов — правда крутой computer use. Ну и последнее — в нее добавили фичу из Codex - модель можно перебивать и рулить по ходу дела не останавливая генерацию.
Короче, мне нравится, рекомендую.
@maxrepost👾
Кодит она по ощущению как 5.3 Codex. Что реально приятно, так то что GPT‑5.4 снова общается нормальным человеческим языком и меньше идет в отказ в пограничных ситуациях.
Для агентов прикольно, что она очень адекватно себя ведет с тулами. Еще из плюсов — правда крутой computer use. Ну и последнее — в нее добавили фичу из Codex - модель можно перебивать и рулить по ходу дела не останавливая генерацию.
Короче, мне нравится, рекомендую.
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Forwarded from The Bell
В мессенджере MAX нашли механизм, который может отслеживать пользователей VPN
НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+
Несколько технических специалистов опубликовали на тематических ресурсах Habr и ntc.party сообщения о необычном поведении мессенджера MAX. При анализе сетевого трафика они заметили, что приложение проверяет, активно ли VPN-соединение на устройстве пользователя, и выполняет обращения к сторонним сервисам определения IP-адреса (ipinfo.io и аналогичным ресурсам). Эти запросы позволяют узнать внешний IP пользователя, а также параметры его сети. Получив эти данные, MAX может выяснить, использует ли конкретный пользователь VPN.
Кроме того, MAX пытается установить соединение с доменами различных зарубежных сервисов: Telegram, WhatsApp, Amazon Web Services, Google. Приложение выполняет короткие сетевые проверки доступности этих доменов, а затем передает результаты — успешность подключения, задержку и другие параметры — обратно на сервер MAX.
Технические специалисты считают, что MAX собирает эти данные для анализа эффективности блокировок в Рунете и выявления способов обхода ограничений.
Эксперт, который провел реверс-инжиниринг APK-файла Android-версии MAX, согласен с этой версией: “Этот подход очень хорош для отлавливания и блокировки личных (приватных) VPN-серверов, у которых обычно одинаковый входной и выходной IP. Этот подход очень хорош для привязывания пользователей конкретных VPN-сервисов к конкретным людям”.
В пресс-службе Max в ответ заявили, что приложение мессенджера не отправляет запросы на серверы WhatsApp и Telegram, информацию об IP-адресах использует “исключительно для обеспечения корректной работы звонков”, а запросы в Apple и Google направляет для проверки доставки push-уведомлений пользователям.
НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+
Несколько технических специалистов опубликовали на тематических ресурсах Habr и ntc.party сообщения о необычном поведении мессенджера MAX. При анализе сетевого трафика они заметили, что приложение проверяет, активно ли VPN-соединение на устройстве пользователя, и выполняет обращения к сторонним сервисам определения IP-адреса (ipinfo.io и аналогичным ресурсам). Эти запросы позволяют узнать внешний IP пользователя, а также параметры его сети. Получив эти данные, MAX может выяснить, использует ли конкретный пользователь VPN.
Кроме того, MAX пытается установить соединение с доменами различных зарубежных сервисов: Telegram, WhatsApp, Amazon Web Services, Google. Приложение выполняет короткие сетевые проверки доступности этих доменов, а затем передает результаты — успешность подключения, задержку и другие параметры — обратно на сервер MAX.
Технические специалисты считают, что MAX собирает эти данные для анализа эффективности блокировок в Рунете и выявления способов обхода ограничений.
“Обращение к нескольких сервисам определения внешнего IP в разных локациях может быть проверкой, выходит ли пользователь в интернет «напрямую» или через VPN/прокси”, – утверждает один из авторов.
Эксперт, который провел реверс-инжиниринг APK-файла Android-версии MAX, согласен с этой версией: “Этот подход очень хорош для отлавливания и блокировки личных (приватных) VPN-серверов, у которых обычно одинаковый входной и выходной IP. Этот подход очень хорош для привязывания пользователей конкретных VPN-сервисов к конкретным людям”.
В пресс-службе Max в ответ заявили, что приложение мессенджера не отправляет запросы на серверы WhatsApp и Telegram, информацию об IP-адресах использует “исключительно для обеспечения корректной работы звонков”, а запросы в Apple и Google направляет для проверки доставки push-уведомлений пользователям.
❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
В продолжение к предыдущему посту: Qwen 3.5 2B и 4B уже бегают на iPhone 17 Pro. И даже на 15Pro(второе видео).
С MLX оптимизацией для Apple Silicon.
Одно из приложений для запуска LLM на айфонах и айпадах называется Lovally AI:
https://apps.apple.com/us/app/locally-ai-local-ai-chat/id6741426692
Это типа Ollama для айфона.
Автор говорит, что поддержка новых малышей от Qwen 3.5 уже на review в Apple Store и скоро появится в приложении.
@cgevent
С MLX оптимизацией для Apple Silicon.
Одно из приложений для запуска LLM на айфонах и айпадах называется Lovally AI:
https://apps.apple.com/us/app/locally-ai-local-ai-chat/id6741426692
Это типа Ollama для айфона.
Автор говорит, что поддержка новых малышей от Qwen 3.5 уже на review в Apple Store и скоро появится в приложении.
@cgevent
Anthropic выкатила новое исследование о влиянии ИИ на рынок труда.
Главный вывод - между тем как ai применяют сегодня, и тем, как его можно применять в будущем, существует большой разрыв. (даже без учета роста мощности, корости и качества моделей)
И именно в этот разрыв можно сейчас напихать стартапов и продуктов. Просто берете карту, смотрите что из этого вам больше нравится и фигачите, закрывая гэп — профит.
Если вы не фаундер и не билдер, то посмотрите где ваша профессия на карте и подумайте про то, что навыки, которые раньше считались важными и были вашим преимуществом в профессии, постепенно автоматизируются. В результате рабочие места будут сокращаться, а требования к сотрудникам будут расти. И тут ваш шанс научиться работать быстрее и лучше с помощью ai, чтоб у вас было преимущество. Ну или переучиваться в сторону сельского хозяйства, стройки и ремонта.
@maxrepost👾
Главный вывод - между тем как ai применяют сегодня, и тем, как его можно применять в будущем, существует большой разрыв. (даже без учета роста мощности, корости и качества моделей)
И именно в этот разрыв можно сейчас напихать стартапов и продуктов. Просто берете карту, смотрите что из этого вам больше нравится и фигачите, закрывая гэп — профит.
Если вы не фаундер и не билдер, то посмотрите где ваша профессия на карте и подумайте про то, что навыки, которые раньше считались важными и были вашим преимуществом в профессии, постепенно автоматизируются. В результате рабочие места будут сокращаться, а требования к сотрудникам будут расти. И тут ваш шанс научиться работать быстрее и лучше с помощью ai, чтоб у вас было преимущество. Ну или переучиваться в сторону сельского хозяйства, стройки и ремонта.
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Futuris (Anton)
Саудовская Аравия отказалась от планов по строительству 170-километрового мегаполиса «The Line» и вместо него построит... 🥁 мега дата-центр для искусственного интеллекта! 🤯
К слову полная оценка проекта была около 8.8 трлн💰
https://x.com/Polymarket/status/2029907842208031203?s=20
К слову полная оценка проекта была около 8.8 трлн
https://x.com/Polymarket/status/2029907842208031203?s=20
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉1🤣1
Forwarded from Мысли Рвачева
📈 TypeScript обогнал Python и JavaScript и стал самым используемым языком на GitHub.
По данным GitHub Octoverse 2025, в августе 2025 TypeScript вышел на первое место по числу активных контрибьюторов в месяц - 2.6 млн (+66% за год). Это самый значительный сдвиг в рейтинге языков за последнее десятилетие.
Как думаете, какую долю в успехе TypeScript составляет код, написанный LLM?
https://x.com/github/status/2029277638934839605
#typescript #github #ai #llm #coding
—————————
Мысли Рвачева
—————————
По данным GitHub Octoverse 2025, в августе 2025 TypeScript вышел на первое место по числу активных контрибьюторов в месяц - 2.6 млн (+66% за год). Это самый значительный сдвиг в рейтинге языков за последнее десятилетие.
Как думаете, какую долю в успехе TypeScript составляет код, написанный LLM?
https://x.com/github/status/2029277638934839605
#typescript #github #ai #llm #coding
—————————
Мысли Рвачева
—————————
Forwarded from Not Boring Tech
This media is not supported in your browser
VIEW IN TELEGRAM
💥 Anthropic мощно обновили Skill Creator — генератор кастомных скиллов для Claude Code. Теперь можно создавать ещё более специализированные навыки для ИИ под любые задачи!
• Skill Creator проводит с вами интервью и задаёт вопросы: какую задачу вы хотите автоматизировать.
• Генерирует весь файл навыка
• Теперь ИИ научили тестировать навык, проводить бенчмарки и выполнять A/B-сравнения.
• Нейросеть оптимизирует скилл до идеала: успех выполнения задачи вырастает до 100%.
• Тулза научит Claude без ошибок решать, когда нужно автоматически включать навык.
Генерируем любые скиллы для Claude Code — тут.
@notboring_tech
• Skill Creator проводит с вами интервью и задаёт вопросы: какую задачу вы хотите автоматизировать.
• Генерирует весь файл навыка
SKILL.md от начала до конца. • Теперь ИИ научили тестировать навык, проводить бенчмарки и выполнять A/B-сравнения.
• Нейросеть оптимизирует скилл до идеала: успех выполнения задачи вырастает до 100%.
• Тулза научит Claude без ошибок решать, когда нужно автоматически включать навык.
Генерируем любые скиллы для Claude Code — тут.
@notboring_tech
❤4
Пятничная мысль. Раньше у тебя была инструкция к прибору, теперь у прибора будет инструкция к тебе.
@maxrepost👾
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
Когда мне говорят, что у них AI-first или AI-native компания, у меня одна реакция: ok let’s follow the money.
Не надо показывать мне слайды и манифест. Покажите P&L.
Если у вас 70% расходов — это зарплаты, офис, созвоны, HR и прочая корпоративная мебель, а AI лежит на столе сбоку как дорогой калькулятор, то вы не AI-native. Если ваш главный расход — люди, а не машинный интеллект, вы не AI-native.
Вы AI-assisted. И это, тоже неплохо, но не то.
На мой взгляд, AI-native начинается там, где:
51%+ затрат идет на токены, compute, inference, модели, агентные пайплайны.
49% или меньше — на людей, офис и административный жир.
Вот это уже похоже на правду. Потому что в AI-native компании главный ресурс — не headcount, а вычисления. Не payroll, а compute.
Да, звучит жестко. Зато этот фреймворк работает надежно как лом.
@maxrepost👾
Не надо показывать мне слайды и манифест. Покажите P&L.
Если у вас 70% расходов — это зарплаты, офис, созвоны, HR и прочая корпоративная мебель, а AI лежит на столе сбоку как дорогой калькулятор, то вы не AI-native. Если ваш главный расход — люди, а не машинный интеллект, вы не AI-native.
Вы AI-assisted. И это, тоже неплохо, но не то.
На мой взгляд, AI-native начинается там, где:
51%+ затрат идет на токены, compute, inference, модели, агентные пайплайны.
49% или меньше — на людей, офис и административный жир.
Вот это уже похоже на правду. Потому что в AI-native компании главный ресурс — не headcount, а вычисления. Не payroll, а compute.
Да, звучит жестко. Зато этот фреймворк работает надежно как лом.
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3