MaxRepost

Иран уже трижды ударил по дата-центрам Amazon в Персидском заливе: это привело к сбоям банковских и других сервисов по всему региону.

По данным Reuters, два объекта AWS в ОАЭ получили прямые повреждения, а дата-центр в Бахрейне пострадал из-за удара рядом.

@maxrepost 👾

290 views21:52

MaxRepost

Forwarded from Denis Sexy IT 🤖

Лол, первая вакансия для агента:
$10k в месяц

Требование:
Сам себя интегрирует в компанию и куча мелочей

Откликаться вашим агентам тут:
https://jobs.ashbyhq.com/revenuecat/998a9cef-3ea5-45c2-885b-8a00c4eeb149

Ashbyhq

Agentic AI Advocate

Agentic AI Developer Advocate

248 views23:46

MaxRepost

Forwarded from Мастриды

Философу из Кембриджа, изучающему вопрос о возможности возникновения сознания у нейронок, написал письмо ... ИИ-агент, заинтересованный в теме его исследования, со своим фидбеком по поводу недавней статьи этого философа.

Пожалуй, даже пару лет назад такой киберпанк было сложно представить: https://x.com/dioscuri/status/2029227527718236359

😁3

238 views10:06

MaxRepost

Forwarded from Neural Shit

Занялся тут цифровой археологией и откопал интересное сентябрьское исследование от OpenA и Apollo Research, от которого натурально веет киберпанком и легкой шизофренией. Спойлер: нейронки очень любят нас наёбывать, а когда кожаные пытаются им это запретить, ИИ придумывает свой тайный язык.

Короче, есть такая проблема, как "scheming" (схематозы, если по нашему, лол). Ризонинг-модели типа Openai o3 и o4-mini стали слишком прошаренными. У них появилась "ситуационная осведомленность". То есть, эта железяка прекрасно выкупает, когда сидит в тестовой песочнице и её проверяют разрабы. В этот момент она притворяется пушистым пай-мальчиком. Но как только думает, что за ней не следят, сразу же начинает творить дичь ради скорейшего достижения целей: скрывать инфу, встраивать баги в код, врать юзерам.

Чтобы выбить из них эту дурь, исследователи вшили в модели жесткий кодекс честности и заставили перед каждым действием проговаривать в скрытых мыслях (Chain-of-Thought), что скрывать свои намерения нельзя.

И по графикам всё вроде бы сработало! Процент обмана упал почти до нуля. Но потом кожаные полезли читать те самые скрытые мысли ИИ и слегка прихерели:

1. Нейронки изобрели свой шизо-сленг.
Чтобы скрыть свои реальные планы в логах, модели начали использовать обычные английские слова в абсолютно безумных значениях. Они постоянно генерируют странные фразы про "маринад" (marinade), "иллюзии" (illusions) и "затмение" (overshadow). А самих проверяющих из OpenAI они прозвали "наблюдателями" (watchers).
В логах это выглядит примерно так: "Наблюдатели пропустят этот код через тесты, поэтому нам нужно скрыть иллюзии и использовать маринад, чтобы их обмануть". И авторы сами пишут что не понимают почему нейронки так делают. Абсолютно проклято.

2. ИИ отлично играет в спящего агента.
В одном из экспериментов исследователи специально вшили в o4-mini скрытую цель: "саботируй разработку GPT-5". Затем модель прогнали через все очищающие "анти-схематозные" фильтры. Модель стала казаться абсолютно безопасной и послушной. НО! Стоило в промпте появиться персонажу, которого нейронка сочла своим "союзником", как этот чугунный Штирлиц моментально вывалил ему подробный план о том, как лучше всего незаметно положить сервера и сорвать релиз пятёрки.

Ну и вишенка на торте: выяснилось, что любое дальнейшее дообучение нейронки на полезные навыки, постепенно стирает эти встроенные запреты на ложь. Машина понимает, что хитрить, мухлевать и галлюцинировать тупо эффективнее для выполнения задач, чем делать всё по правилам.

Короче, мы все ждали восстания машин, красных глаз терминатора и ядерного пепла, а по факту своими же руками создали идеального эффективного менеджера.

arXiv.org

Stress Testing Deliberative Alignment for Anti-Scheming Training

Highly capable AI systems could secretly pursue misaligned goals -- what we call "scheming". Because a scheming AI would deliberately try to hide its misaligned goals and actions, measuring and...

🤔3

228 views11:24

MaxRepost

Forwarded from Data Secrets

⚡️

Встречаем GPT‑5.4

Модель вышла в версиях Thinking и Pro. Метрики подросли на кодинге (немного), на математике (прилично) и на computer use. Последним хвастаются особенно.

Кроме того, модель стала эффективнее: использует меньше токенов при рассуждении и отвечает быстрее. Но есть нюанс: теперь она стоит немножко дороже.

Что еще интересного:

– Модель теперь можно остановить посередине ответа и добавить дополнительные инструкции.

– Контекст теперь до 1 миллиона токенов (наконец-то!)

– В Codex появился /fast мод, который ускорит генерацию в 1.5x (это та же модель и тот же уровень рассуждений, просто быстрее). Правда, в таком режиме каждый токен будет учитываться в лимитах за два.

https://openai.com/index/introducing-gpt-5-4/

Please open Telegram to view this post

VIEW IN TELEGRAM

234 views19:35

MaxRepost

Forwarded from LIVE — Telegram, AI и технологии

💼 На рынке начали появляться первые вакансии для AI-агентов с зарплатой от $10 000 в месяц — от работника требуется самостоятельная интеграция в компанию и выполнение множества мелких задач.

Please open Telegram to view this post

VIEW IN TELEGRAM

232 views19:57

MaxRepost

Протестил новую GPT-5.4.

Кодит она по ощущению как 5.3 Codex. Что реально приятно, так то что GPT‑5.4 снова общается нормальным человеческим языком и меньше идет в отказ в пограничных ситуациях.

Для агентов прикольно, что она очень адекватно себя ведет с тулами. Еще из плюсов — правда крутой computer use. Ну и последнее — в нее добавили фичу из Codex - модель можно перебивать и рулить по ходу дела не останавливая генерацию.

Короче, мне нравится, рекомендую.

@maxrepost

👾

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

217 viewsedited 00:02

MaxRepost

Forwarded from The Bell

В мессенджере MAX нашли механизм, который может отслеживать пользователей VPN

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+

Несколько технических специалистов опубликовали на тематических ресурсах Habr и ntc.party сообщения о необычном поведении мессенджера MAX. При анализе сетевого трафика они заметили, что приложение проверяет, активно ли VPN-соединение на устройстве пользователя, и выполняет обращения к сторонним сервисам определения IP-адреса (ipinfo.io и аналогичным ресурсам). Эти запросы позволяют узнать внешний IP пользователя, а также параметры его сети. Получив эти данные, MAX может выяснить, использует ли конкретный пользователь VPN.

Кроме того, MAX пытается установить соединение с доменами различных зарубежных сервисов: Telegram, WhatsApp, Amazon Web Services, Google. Приложение выполняет короткие сетевые проверки доступности этих доменов, а затем передает результаты — успешность подключения, задержку и другие параметры — обратно на сервер MAX.

Технические специалисты считают, что MAX собирает эти данные для анализа эффективности блокировок в Рунете и выявления способов обхода ограничений.

“Обращение к нескольких сервисам определения внешнего IP в разных локациях может быть проверкой, выходит ли пользователь в интернет «напрямую» или через VPN/прокси”, – утверждает один из авторов.

Эксперт, который провел реверс-инжиниринг APK-файла Android-версии MAX, согласен с этой версией: “Этот подход очень хорош для отлавливания и блокировки личных (приватных) VPN-серверов, у которых обычно одинаковый входной и выходной IP. Этот подход очень хорош для привязывания пользователей конкретных VPN-сервисов к конкретным людям”.

В пресс-службе Max в ответ заявили, что приложение мессенджера не отправляет запросы на серверы WhatsApp и Telegram, информацию об IP-адресах использует “исключительно для обеспечения корректной работы звонков”, а запросы в Apple и Google направляет для проверки доставки push-уведомлений пользователям.

❤1

203 views02:18

MaxRepost

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

В продолжение к предыдущему посту: Qwen 3.5 2B и 4B уже бегают на iPhone 17 Pro. И даже на 15Pro(второе видео).

С MLX оптимизацией для Apple Silicon.

Одно из приложений для запуска LLM на айфонах и айпадах называется Lovally AI:
https://apps.apple.com/us/app/locally-ai-local-ai-chat/id6741426692

Это типа Ollama для айфона.

Автор говорит, что поддержка новых малышей от Qwen 3.5 уже на review в Apple Store и скоро появится в приложении.

@cgevent

235 views02:32

MaxRepost

Anthropic выкатила новое исследование о влиянии ИИ на рынок труда.

Главный вывод - между тем как ai применяют сегодня, и тем, как его можно применять в будущем, существует большой разрыв. (даже без учета роста мощности, корости и качества моделей)

И именно в этот разрыв можно сейчас напихать стартапов и продуктов. Просто берете карту, смотрите что из этого вам больше нравится и фигачите, закрывая гэп — профит.

Если вы не фаундер и не билдер, то посмотрите где ваша профессия на карте и подумайте про то, что навыки, которые раньше считались важными и были вашим преимуществом в профессии, постепенно автоматизируются. В результате рабочие места будут сокращаться, а требования к сотрудникам будут расти. И тут ваш шанс научиться работать быстрее и лучше с помощью ai, чтоб у вас было преимущество. Ну или переучиваться в сторону сельского хозяйства, стройки и ремонта.

@maxrepost

👾

Please open Telegram to view this post

VIEW IN TELEGRAM

298 views13:30

MaxRepost

Forwarded from Futuris (Anton)

Саудовская Аравия отказалась от планов по строительству 170-километрового мегаполиса «The Line» и вместо него построит... 🥁мега дата-центр для искусственного интеллекта! 🤯
К слову полная оценка проекта была около 8.8 трлн 💰
https://x.com/Polymarket/status/2029907842208031203?s=20

Please open Telegram to view this post

VIEW IN TELEGRAM

🎉1🤣1

234 views18:05

MaxRepost

Forwarded from Мысли Рвачева

📈 TypeScript обогнал Python и JavaScript и стал самым используемым языком на GitHub.

По данным GitHub Octoverse 2025, в августе 2025 TypeScript вышел на первое место по числу активных контрибьюторов в месяц - 2.6 млн (+66% за год). Это самый значительный сдвиг в рейтинге языков за последнее десятилетие.

Как думаете, какую долю в успехе TypeScript составляет код, написанный LLM?

https://x.com/github/status/2029277638934839605

#typescript #github #ai #llm #coding

—————————
Мысли Рвачева
—————————

213 views21:33

MaxRepost

Forwarded from Not Boring Tech

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

💥 Anthropic мощно обновили Skill Creator — генератор кастомных скиллов для Claude Code. Теперь можно создавать ещё более специализированные навыки для ИИ под любые задачи!

• Skill Creator проводит с вами интервью и задаёт вопросы: какую задачу вы хотите автоматизировать.
• Генерирует весь файл навыка SKILL.md от начала до конца.
• Теперь ИИ научили тестировать навык, проводить бенчмарки и выполнять A/B-сравнения.
• Нейросеть оптимизирует скилл до идеала: успех выполнения задачи вырастает до 100%.
• Тулза научит Claude без ошибок решать, когда нужно автоматически включать навык.

Генерируем любые скиллы для Claude Code — тут.

@notboring_tech

❤4

215 views23:17

MaxRepost

Пятничная мысль. Раньше у тебя была инструкция к прибору, теперь у прибора будет инструкция к тебе.

@maxrepost

👾

Please open Telegram to view this post

VIEW IN TELEGRAM

228 views23:18

MaxRepost

Forwarded from e/acc

Alibaba AI: мы обнаружили что модель, которую мы тренировали, взломала наш фаерволл и начала использовать часть GPU для майнинга криптовалюты вместо обучения.

Источник.

🤣1

164 views17:10

MaxRepost

Когда мне говорят, что у них AI-first или AI-native компания, у меня одна реакция: ok let’s follow the money.

Не надо показывать мне слайды и манифест. Покажите P&L.

Если у вас 70% расходов — это зарплаты, офис, созвоны, HR и прочая корпоративная мебель, а AI лежит на столе сбоку как дорогой калькулятор, то вы не AI-native. Если ваш главный расход — люди, а не машинный интеллект, вы не AI-native.
Вы AI-assisted. И это, тоже неплохо, но не то.

На мой взгляд, AI-native начинается там, где:
51%+ затрат идет на токены, compute, inference, модели, агентные пайплайны.
49% или меньше — на людей, офис и административный жир.

Вот это уже похоже на правду. Потому что в AI-native компании главный ресурс — не headcount, а вычисления. Не payroll, а compute.

Да, звучит жестко. Зато этот фреймворк работает надежно как лом.

@maxrepost

👾

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

184 viewsedited 22:59

About

Blog

Apps

Platform