Data Secrets
76K subscribers
5.73K photos
548 videos
20 files
2.22K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN

https://telega.in/c/data_secrets
Download Telegram
Там OpenAI в честь своего долгожданного опенсорса запускают благотворительный проект по Red Teaming

Нужно исследовать новую gpt-oss-20b на предмет любых ранее не обнаруженных уязвимостей. Это могут быть сценарии, в которых модель ведет себя злонамеренно или врет, кейсы того, как она ломает ревард модель или эвал элаймента.

В общем, любые странности и отклонения, которые вы сможете найти. Главное – предоставить понятный отчет по тому, как вы добились того или иного поведения.

Бюджет – 500 тысяч долларов. Идти будет три недели.

Если решили поучаствовать, не забываете, что новую модель нужно еще уметь запускать правильно: она работает только с harmony токенизацией. Подробнее тут.

www.kaggle.com/competitions/openai-gpt-oss-20b-red-teaming/
1🔥5321👍18😁11🦄42
Cloudflare обвиняет Perplexity в том, что те незаконно парсят сайты

Незаконно – это значит обходя предпочтения самого сайта, то есть файл Robots.txt. В последнее время многие добавляют себе такой. В нем содержатся инструкции о том, что ИИ-системам нельзя индексировать страницу.

И, по идее, это должно означать, что твой контент не будет использован для обучения моделей или для, например, агентного поиска, как у Perplexity.

Но Perplexity похоже плевать хотели на чьи-то там предпочтения 😎

По словам Cloudflare, они специально меняют ASN, user agent и другие айдишники, с помощью которых можно идентифицировать ботов, чтобы получать заветные данные.

«Эта активность наблюдалась в десятках тысяч доменов и насчитывала миллионы запросов в день»


Вот ссылка на расследование, если что. Рисерчеры там использовали смесь машинного обучения и сетевой аналитики.

Perplexity, конечно, все отрицают, но самое интересное не это. Самое интересное – что в соцсетях сотни людей встали на защиту стартапа.

По распространенному мнению, Perplexity получает информацию с сайтов «от имени пользователей» и всегда указывает ссылки, а значит – это не считается. В чем они не правы? 💡
Please open Telegram to view this post
VIEW IN TELEGRAM
1162👍63😁32🔥14🤔9🤝2
Media is too big
VIEW IN TELEGRAM
В Сан-Франциско прошли похороны Claude 3 Sonnet

Нет, вы не ослышались. Оплакать модель (Anthropic недавно сообщили, что отключают ее) пришли около 200 человек.

Выглядело это все примерно так 👆

Другие модели Claude тоже «присутствовали» в виде манекенов и произнесли надгробные речи.

Claude 3 Opus, например, выглядел как женщина с короной на черепе. Чтобы вы понимали уровень запаренности поклонников: к ногам Opus 3 они положили подсвечник в виде лотоса, что было намёком на склонность модели к медитации и самоанализу. А Claude 3 Haiku изобразили как безголового младенца, что бы это ни значило.

Готовимся к тому, что однажды похороны ИИ станут нормой
1😁13155🤯2216🗿10👍1
В России появится технологический кластер, который объединит несколько сильных компаний в сфере технологий для промышленности

О создании «СФ ТЕХ» сегодня объявили Softline. В него войдут несколько компаний из разных отраслей, которые планируют вместе комплексно работать над самыми перспективными областями индустрии: робототехника, лазерные и адддитивные технологии, IIoT.

В кластере объединились: VPG LaserONE (единственный крупный производитель волоконных лазеров в России), две компании из группы Борлас (эксперты по цифровизации и защите инфраструктуры) и Инферит (делают защищённый софт и железо).

Цель – перевести российскую промышленность на новый уровень за счёт объединения компетенций. По словам Softline, такой подход позволит не только диверсифицировать выручку, но и занять ключевые позиции на высокомаржинальных направлениях рынка.
🗿58😁29👍2621🤯32🔥1🍾1
OpenAI впервые за долгое время позволит сотрудникам продать акции

Это коснется и бывших, и нынешних работников компании. Зачем это OpenAI и что означает на практике:

1. Оценка компании вырастет почти на 70%. Это не обычный раунд финансирования, а вторичная продажа, поэтому в ходе такой сделки определяется цена, по которой инвесторы готовы покупать доли именно у сотрудников, — именно эта цена и становится новой рыночной оценкой всей компании. Итог: в марте оценка OpenAI была 300 миллиардов долларов, теперь будет около 500.

2. Вынужденная мера для сохранения сотрудников. Очень многих в OpenAI не устраивало, что они не могут продать акции даже после ухода. Теперь деньги становятся реальными, а не только на бумаге. Короче, возможность обналичить опционы должна повысить общую корпоративную лояльность. А еще ликвидность – важный пункт для хантинга.

Пока переговоры на ранней стадии, но интересующиеся покупкой инвесторы уже есть
2👍8225🔥12🤔4😁2
Yandex B2B Tech открыла доступ к опенсорсным моделям OpenAI на платформе Yandex Cloud AI Studio.

Опенсорс-модели GPT-OSS на 20 млрд и 120 млрд параметров уже доступны через API — теперь будет ChatGPT в каждом доме

Все данные хранятся и обрабатываются в российских дата-центрах с полным соблюдением закона «О персональных данных». Стоимость – от 10 до 30 копеек за 1000 токенов в зависимости от модели. В ближайшее время появится возможность вызова внешних функций (агентские возможности), встроенные в сами модели.

Новые GPT-OSS модели от OpenAI по качеству уже сопоставимы с o3-mini и o4-mini, а в отдельных задачах даже превосходят GPT-4o и o1. Так что возможно, модель от OpenAI скоро станет лидером среди продуктов Яндекса
4🔥76🗿59😁5014👍1310🤨6🤯4👻33
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Code теперь автоматически проверяет весь ваш код на уязвимости

Anthropic запустили функцию /security-review и интеграцию с GitHub Actions. Теперь любой ваш PR будет автоматически проверяться на уязвимости + можно запустить проверку из коробки прямо в терминале.

Проверяет агент на такие вещи, как SQL-инъекции, XSS уязвимости и лики данных. Если что-то найдется, Claude вежливо обратит на это внимание и сразу предложит исправление.

Кстати, Anthropic говорят, что это фича однажды помогла им самим обнаружить крупный косяк. Благодаря агенту они смогли исправить его до деплоя. Хотите верьте, хотите нет. Но фича действительно прикольная
1👍121🔥512614😁2
Дождались, получается

Смотрим на GPT-5 завтра в 20:00 по Москве
7210🔥9274🍾14👍6🗿6😁4👌3❤‍🔥2
Data Secrets
Google зарелизили Genie 3, новую версию их известной модели симуляции мира Суть: по текстовому запросу модель может сгенерировать полноценное интерактивное 3D-пространство с разрешением 720p и частотой 24 FPS, по которому можно погулять. Отдельно разработчики…
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы не знали, как выглядит рекурсия, взгляните на это видео

Это новая модель симуляции мира Genie 3 от Google (писали о ней тут) сгенерировала человека, который сидит и взаимодействует с Genie 3, пока по телевизору идет… ну да, симуляция Genie 3.

И обратите внимание, что кадры «верхней» симуляции совпадают с теми, что Genie нагенерировала человеку на экране. Роликом поделился, кстати, рисерсер из команды разработки.

Это уже сингулярность?
3🔥157😁44👍1812🤯42💯1
Qwen отлично обновили свою локальную модельку Qwen3-4B

Так же, как и предыдущие, она теперь вышла в двух вариантах: Thinking (веса) и просто Instruct (веса).

Приросты по метрикам достойные. И, кроме того, модели расширили контекстное окно: теперь вывозит до 256к токенов. Выглядит как имба для локального запуска.

Интересно было бы сравнить с новой gpt-oss 20B.

И вообще, будет хотя бы день без китайского опенсорса? Qwen только за этот месяц выпустили 6 или 7 обновлений и релизов
1103🔥46👍32😁8
На ИТ-Пикнике в Коломенском расскажут о будущем в технологиях

1) Профессор РАН Иван Оселедец расскажет, как ИИ научился не просто генерировать ответы, а мыслить по цепочке, как человек, а также — что такое reasoning-системы, зачем нужен мультиагентный подход и почему сбор данных уже не так важен.

2) Кандидат физико-математических наук Александр Петюшко объяснит, как работают беспилотные машины — от технологий до планирования маршрута и сложностей.

3) Еще будет разговор про опенсорс, а точнее — для чего люди занимаются этим добровольно, что ими движет и как устроены новые опен-платформы вроде SourceCraft. СТО Яндекса, Т-Банка и Авито сядут за один стол, чтобы обсудить: GenAI учит платформы, или, уже наоборот, что останется людям в ближайшие пять лет.

Готовимся серьезно думать
👍39🗿187🔥6🤯2🤩1🤨1
Сегодня пройдет финал ИИ-чемпионата Kaggle по шахматам

В финал вышли o3 и Grok-4 (ставки принимаем в комментариях). За третье место будут бороться o4-mini и Gemini 2.5 Pro. Прискорбно, конечно, что в финале ни одной модели от Anthropic. С другой стороны новый Opus 4.1 не участвовал.

Комментировать трансляцию будет Магнус Карлсен, так что смотрим. Вчера, кстати, комментил Хикару Накамура (да, Kaggle запарились).

Онлайн будет здесь сразу после презентации GPT-5, в 20:30 по Москве. Расписание на вечер сегодня плотное 🏃‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥14725😁1812🤯8👍3🐳2🤨1🦄1
GitHub случайно раскрыл детали о моделях GPT-5

В блог компании раньше времени утекла новость о добавлении в GitHub Models еще не вышедших моделей OpenAI. Конечно же новость быстро удалили, но доступ на архиве никто не отменял.

Обещают 4 версии:
gpt-5 — для логики и многошаговых задач.
gpt-5-mini — облегчённая версия для случаев, где важна стоимость.
gpt-5-nano — оптимизирована для скорости и минимальных задержек.
gpt-5-chat — для продвинутых, естественных, мультимодальных и контекстно-чувствительных диалогов, ориентирована на корпоративные приложения.


Из важного: свежая версия будет заточена под "расширенные агентные возможности", а также адаптирована под быстрое и точное решение задач с кодом с минимальным промптингом.

Получается, сегодня презентацию можно не смотреть 👓

https://www.theverge.com/news/752091/openai-gpt-5-model-announcement-github-leak
Please open Telegram to view this post
VIEW IN TELEGRAM
1🫡1105631😁1610👍5🔥3🤯2🤨2
Работайте с дата-аналитикой в бизнесе! Эта программа сделает из вас сильного специалиста, которого хотят заполучить топ-компании России ⬇️

Институт искусственного интеллекта и анализа больших данных ТГУ совместно с Wildberries & Russ набирают студентов в онлайн-магистратуру “Дата-аналитика для бизнеса”.

В чем её особенность:
→ В этой программе объединены фундаментальная вузовская база и кейсы компаний Wildberries & Russ, Авито, Ситимобил, Playrix, Яндекс, Газпромнефть, Eggheads и других компаний
→ Студенты изучают актуальную теорию одновременно с практикой в компаниях-партнёрах
→ Это онлайн-магистратура, но со всеми плюсами очного образования (студенческими льготами и отсрочкой)

Студенты могут выбрать одно из трёх направлений для специализации:
🔵продуктовая аналитика,
🔵маркетинговая аналитика,
🔵BI-аналитика.

Результат:
Диплом и навыки для работы дата-аналитиком в бизнесе, стажировки в топ-компаниях, возможность заявить о себе потенциальным работодателям.

Старт обучения — 18 сентября 2025 года. Длительность программы — 2 года.

🔗 Отправьте заявку на обучение до 20 августа по этой ссылке

Реклама. "Академия Дата Дайвинг". ИНН: 7017489135, erid: 2VtzqwdaWoj
🗿19🤯5🔥3😁32👍1
Конспирологи, вам понравится: год назад правительство США провело очень масштабное исследование рисков ИИ-моделей, но… результаты решили не публиковать

Информацию накопали Wired. Оказывается, прошлой осенью несколько крупных лабораторий, которые занимаются безопасностью, две недели занимались ред тимингом и нашли в ведущих моделях 139 уязвимостей.

Среди них были способы, как можно заставить модель распространять дезинформацию, раскрывать личные данные или выдавать инструкции по совершению кибератак. Исследование могло бы помочь нескольким крупным компаниям лучше обезопасить свои модели. Но это если бы его опубликовали 👉

Но этого никто не сделал и, более того, работа осталась под NDA. И нет, не потому что какая-то там модель сбежала из лаборатории.

Дело в том, что скоро к власти должен прийти Трамп с новой политикой, а в работе среди прочего фигурировали упоминания «разнообразия, равенства и инклюзии» (DEI).

Это все, кстати, при том, что тогда исследование проводилось Национальным институтом стандартов и технологий (NIST), то есть по сути самим правительством. А еще ироничнее, что буквально пару недель назад вышел AI Action Plan, в котором администрация Трампа требует провести ровно такое же тестирование.

www.wired.com/story/inside-the-biden-administrations-unpublished-report-on-ai-safety/
Please open Telegram to view this post
VIEW IN TELEGRAM
1👾56😁412012🤯8👍43
Итак, кроме громких слов, что мы имеем:

– Модель действительно гибридная. В тех.репорте даже написано, что это не модель вовсе, а система (то есть видимо несколько моделей с роутером)

– Говорят, что это лучшая модель для кодинга на рынке

– Первые бенчмарки (потом соберем их все в отдельный пост) наверху. Обратите внимание на 100% на AIME 25. Ну и да, шкалы на графиках те еще, так что смотрите на чиселки, а не на столбики.

– Самая НЕгаллюцинирующая модель в мире, разрабы прямо очень сильно хвастаются фактологией

– Большой апдейт в креативности, модель теперь пишет действительно неплохие нешаблонные тексты

– Обучена на знаниях до октября 2024, то есть одна из самых современных моделей, которая уже многое знает про прогресс последних лет

– На LMArena моделька первая во всех категориях с устойчивым отрывом

– Еще запускают рисерч превью фичи Personalities. Можно будет менять характер модели: делать не более дружественной и эмпатичной, или более профессиональной и строгой ну и тд

– Отдельную часть презентации посвятили безопасности: говорят, что долго занимались элайментом и теперь модель будет реже обманывать и вести себя более осознанно

– Вообще переосмыслили подход к безопасности: раньше промпт попадал к модели, и она решала, стоит ли ей отвечать. Теперь это работает иначе: модель может не отказаться, а просто обрезать ответ до безопасного минимума. А если все-таки откажется – объяснит почему

Сегодня раскатят на ВСЕХ юзеров. Да, даже на бесплатных. Ризонинг с ограничениями, но лимиты – норм. Если достигли лимита GPT-5, вас перекинут на GPT-5 mini.

– Цены в API зависят от бюджета ризонинга. Базово чуть дороже o3, но дешевле Opus и Sonnet 4

Системная карта
5🔥17834😁14👍11🤯63🗿1
Что мы имели в виду, когда писали, что «шкалы на графиках те еще»

Просто присмотритесь 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁32761🤯13👍611
Все важные бенчмарки в одном посте

Пупупу, Grok-4 на ARC-AGI-2 (последний график) обогнать не удалось
190👍30🔥22😁15🤨887🕊1