креативный the creator
913 subscribers
1.64K photos
762 videos
1 file
921 links
Tg-редактор и креатор в Hi-Tech Mail.

Авторский блог про нейросети, технологии и научпоп.
Download Telegram
OpenAI всех надурили 🤩

Видели посты на этих выходных, о том что Альтман «убил математику»? Так вот OpenAI сильно поспешила объявить о «победе» своей модели на математической олимпиаде. Выяснилось, что результат не проходил официальную проверку, а сроки публикации грубо нарушили этику научного сообщества.

Что случилось: 19 июля исследователь Alexander Wei заявил в соцсетях: экспериментальная языковая модель компании решила 5 из 6 задач Международной математической олимпиады (IMO) и набрала 35 баллов из 42. Этого хватило для золотой медали — высшей награды престижного соревнования.

Задачи IMO считают одними из самых сложных в мире математики. Участники должны не просто найти ответ, а написать строгое математическое доказательство за 4,5 часа без калькулятора и интернета.

Обычно решения оценивают официальные эксперты олимпиады — 91 судья из разных стран. Но OpenAI пошла своим путем: пригласила троих бывших медалистов IMO и попросила их проверить ответы модели 🤩

Google поступила иначе. Их модель тоже набрала 35 баллов, но работы проверяли именно организаторы IMO по официальным критериям. Разница принципиальная — одно дело самопровозглашенная победа, другое — признание авторитетного жюри.

Второй подвох: организаторы IMO попросили все ИИ-лаборатории подождать неделю после церемонии закрытия с публикацией результатов. Цель проста: дать талантливым школьникам насладиться своим триумфом, не отвлекая внимание на достижения машин.

Google сдержала слово и планировала объявить результаты 28 июля. OpenAI же не выдержала и выложила пост в субботу — еще до окончания церемонии 🤩

Сейчас легитимность «золота» Альтмана вызывает серьезные сомнения. Модель балансирует на грани — 35 баллов это ровно минимум для высшей награды. Один неточно оцененный шаг в доказательстве, и медаль превращается в серебро.

Эксперт Google Thang Luong отметил: внутри IMO есть закрытые критерии оценки, недоступные посторонним. Без проверки по этим стандартам нельзя говорить о настоящей медали.


Пока OpenAI молчит о планах официальной верификации результатов, репутационные потери только растут. В научном сообществе такая спешка выглядит как погоня за хайпом в ущерб честности. Впрочем, как и всегда у Сэма 😐

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
👀9😁3🤨3😱2🤔1🥴1
Обновление у Qwen 💪

Alibaba выкатила обновленную Qwen3-235B-A22B-Instruct-2507. Модель с 22 млрд активных параметров порвала Kimi K2 с триллионом параметров. Недолго Kimi была на коне 🤩

Разрабы решили не париться с гибридным режимом и разделили обычную и думающую модели. Сейчас вышла обычная, Thinking-версия готовится к релизу.

На графике видим, что Qwen где-то обходит Claude 4 Opus... хм... сомнительно, но окей 🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥2👀2😁1
Нам такое надо 🤩

Если у вас, как и у меня, где-то в генах остался «совковый» код — вы не сможете пройти мимо этих салфеток на экран 🤩 Случайно наткнулась на них в соцсетях, а потом все как в тумане и вот я уже оформляю заказ на сайте. Шучу, пока не оформляю, жду зп 🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7😁6💯3🔥2🤝21
креативный the creator
2 кейса с Claude, которые вас повеселят и шокируют 🤪 Anthropic месяц позволяла своей Sonnet 3.7 управлять настоящим офисным вендинговым аппаратом — и получила неожиданный результат. Искусственный интеллект не просто торговал снеками, но начал считать себя…
Grok пошел по стопам Claude 🛍

Помните рассказывала, как Sonnet 3.7 управлять настоящим офисным вендинговым аппаратом и куда его это привело? Так вот в xAI решили повторить кейс и поставили в своей столовой автомат с едой, которым управляет Grok4 😏

Буду следить за этим «сериалом», очень интересно в какую экзистенциальную яму заведет торговля детище Маска. Или представьте, что его «нази» наклонности выйдут на новый уровень и он будет продавать напитки только лицам с арийской внешностью 🤩🤩🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8🤣3👀21💯1
креативный the creator
Вы же видели этот странный мета-мем «Умный человек в очках скачать обои»? Так вот Ян Топлес всех переиграл и поставил эту мемную фотку почти на все ролики в своем канале 🤩 А канал его, кстати, оч рекомендую. Лучший научпоп в отечественном ютубе 🤝🤝
This media is not supported in your browser
VIEW IN TELEGRAM
Рекомендую 👌

Господа 🧐 Завтра, или на днях, не забудьте глянуть свежий выпуск «умного человека» Яна Топлеса про Антарктиду. Это самое продолжительное видео в истории его канала. Автор определяет жанр как «трэвел-научпоп».

Путешествие команды Яна началось в Ушуайе (крайний южный город мира), а закончилось в антарктической станции «Беллинсгаузен» — самой северной точке континента. Ребята исследовали уникальные локации шестого материка, создав масштабный документальный контент 😱

Как ранее говорила, уже много лет смотрю Топлеса и качество его контента только хорошеет 👍

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍421🤝1
Qwen3-Coder 🤩

Что творит этот лев Alibaba. Компания вслед за обновой основной модели выпустила Qwen3-Coder. По бенчам ИИ-программист конкурирует с Claude Sonnet 4 😱

Новая модель работает по принципу «смеси экспертов»: из 480 млрд параметров активны только 35 млрд для конкретной задачи. Контекст — 256К токенов, легко расширяется до 1М. Система может анализировать целые репозитории и работать с крупными проектами — это серьезный шаг к автоматизации разработки ПО.

Ключевые особенности:

🔴Поддерживает 358 языков программирования
🔴Агентное программирование — планирует, использует инструменты, получает фидбек
🔴Обучена на 7,5 трлн токенов (70% — код)
🔴Превосходит не только Sonnet, но и GPT-4.1 в большинстве бенчмаркров


Экономика вопроса — 1 доллар за 1М входных токенов. Для сравнения у Claude в 3 раза больше.

Можно уже тестить в сервисе. Веса в открытом доступе на HuggingFace, поэтому скоро появится у всех провайдеров.

Уф, куда все так разогнались? 🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍532🔥2🤯1😱1
Часы смерти 💀

Создатель популярного научного канала Vsauce запустил предзаказ Death Clock — устройства в стиле 80-х, которое считает время до смерти пользователя. С помощью приложения анализируются показатели здоровья, а потом они сопоставляются с базой исследований.

Красная кнопка запускает обратный отсчет, серая переключает в режим обычных часов. На корпусе выгравированы латинские фразы «все удары часов ранят, последний убивает» и «ночь близится». Продукт стоит 79 долларов, релиз в 2026 году.

Как говорится, «Memento mori» 🤩
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👀7😱4👍32🍓1
Очень надеюсь, что в GPT 5 это пофиксят. Хотя кого я обманываю 🤩
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8👍2💯2🙏1
Wi-Fi роутеры могут идентифицировать людей — как по отпечаткам пальцев 🗣

Итальянские исследователи разработали систему WhoFi, которая анализирует искажения Wi-Fi сигнала от человеческого тела. Никаких камер, датчиков или приложений — только радиоволны.

Когда вы проходите мимо роутера, тело создает уникальный «отпечаток» — меняет распространение сигнала. Нейросеть запоминает этот паттерн и связывает его с человеком. WhoFi работает через стены на расстоянии до 6 метров. Различает до 8 человек одновременно. Точность распознавания — 95,5%. Это круче, чем Face ID в плохом освещении.

Чтобы запомнить человека системе нужно всего 5 минут. После этого она узнает его в 19 случаях из 20. Про анонимность можно забыть 🤩

↪️ Фото, кстати, из другого исследования, которое вышло пару лет назад. Так вот там, в 2022, люди могли только живые объекты в комнате различать с помощью волн. Вы представляете какой это скачек за 3 года 😱

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7😱3🤯2👀21
This media is not supported in your browser
VIEW IN TELEGRAM
GPT-5 быть 😍

Verge пишут, что OpenAI представит свою следующую флагманскую модель уже в начале августа. GPT-5 станет первой объединенной системой OpenAI, которая интегрирует reasoning-возможности серии o3 с традиционными языковыми функциями. Это означает, что пользователям больше не придется переключаться между разными моделями для решения различных задач — система сама адаптируется под конкретные потребности.

↪️ Кстати, тоже самое пробовали делать Qwen, но в последней обнове они отказались задумки. Модель не вывезла 🤩

Альтман недавно поделился личным опытом тестирования модели в подкасте с Тео Воном. Он рассказал, как задал системе сложный вопрос, с которым сам не смог справиться, а GPT-5 дал мгновенный и точный ответ.

«Это был странный момент — я почувствовал себя бесполезным по сравнению с ИИ», — признался Сэм. Если что, он так про каждую модель говорил 😄


GPT-5 получит расширенные мультимодальные способности, включая обработку текста, изображений и, возможно, видео. Контекстное окно тоже станет больше. Особое внимание разработчики уделили повышению точности и надежности ответов. Вместе с GPT-5 OpenAI выпустит mini и nano версии через свой API.

Ждемс 🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3🤩31🥱1🍾1
Инсайдеры слили примеры работы GPT 5 😂
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18👍3🤣3💯2
Подарки 🎁

Агент ChatGPT стал доступен подписчикам Plus и Team. А еще он скоро появится у ребят в Chat01, они мне сами сказали 👌

Это я к чему: продолжаем нашу еженедельную раздачу 500 кредитов в сервисе Chat01 ❤️

Напомню: это много. Один запрос к o3 стоит 2 кредита, а research — 40. Когда закончатся, можно будет докупить рублями без танцев с бубном 🤩


Что делать вы знаете. Результаты в воскресенье ночью. Обняла ❤️

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾53👍2🤝2
креативный the creator
Обновление у Qwen 💪 Alibaba выкатила обновленную Qwen3-235B-A22B-Instruct-2507. Модель с 22 млрд активных параметров порвала Kimi K2 с триллионом параметров. Недолго Kimi была на коне 🤩 Разрабы решили не париться с гибридным режимом и разделили обычную…
Ни дня без обновления Qwen 🔥

Как и обещалось, Alibaba дропнула новую версию думающей Qwen3-235B-A22B-Thinking-2507. Пишут, что она очень усиленно рассуждает — разбирает условие задачи, строит гипотезы, сама себя проверяет и приходит к выводу. Контекстное окно — до 256 тысяч токенов. Этого хватит для анализа больших документов или сложных технических задач.

На бенчмарке система чуть ли не превзошла все существующие решения, включая GPT-o3 😏 В математических олимпиадах AIME25 она набрала 92,3, в программировании — 74,1 балла, что значительно выше показателей конкурентов.

Модель уже есть на сайте Qwen. Нужно просто выбрать «235B-A22B-2507» и нажать «Мышление».


А еще разрабы дропнули модель для перевода текста — Qwen 3-MT. Но пользователи в X не очень довольны ее качеством 🤷‍♀️ Лично ее опробовать можно тут.

К команде Qwen у меня только один вопрос: «Вы вообще спите? Куда столько релизов. Подайте знак, если вас держат в рабстве» 🤣

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🔥3😁1🎉1