This media is not supported in your browser
VIEW IN TELEGRAM
У чат-бота Grok появился собственный Canvas.
Теперь Grok Studio может запускать код на Python, C++, JS, TS, Bash и HTML прямо в браузере, а еще его научили подключаться к Google Drive, что позволяет загружать свои документы, таблицы и презентации в нейронку прямо из облака. Доступен этот функционал абсолютно всем - даже юзерам без подписки.
Тестируем тут.
Теперь Grok Studio может запускать код на Python, C++, JS, TS, Bash и HTML прямо в браузере, а еще его научили подключаться к Google Drive, что позволяет загружать свои документы, таблицы и презентации в нейронку прямо из облака. Доступен этот функционал абсолютно всем - даже юзерам без подписки.
Тестируем тут.
OpenAI опять впереди планеты всей - компания выпустила самые умные думающие модели на рынке (o3 и o4-mini).
o4-mini представляет из себя уменьшенную версию умнейшей o4, которую OpenAI буквально боятся выпускать (об этом говорил Сэм Альтман), а o3 это просто очень умная модель, которая отлично справляется с кодингом и решением математических задач.
А еще обе модели умеют использовать изображения в своей цепочки рассуждений. Протестить их можно будет уже сегодня - компания уже начала раздавать доступ для платных и бесплатных юзеров.
o4-mini представляет из себя уменьшенную версию умнейшей o4, которую OpenAI буквально боятся выпускать (об этом говорил Сэм Альтман), а o3 это просто очень умная модель, которая отлично справляется с кодингом и решением математических задач.
А еще обе модели умеют использовать изображения в своей цепочки рассуждений. Протестить их можно будет уже сегодня - компания уже начала раздавать доступ для платных и бесплатных юзеров.
Новая модель от OpenAI GPT-o3 - это типичный программист, который постоянно оправдывается.
Исследователи проверили новую модель на галлюцинации и результаты, мягко говоря, забавные:
- Если код не будет работать, то модель может сказать, что она запускала его на своем MacBook и все работало, так что ошибка где-то у тебя.
- Может сказать, что она правильно ответила, скопировала ответ, а он «стал неправильным» в буфере обмена.
- Или не сможет предоставить ответ, потому что «потеряла» его и оригинальный «правильный» ответ уже не найти, потому что случайно скопировался неправильный.
Исследователи проверили новую модель на галлюцинации и результаты, мягко говоря, забавные:
- Если код не будет работать, то модель может сказать, что она запускала его на своем MacBook и все работало, так что ошибка где-то у тебя.
- Может сказать, что она правильно ответила, скопировала ответ, а он «стал неправильным» в буфере обмена.
- Или не сможет предоставить ответ, потому что «потеряла» его и оригинальный «правильный» ответ уже не найти, потому что случайно скопировался неправильный.
🚀EvaTeam выпустила бесплатную версию EvaDev для IT-компаний, версия доступна в варианте on-premise на 10 пользователей.
✅ В EvaDev вся линейка продуктов EvaTeam для управления IT-проектами: EvaProject (Jira 2.0), EvaWiki (Сonfluence 2.0), EvaServiceDesk (Jira SM 2.0), EvaRMS, EvaTest, EvaGit.
1️⃣ Более 1200 функций по управлению IT-проектами от управления требованиями до поддержки готового приложения и сбора обратной связи.
2️⃣ Легкая миграция данных из других систем (Jira, YouTrack, Confluence и др.) в полном объеме и без потерь.
3️⃣ Масштабируемость под предприятия любого размера.
🚀Решениям EvaTeam доверяют: «Авито», «ВкусВилл», «СберМобайл», ДОМ.PФ, Knauf и сотни других.
👉 Получить бесплатную версию можно по ссылке
✅ В EvaDev вся линейка продуктов EvaTeam для управления IT-проектами: EvaProject (Jira 2.0), EvaWiki (Сonfluence 2.0), EvaServiceDesk (Jira SM 2.0), EvaRMS, EvaTest, EvaGit.
1️⃣ Более 1200 функций по управлению IT-проектами от управления требованиями до поддержки готового приложения и сбора обратной связи.
2️⃣ Легкая миграция данных из других систем (Jira, YouTrack, Confluence и др.) в полном объеме и без потерь.
3️⃣ Масштабируемость под предприятия любого размера.
🚀Решениям EvaTeam доверяют: «Авито», «ВкусВилл», «СберМобайл», ДОМ.PФ, Knauf и сотни других.
👉 Получить бесплатную версию можно по ссылке
Google выпустили Gemini 2.5 Flash для программистов - авторы уверяют, что новой нейронке по плечу даже самые сложные запросы.
По некоторым показателям модель даже превосходит Claude Sonnet 3.7 и Grok-3, несмотря на то, что на разработку было затрачено существенно меньше ресурсов. Главные преимущества:
Нейросеть самостоятельно определяет необходимое время для решения задачи, учитывая её сложность, и чётко планирует весь ход размышлений. А пользователь в свою очередь может покопаться в настройках и задать количество токенов для каждой «мысли», другими словами - юзер может сам контролировать глубину рассуждений модели.
Тестируем тут.
По некоторым показателям модель даже превосходит Claude Sonnet 3.7 и Grok-3, несмотря на то, что на разработку было затрачено существенно меньше ресурсов. Главные преимущества:
Нейросеть самостоятельно определяет необходимое время для решения задачи, учитывая её сложность, и чётко планирует весь ход размышлений. А пользователь в свою очередь может покопаться в настройках и задать количество токенов для каждой «мысли», другими словами - юзер может сам контролировать глубину рассуждений модели.
Тестируем тут.
This media is not supported in your browser
VIEW IN TELEGRAM
Бенчмарки, которые мы заслужили: исследователи из Принстона представили Video Game Bench.
VGBench представляет из себя бенчмарк, в котором ИИ-моделям необходимо пройти 20 классических игр из 1990х.
Результаты пока так себе: ни одна из представленных на видео моделей не смогла пройти даже первый уровень в Doom II. Одна из главных проблем заключается в том, что модели часто путают мертвых врагов с живыми и тратят на них все патроны.
VGBench представляет из себя бенчмарк, в котором ИИ-моделям необходимо пройти 20 классических игр из 1990х.
Результаты пока так себе: ни одна из представленных на видео моделей не смогла пройти даже первый уровень в Doom II. Одна из главных проблем заключается в том, что модели часто путают мертвых врагов с живыми и тратят на них все патроны.
Forwarded from Skolkovo LIVE
Please open Telegram to view this post
VIEW IN TELEGRAM
Apple вставили Android-смартфон в рекламу своих новых универсальных кабелей Beats с USB-C.
Что бы это могло значить: аккуратный намек на сотрудничество или тонкий троллинг?
Что бы это могло значить: аккуратный намек на сотрудничество или тонкий троллинг?
Американец работал на 13 компаний одновременно и за 3 года заработал почти $1 млн, но теперь ему грозит 20 лет тюрьмы.
Мин Вонг, не имея ни диплома, ни опыта работы, устроился в 13 IT-компаний, включая подрядчиков Пентагона, а всю работу за него выполняли кодеры из Китая - он предоставил им удаленный доступ к служебному ноутбуку и делился зарплатой.
По итогу на протяжении трех лет у китайских прогеров был доступ к правительственным системам США, связанным с инфраструктурой и обороной, и никто об этом не знал, но ФБР раскрыли схему и теперь Вонг, вероятнее всего, отправится в тюрьму.
Мин Вонг, не имея ни диплома, ни опыта работы, устроился в 13 IT-компаний, включая подрядчиков Пентагона, а всю работу за него выполняли кодеры из Китая - он предоставил им удаленный доступ к служебному ноутбуку и делился зарплатой.
По итогу на протяжении трех лет у китайских прогеров был доступ к правительственным системам США, связанным с инфраструктурой и обороной, и никто об этом не знал, но ФБР раскрыли схему и теперь Вонг, вероятнее всего, отправится в тюрьму.
Забавная рекомендация от Anthropic: оказывается, чтобы получить от Claude максимально точный ответ, нужно попросить нейронку «ультрадумать».
В своем новом гайде для Claude Code разрабы прямо так и написали: «думай» < «думай усердно» < «думай усерднее» < «ультрадумай».
При использовании перечисленных слов степень обдумывания ответа нейросетью постепенно увеличивается, поэтому «ultrathink» стоит использовать для самых сложных задач, поскольку время ответа в таком режиме увеличивается.
В своем новом гайде для Claude Code разрабы прямо так и написали: «думай» < «думай усердно» < «думай усерднее» < «ультрадумай».
При использовании перечисленных слов степень обдумывания ответа нейросетью постепенно увеличивается, поэтому «ultrathink» стоит использовать для самых сложных задач, поскольку время ответа в таком режиме увеличивается.
Вежливое общение с ChatGPT обходится OpenAI в десятки миллионов долларов.
CEO OpenAI Сэм Альтман рассказал, что на слова «спасибо» и «пожалуйста», которые пользователи пишут моделям компании, они тратят баснословные деньги.
Больше с нейронками не церемонимся.
CEO OpenAI Сэм Альтман рассказал, что на слова «спасибо» и «пожалуйста», которые пользователи пишут моделям компании, они тратят баснословные деньги.
Больше с нейронками не церемонимся.