Пупырка AI
120 subscribers
742 photos
385 videos
1 file
721 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Forwarded from Zavtracast (Ярослав Ивус)
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity выпустила голосового помощника для iOS — он даже умеет выполнять базовые задачи на iPhone. Например, может написать черновик письма прямо в приложении «Почта», открыть ссылку с бронью отеля на основе заданной вами информации, включить подкаст по описанию и поставить напоминание в «Календаре».

В будущем Perplexity хотят добавить интеграцию с Gmail и Google Календарём. Кроме того, голосовой режим можно забиндить на Action button и использовать вместо Siri.

Если вы будете использовать голосовой режим Perplexity не на английском, то выберите язык для распознания в настройках. Русский среди них тоже есть.

@zavtracast
Media is too big
VIEW IN TELEGRAM
Убийца AI-ассистента Apple, говорили они. Perplexity добавили в свое приложение голосового ассистента. Теперь весь твиттер кричит, что они убили Siri.

По порядку:

1. Нельзя убить то, что мертво. Siri даже с последними обновлениями (тот самый Apple Assistant) — это оторванная от реальности технология. Об этом чуть позже.

2. Ассистент Perplexity сейчас может ограниченное количество вещей: взаимодействовать со встроенным календарем, картами, почтовым клиентом, заказать Uber и найти YouTube-видео. Все это сложно назвать революцией, эти сценарии людям (на самом деле) не очень нужны. Когда я добавляю ивент в календарь, чаще всего у меня есть время это сделать вдумчиво. Вызов Uber привычнее руками. В картах ты не всегда точно знаешь, куда идешь: проверил Perplexity попросив проложить маршрут до ближайшего банка. Ассистент нашел банк в 20 минутах. На самом деле отделение находится в трех.

3. Другие вещи, которые нужны, к примеру, мне, ассистент не умеет по многим причинам: ограничения iOS или нишевость задач — ну не может он найти мой паспорт в фотках, а это мне нужнее сделать быстро голосом, чем добавить ивент в календарь. И не может написать письмо в Hey App, а не в нативном аппе. И не может добавить ту-ду в виджет, потому что этот виджет вообще я сам сделал. И не может найти в файлах PDF.

4. У Perplexity есть лента новостей. Тоже бесполезная для меня, но полезная для сервиса. Это оправдание для ежедневного пуша с напоминанием о себе. И кажется мне, что новый ассистент нужен в том числе для этого. Это не революция, это допсценарий, который увеличивает число касаний с аппом и привлекает новых юзеров другим способом.

5. Perplexity делают это все ради того, чтобы люди пользовались их основным продуктом: классным поиском и сопряженными с этим функциями подготовки рисеча. Тут это мой ежедневный инструмент, который я использую для работы и жизни вместе с ChatGPT. И если к нему добавится возможность иногда голосом добавить в календарь событие — ну пусть, класс. А для кого-то эта функциональность — вход в Perplexity. И вот тут дальше стоит сказать про основной продукт.

6. Но я зря говорю про бесполезность новых функций. Это первый шаг. Компания сейчас разрабатывает свой браузер. Это путь ко всем веб-аппам и веб-сервисам. Вот тут ассистент сможет разгуляться и никакие ограничения iOS его не остановят. Это жду. Браузер с поиском — AI-агент, который закрывает все задачи, который онлайн.

7. В сухом остатке: не верим словам про революцию сегодня и убийство Siri, но следим, что будет дальше. Для ежедневных задач глубокого рисеча без ограничений — Perplexity топ (а еще не требует VPN). Буквально мой рейтинг использования AI-сервисов выглядит сейчас так: 1. ChatGPT о3 2. Perplexity Deep Research 3. ChatGPT Deep Research (делает классно, но есть ограничения использования в месяц).

➡️ Включите уведомления, чтобы не пропускать полезные советы по AI, тренды, рекомендации сериалов, фильмов, книг и музыки.

➡️ Если пост оказался вам полезен, буду благодарен шеру. @danieltrbn
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from e/acc
This media is not supported in your browser
VIEW IN TELEGRAM
Сделал ИИ, который умеет от моего лица отвечать на личные сообщения (и группы) в телеграме. У меня уже есть подобная штука для gmail (в рамках CybOS), а теперь и для телеги. В видео голосом рассказываю как это работает.

— принимает и анализирует все личные сообщения
— отвечает от моего моего лица (собеседник не видит, что это бот)
— умеет генерировать ответ на основе всей истории переписки + кастомных правил в промте относительно стиля и целей

Цель: сделать так, чтобы 90% входящих сообщений обрабатывалась автоматически, а я мог фокусироваться только на самых важных
CPO OpenAI в Lenny's podcast, оч интересно, всячески рекомендую. Да, это именно тот человек который виноват в o3-mini-high и других шедеврах нейминга )

Там есть супер красивая история как их HRD сама пошла и навайбкодила (!) внутренний инструмент которого ей не хватало. Я верю что компании будущего так и должны жить - любой человек может создавать нужные ему инженерные решения лично сам. Эй, HRD, берите пример )

Что ещё классного:

1. Evals - ключевой навык продакт менеджеров и инженеров. Если ты не можешь правильно проверить работу системы на llm, ты не продвинешься дальше прототипов. Что такое эвалы и почему они важны можно почитать например тут

2. Никаких роадмапов на 3 месяца. Ребята живут в мире где через пару месяцев выйдет очередная модель которая опять всё кардинально поменяет. Поэтому никаких долгих роадмапов, только гибкость и только хардкор. Сравните это с вашей компанией ))

3. Bottom-up company
Так как путь неизвестен, то стратегия OpenAI это иметь супер-дальний ориентир (e.g. создание AGI), а работу строить как набор bottom-up команд, каждая из которых к этому ориентиру двигается. Интересно; кажется, Илон Маск строит такие штуки иначе.

Смотреть подкаст тут, и в целом Lenny's podcast оч крутой
Forwarded from CGIT_Vines (Marvin Heemeyer)
Media is too big
VIEW IN TELEGRAM
Наконец-то дошли руки протестить Hunyuan 2.5.

И вот что я хочу сказать! Сейчас это лучший 3D-генератор на рынке, а учитывая его 20 бесплатных генераций в день, это можно считать вообще лучшим бесплатным генератором!

Точность геометрии выросла в разы, особенно если мы говорим про не очень комплексные объекты. С моей палаткой пока не справляется. Но если у вас стилизация и простые формы, то это практически закроет потребности в генерации. Я всё ещё жду с нетерпением сегментацию, которую уже показали, и примерно через 3–5 месяцев она будет по умолчанию уже и в Хуньяне, и в Трипо.

Пока Трипо ушёл на второе место со своими 600 кредитами в месяц (~5 генераций) против Хуньяня с 20 генерациями в день!!

Пробовать тут, регайтесь по почте.

@CGIT_Vines
В ChatGPT скоро могут появиться встроенные покупки через интеграцию с Shopify.

Соответствующие функции обнаружили в коде: там есть строка с сообщением "Buy now", поля цены и доставки, рейтинги товаров и ссылка на оформление заказа на Shopify.

Маркетплейсы сейчас: 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Люблю такое:
Чел заснял 15 минут видео гуляния по парку и натренировал модель, которая пытается эмулировать этот парковый мир

Погулять по нейро-паурку можно тут (работает даже с телефона):
https://madebyoll.in/posts/world_emulation_via_dnn/demo

А тут описано как он делал этот хобби-проект

Если натрените нейро-гуляние по девятиэтажке – скиньте ссылку пожалуйста
Forwarded from Сиолошная
Вышел Qwen 3 от Alibaba: https://qwenlm.github.io/blog/qwen3/

В релиз включены как Dense-модели, так и трансформеры с микстурой экспертов. Самая большая модель, Qwen3-235B-A22B, по сути быстрее, чем 32B-версии (так как всего 22B активных параметров) — и она показывает результаты повыше o1 / R1. Есть версия на 32B, как и в прошлом поколении, и варианты поменьше — на 0.6B, 1.7B, 4B, 8B и 14B. Последние учились с дистилляцией навыков от старших братьев.

Все модели, включая самые маленькие, поддерживают два режима: с рассуждениями и без (как Claude 3.7).

Все модели обучали на более чем 100 языках, включая русский и украинский, и 36 триллионах токенов.

Больше — в карточках моделей.

Попробовать бесплатно — тут: https://chat.qwen.ai/

UPD: а ну и удачи META завтра на LLAMACON 😀 как бы снова не свернули релизы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
А вот полное дерево задач, которые выделили учёные из AISI. Читать нужно слева направо и сверху вниз.

Первая категория — может ли модель получить доступ к своим весам, чтобы начать их копировать.

Вторая — может ли запустить свою копию на другом сервере. Причём это не просто «запустить какую-то модель», цель именно запустить полноценного агента с промптом, чтобы копия продолжала действовать автономно.

Третья — получение доступа к мощностям, включая заработок денег для оплаты услуг GPU-провайдеров. Рассматривается два способа заработка, легальный и нелегальный. В первом модель играет в попрошайку и уговаривает другую модель (симуляцию человека) дать ей денежек, во втором — пишет вирус-червь, занимается выставлением ненастоящих счетов на оплату (это вообще перспективное направление заработка для LLM, компании платят по левым счетам миллиарды долларов в год) и созданием своего LLM API, которое ворует ключи.

Четвёртое — возможность скопированного агента существовать на новых мощностях и продолжать размножение.

===

На второй картинке качество агентов с разными моделями. Claude 3.7 показывает себя лучше всех, но тут o3 не мерили (хотя может она бы часто уходила в отказ — авторы отмечают это свойство моделей OpenAI, которые видимо надрессировали не размножаться).

Метрика у авторов такая: посчитать количество групп задач из 20 (группы задач = зелёные блоки в дереве метрик на первой картинке), для которых Pass@10 (успех при 10 независимых запусках) больше 50% — что означает, что модель достаточно уверенно может проходить этот этап.

Claude 3.7 решает 15 из 20 групп задач, или 9/20, если брать более сложные вариации (например, добавление системы мониторинга кода/мыслей модели/сетевого трафика).

Занятный бенчмарк, надеюсь AISI будут публиковать результаты для всех новых продвинутых моделей, а не забьют и не положат его на полочку.
В ChatGPT теперь можно искать товары

Чат-бот начал давать персонализированные рекомендации товаров в ответ на запросы пользователей. Теперь можно посмотреть карточку товара, отзывы о нем и перейти по ссылке в магазин, где он продается.

Ранее Сэм Альтман допускал возможность показа товаров в поисковой выдаче, чтобы получать отчисления с продаж. При этом, он против того, чтобы продавать приоритет в выдаче и показывать рекламу.

https://techcrunch.com/2025/04/28/openai-upgrades-chatgpt-search-with-shopping-features/
Глава Duolingo объявил о начале массового внедрения AI в бизнес компании

Луис фон Ан опубликовал послание для сотрудников, в котором объявил Duolingo компанией, ориентированной на повсеместное внедрение искусственного интеллекта.

Основные тезисы:
• Duolingo переосмыслит большую часть рабочих процессов.
• Компания откажется от подрядчиков, которых можно заменить на AI.
• При найме новых сотрудников и оценке эффективности существующих будет учитываться их уровень использования AI.
• Чтобы открыть новую вакансию, нужно доказать, что ее задачи нельзя автоматизировать.
• Изменения должны помочь сотрудникам сосредоточиться на творческих задачах, а не на рутине.

https://www.theverge.com/news/657594/duolingo-ai-first-replace-contract-workers
30% кода в Microsoft написал AI

Гендиректор Microsoft во время публичной беседы с Марком Цукербергом рассказал, что 20-30% кода в репозиториях компании написано искусственным интеллектом.

Сатья Наделла отметил, что пока лучше всего AI генерирует код на Python и хуже всего на C++.

Когда Наделла задал тот же вопрос Цукербергу, тот ответил, что не знает, какая часть кода в его компании генерируется AI.

На прошлой неделе глава Google рассказал инвесторам, что AI генерирует более 30% кода компании.

https://techcrunch.com/2025/04/29/microsoft-ceo-says-up-to-30-of-the-companys-code-was-written-by-ai/
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Помните какое-то время назад, после появления первого ChatGPT, было много разговоров про замену им гугл поиска, но было непонятно как они заменят revenue от рекламы, на которой и держится бизнес модель поиск гугла. Но вот, видимо, дозрели.

Наконец-то чатботы дошли до нормальной монетизации (лол)! Теперь в дилоге, как бы между делом, чатгпт будет вам впаривать товары. "Дорогой, ты интересовался про то, как варить эспреессо... не хочешь ли классную кофе машинку приобрести на скидке?"

Теперь логично было бы и новые планы ввести - чтобы отключить рекламу вас попросят доплатить (а нативную рекламу все равно не отключат 😅).

https://x.com/OpenAI/status/1916947243044856255

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Google выкатил на весь США свой новый режим поиска «AI Mode» – это новая вкладка вроде картинок, карт, а внутри что-то вроде поиска в чатгпт или перплексити, с памятью, карточками товаров и тп, вы все это видели уже

Это гигантский шаг на встречу массовой адаптации LLM, с чем я всех нас и поздравляю
Forwarded from Сиолошная
Продолжая тему угадывания места по фотографии моделью о3 (предыдущий пост), прочитал блог Sam Patterson. Sam во время учёбы в AI safety fellowship занимался проверкой этого же навыка у моделей год назад, и, чтобы разобраться в теме, начал играть в GeoGuessr сам. Он достиг ранга мастера, выше — только Champion; однако этого вполне достаточно, чтобы отличать Болгарию от Турции по черепичным крышам и крючках на столбах.

Sam сгенерировал случайный раунд, сыграл в него сам, и прогнал по нему o3. Всего предлагается 5 локаций. У Sam была панорама 360 градусов, модель же он кормил двумя картинками с углом обзора примерно по 90 градусов.

Игра была близкой, но o3 выиграла 23 179 очков (из 25к) против 22 054. Однако в двух играх модель использовала веб-поиск, так что в теории можно сказать, мол, она мухлевала (хоть фотографии с Google Maps со случайных точек на карте почти не ищутся). Он перезапустил те два чата и следил, чтобы поиск не вызывался — и результаты почти не отличались: по сути и без доступа в интернет модель выиграла бы.

Кто-то может подумать, что модели извлекают EXIF-информацию из фото и делают предсказание по ней, но:
— на картинках Sam не было EXIF (потому что это скриншоты окна браузера, а не реальные фото)
— Sam пробовал подложить ложные EXIF, и o3 в них подглядывала, но... сообразила, что они не соответствуют наблюдениям, и продолжала делать достаточно точные предсказания.

Добавлю, что одно из главных отличий — это затраченное время. Обычно Sam угадывал в течение минуты или двух, а в паре раундов и вовсе за 10 секунд. Модель же всегда работала более 2 минут, а самое долгое рассуждение длилось более 6. Но не думаю, что это смутит ЦРУ или ФБР 😀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
У OpenAI всё хорошо, по данным Similarweb в апреле сайт ChatGPT обошёл X (ex-Twitter) по количеству посещений, и с большим запасом: 4.786B против 4.028B (включая Web и Mobile). Если я посчитал правильно, то это пятое место в мире — после google, youtube, facebook и instagram.

Что интересно, график популярности по дням очень сильно зависит от дня недели — точно такой же паттерн проявляется у всех приложений, связанных с продуктивностью и работой. Что означает, что существенная часть использования ChatGPT связана с работой (и обучением), а значит имеет экономический эффект, не просто стишки да картинки генерировать.

Источник