Пупырка AI
119 subscribers
739 photos
384 videos
1 file
719 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Forwarded from Denis Sexy IT 🤖
Вашему вниманию – самый популярный шорт этой недели на ютубе, почти 400 миллионов просмотров

Its so over ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⭐️ Perplexity вместо Siri

Голосовой помощник Perplexity теперь может управлять вашим iOS-устройством.

Впервые приложение с искусственным интеллектом может отвечать на вопросы и выполнять основные действия на вашем iPhone: начиная с воспроизведения мультимедиа, составления электронных писем, переноса встреч, бронирования поездок, бронирования, установки напоминаний.

Потестил, хорошо справляется с базовыми задачами и стандартными приложениями. Может столько же сколько и Siri, но открывать многие сторонние приложения пока не умеет (кроме крупных типа YouTube, Uber).

🎁 А если вы хотите использовать Perplexity Pro и все его плюшки за 7$ в год, вот тут рассказывал как это сделать.


#новости@dailyprompts
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Zavtracast (Ярослав Ивус)
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity выпустила голосового помощника для iOS — он даже умеет выполнять базовые задачи на iPhone. Например, может написать черновик письма прямо в приложении «Почта», открыть ссылку с бронью отеля на основе заданной вами информации, включить подкаст по описанию и поставить напоминание в «Календаре».

В будущем Perplexity хотят добавить интеграцию с Gmail и Google Календарём. Кроме того, голосовой режим можно забиндить на Action button и использовать вместо Siri.

Если вы будете использовать голосовой режим Perplexity не на английском, то выберите язык для распознания в настройках. Русский среди них тоже есть.

@zavtracast
Media is too big
VIEW IN TELEGRAM
Убийца AI-ассистента Apple, говорили они. Perplexity добавили в свое приложение голосового ассистента. Теперь весь твиттер кричит, что они убили Siri.

По порядку:

1. Нельзя убить то, что мертво. Siri даже с последними обновлениями (тот самый Apple Assistant) — это оторванная от реальности технология. Об этом чуть позже.

2. Ассистент Perplexity сейчас может ограниченное количество вещей: взаимодействовать со встроенным календарем, картами, почтовым клиентом, заказать Uber и найти YouTube-видео. Все это сложно назвать революцией, эти сценарии людям (на самом деле) не очень нужны. Когда я добавляю ивент в календарь, чаще всего у меня есть время это сделать вдумчиво. Вызов Uber привычнее руками. В картах ты не всегда точно знаешь, куда идешь: проверил Perplexity попросив проложить маршрут до ближайшего банка. Ассистент нашел банк в 20 минутах. На самом деле отделение находится в трех.

3. Другие вещи, которые нужны, к примеру, мне, ассистент не умеет по многим причинам: ограничения iOS или нишевость задач — ну не может он найти мой паспорт в фотках, а это мне нужнее сделать быстро голосом, чем добавить ивент в календарь. И не может написать письмо в Hey App, а не в нативном аппе. И не может добавить ту-ду в виджет, потому что этот виджет вообще я сам сделал. И не может найти в файлах PDF.

4. У Perplexity есть лента новостей. Тоже бесполезная для меня, но полезная для сервиса. Это оправдание для ежедневного пуша с напоминанием о себе. И кажется мне, что новый ассистент нужен в том числе для этого. Это не революция, это допсценарий, который увеличивает число касаний с аппом и привлекает новых юзеров другим способом.

5. Perplexity делают это все ради того, чтобы люди пользовались их основным продуктом: классным поиском и сопряженными с этим функциями подготовки рисеча. Тут это мой ежедневный инструмент, который я использую для работы и жизни вместе с ChatGPT. И если к нему добавится возможность иногда голосом добавить в календарь событие — ну пусть, класс. А для кого-то эта функциональность — вход в Perplexity. И вот тут дальше стоит сказать про основной продукт.

6. Но я зря говорю про бесполезность новых функций. Это первый шаг. Компания сейчас разрабатывает свой браузер. Это путь ко всем веб-аппам и веб-сервисам. Вот тут ассистент сможет разгуляться и никакие ограничения iOS его не остановят. Это жду. Браузер с поиском — AI-агент, который закрывает все задачи, который онлайн.

7. В сухом остатке: не верим словам про революцию сегодня и убийство Siri, но следим, что будет дальше. Для ежедневных задач глубокого рисеча без ограничений — Perplexity топ (а еще не требует VPN). Буквально мой рейтинг использования AI-сервисов выглядит сейчас так: 1. ChatGPT о3 2. Perplexity Deep Research 3. ChatGPT Deep Research (делает классно, но есть ограничения использования в месяц).

➡️ Включите уведомления, чтобы не пропускать полезные советы по AI, тренды, рекомендации сериалов, фильмов, книг и музыки.

➡️ Если пост оказался вам полезен, буду благодарен шеру. @danieltrbn
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from e/acc
This media is not supported in your browser
VIEW IN TELEGRAM
Сделал ИИ, который умеет от моего лица отвечать на личные сообщения (и группы) в телеграме. У меня уже есть подобная штука для gmail (в рамках CybOS), а теперь и для телеги. В видео голосом рассказываю как это работает.

— принимает и анализирует все личные сообщения
— отвечает от моего моего лица (собеседник не видит, что это бот)
— умеет генерировать ответ на основе всей истории переписки + кастомных правил в промте относительно стиля и целей

Цель: сделать так, чтобы 90% входящих сообщений обрабатывалась автоматически, а я мог фокусироваться только на самых важных
CPO OpenAI в Lenny's podcast, оч интересно, всячески рекомендую. Да, это именно тот человек который виноват в o3-mini-high и других шедеврах нейминга )

Там есть супер красивая история как их HRD сама пошла и навайбкодила (!) внутренний инструмент которого ей не хватало. Я верю что компании будущего так и должны жить - любой человек может создавать нужные ему инженерные решения лично сам. Эй, HRD, берите пример )

Что ещё классного:

1. Evals - ключевой навык продакт менеджеров и инженеров. Если ты не можешь правильно проверить работу системы на llm, ты не продвинешься дальше прототипов. Что такое эвалы и почему они важны можно почитать например тут

2. Никаких роадмапов на 3 месяца. Ребята живут в мире где через пару месяцев выйдет очередная модель которая опять всё кардинально поменяет. Поэтому никаких долгих роадмапов, только гибкость и только хардкор. Сравните это с вашей компанией ))

3. Bottom-up company
Так как путь неизвестен, то стратегия OpenAI это иметь супер-дальний ориентир (e.g. создание AGI), а работу строить как набор bottom-up команд, каждая из которых к этому ориентиру двигается. Интересно; кажется, Илон Маск строит такие штуки иначе.

Смотреть подкаст тут, и в целом Lenny's podcast оч крутой
Forwarded from CGIT_Vines (Marvin Heemeyer)
Media is too big
VIEW IN TELEGRAM
Наконец-то дошли руки протестить Hunyuan 2.5.

И вот что я хочу сказать! Сейчас это лучший 3D-генератор на рынке, а учитывая его 20 бесплатных генераций в день, это можно считать вообще лучшим бесплатным генератором!

Точность геометрии выросла в разы, особенно если мы говорим про не очень комплексные объекты. С моей палаткой пока не справляется. Но если у вас стилизация и простые формы, то это практически закроет потребности в генерации. Я всё ещё жду с нетерпением сегментацию, которую уже показали, и примерно через 3–5 месяцев она будет по умолчанию уже и в Хуньяне, и в Трипо.

Пока Трипо ушёл на второе место со своими 600 кредитами в месяц (~5 генераций) против Хуньяня с 20 генерациями в день!!

Пробовать тут, регайтесь по почте.

@CGIT_Vines
В ChatGPT скоро могут появиться встроенные покупки через интеграцию с Shopify.

Соответствующие функции обнаружили в коде: там есть строка с сообщением "Buy now", поля цены и доставки, рейтинги товаров и ссылка на оформление заказа на Shopify.

Маркетплейсы сейчас: 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Люблю такое:
Чел заснял 15 минут видео гуляния по парку и натренировал модель, которая пытается эмулировать этот парковый мир

Погулять по нейро-паурку можно тут (работает даже с телефона):
https://madebyoll.in/posts/world_emulation_via_dnn/demo

А тут описано как он делал этот хобби-проект

Если натрените нейро-гуляние по девятиэтажке – скиньте ссылку пожалуйста
Forwarded from Сиолошная
Вышел Qwen 3 от Alibaba: https://qwenlm.github.io/blog/qwen3/

В релиз включены как Dense-модели, так и трансформеры с микстурой экспертов. Самая большая модель, Qwen3-235B-A22B, по сути быстрее, чем 32B-версии (так как всего 22B активных параметров) — и она показывает результаты повыше o1 / R1. Есть версия на 32B, как и в прошлом поколении, и варианты поменьше — на 0.6B, 1.7B, 4B, 8B и 14B. Последние учились с дистилляцией навыков от старших братьев.

Все модели, включая самые маленькие, поддерживают два режима: с рассуждениями и без (как Claude 3.7).

Все модели обучали на более чем 100 языках, включая русский и украинский, и 36 триллионах токенов.

Больше — в карточках моделей.

Попробовать бесплатно — тут: https://chat.qwen.ai/

UPD: а ну и удачи META завтра на LLAMACON 😀 как бы снова не свернули релизы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
А вот полное дерево задач, которые выделили учёные из AISI. Читать нужно слева направо и сверху вниз.

Первая категория — может ли модель получить доступ к своим весам, чтобы начать их копировать.

Вторая — может ли запустить свою копию на другом сервере. Причём это не просто «запустить какую-то модель», цель именно запустить полноценного агента с промптом, чтобы копия продолжала действовать автономно.

Третья — получение доступа к мощностям, включая заработок денег для оплаты услуг GPU-провайдеров. Рассматривается два способа заработка, легальный и нелегальный. В первом модель играет в попрошайку и уговаривает другую модель (симуляцию человека) дать ей денежек, во втором — пишет вирус-червь, занимается выставлением ненастоящих счетов на оплату (это вообще перспективное направление заработка для LLM, компании платят по левым счетам миллиарды долларов в год) и созданием своего LLM API, которое ворует ключи.

Четвёртое — возможность скопированного агента существовать на новых мощностях и продолжать размножение.

===

На второй картинке качество агентов с разными моделями. Claude 3.7 показывает себя лучше всех, но тут o3 не мерили (хотя может она бы часто уходила в отказ — авторы отмечают это свойство моделей OpenAI, которые видимо надрессировали не размножаться).

Метрика у авторов такая: посчитать количество групп задач из 20 (группы задач = зелёные блоки в дереве метрик на первой картинке), для которых Pass@10 (успех при 10 независимых запусках) больше 50% — что означает, что модель достаточно уверенно может проходить этот этап.

Claude 3.7 решает 15 из 20 групп задач, или 9/20, если брать более сложные вариации (например, добавление системы мониторинга кода/мыслей модели/сетевого трафика).

Занятный бенчмарк, надеюсь AISI будут публиковать результаты для всех новых продвинутых моделей, а не забьют и не положат его на полочку.
В ChatGPT теперь можно искать товары

Чат-бот начал давать персонализированные рекомендации товаров в ответ на запросы пользователей. Теперь можно посмотреть карточку товара, отзывы о нем и перейти по ссылке в магазин, где он продается.

Ранее Сэм Альтман допускал возможность показа товаров в поисковой выдаче, чтобы получать отчисления с продаж. При этом, он против того, чтобы продавать приоритет в выдаче и показывать рекламу.

https://techcrunch.com/2025/04/28/openai-upgrades-chatgpt-search-with-shopping-features/
Глава Duolingo объявил о начале массового внедрения AI в бизнес компании

Луис фон Ан опубликовал послание для сотрудников, в котором объявил Duolingo компанией, ориентированной на повсеместное внедрение искусственного интеллекта.

Основные тезисы:
• Duolingo переосмыслит большую часть рабочих процессов.
• Компания откажется от подрядчиков, которых можно заменить на AI.
• При найме новых сотрудников и оценке эффективности существующих будет учитываться их уровень использования AI.
• Чтобы открыть новую вакансию, нужно доказать, что ее задачи нельзя автоматизировать.
• Изменения должны помочь сотрудникам сосредоточиться на творческих задачах, а не на рутине.

https://www.theverge.com/news/657594/duolingo-ai-first-replace-contract-workers
30% кода в Microsoft написал AI

Гендиректор Microsoft во время публичной беседы с Марком Цукербергом рассказал, что 20-30% кода в репозиториях компании написано искусственным интеллектом.

Сатья Наделла отметил, что пока лучше всего AI генерирует код на Python и хуже всего на C++.

Когда Наделла задал тот же вопрос Цукербергу, тот ответил, что не знает, какая часть кода в его компании генерируется AI.

На прошлой неделе глава Google рассказал инвесторам, что AI генерирует более 30% кода компании.

https://techcrunch.com/2025/04/29/microsoft-ceo-says-up-to-30-of-the-companys-code-was-written-by-ai/
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Помните какое-то время назад, после появления первого ChatGPT, было много разговоров про замену им гугл поиска, но было непонятно как они заменят revenue от рекламы, на которой и держится бизнес модель поиск гугла. Но вот, видимо, дозрели.

Наконец-то чатботы дошли до нормальной монетизации (лол)! Теперь в дилоге, как бы между делом, чатгпт будет вам впаривать товары. "Дорогой, ты интересовался про то, как варить эспреессо... не хочешь ли классную кофе машинку приобрести на скидке?"

Теперь логично было бы и новые планы ввести - чтобы отключить рекламу вас попросят доплатить (а нативную рекламу все равно не отключат 😅).

https://x.com/OpenAI/status/1916947243044856255

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Google выкатил на весь США свой новый режим поиска «AI Mode» – это новая вкладка вроде картинок, карт, а внутри что-то вроде поиска в чатгпт или перплексити, с памятью, карточками товаров и тп, вы все это видели уже

Это гигантский шаг на встречу массовой адаптации LLM, с чем я всех нас и поздравляю
Forwarded from Сиолошная
Продолжая тему угадывания места по фотографии моделью о3 (предыдущий пост), прочитал блог Sam Patterson. Sam во время учёбы в AI safety fellowship занимался проверкой этого же навыка у моделей год назад, и, чтобы разобраться в теме, начал играть в GeoGuessr сам. Он достиг ранга мастера, выше — только Champion; однако этого вполне достаточно, чтобы отличать Болгарию от Турции по черепичным крышам и крючках на столбах.

Sam сгенерировал случайный раунд, сыграл в него сам, и прогнал по нему o3. Всего предлагается 5 локаций. У Sam была панорама 360 градусов, модель же он кормил двумя картинками с углом обзора примерно по 90 градусов.

Игра была близкой, но o3 выиграла 23 179 очков (из 25к) против 22 054. Однако в двух играх модель использовала веб-поиск, так что в теории можно сказать, мол, она мухлевала (хоть фотографии с Google Maps со случайных точек на карте почти не ищутся). Он перезапустил те два чата и следил, чтобы поиск не вызывался — и результаты почти не отличались: по сути и без доступа в интернет модель выиграла бы.

Кто-то может подумать, что модели извлекают EXIF-информацию из фото и делают предсказание по ней, но:
— на картинках Sam не было EXIF (потому что это скриншоты окна браузера, а не реальные фото)
— Sam пробовал подложить ложные EXIF, и o3 в них подглядывала, но... сообразила, что они не соответствуют наблюдениям, и продолжала делать достаточно точные предсказания.

Добавлю, что одно из главных отличий — это затраченное время. Обычно Sam угадывал в течение минуты или двух, а в паре раундов и вовсе за 10 секунд. Модель же всегда работала более 2 минут, а самое долгое рассуждение длилось более 6. Но не думаю, что это смутит ЦРУ или ФБР 😀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM