Innovation & Research

Google анонсирует Gemini 2.0: новая эра универсальных и автономных AI-агентов

Новая модель может не только понимать разные виды входных данных, но и генерировать разные типы выходных данных. Gemini 2.0 умеет создавать изображения, воспроизводить аудио, интегрироваться с внешними инструментами, и при этом работает в 2 раза быстрее своего предшественника.

Запуск планируется в 2025 году. Экспериментальная версия Gemini 2.0 Flash уже доступна всем пользователям Gemini.

Модель ляжет в основу 3 проектов:

1. Project Astra — универсальный AI-агент, который может поддерживать беседу в режиме реального времени обо всем, что снято на камеру смартфона, думать на несколько шагов вперед и предпринимать действия от имени пользователя и под его контролем. Помощник понимает несколько языков, запоминает разговоры длиной 10 минут и интегрируется с Google Search, Lens и Maps. Astra также будет протестирована на прототипе «умных» очков.

2. Project Mariner — расширение для браузера Chrome, которое может автоматизировать нажатие клавиш и щелчки мыши. AI-агент способен ориентироваться в веб-интерфейсах и выполнять сложные составные задачи. Первые тесты показали успешное выполнение реальных задач в 83,5% случаев.

3. Jules — AI-помощник для кодинга, который интегрируется с GitHub.

Google также изучает возможность применения мультимодальных интерфейсов в играх и робототехнике. Пространственное «мышление» Gemini 2.0 теоретически может произвести революцию в автоматизации физических процессов.

#news #бигтехи #AI

https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/

Google DeepMind

Project Astra

Project Astra is a research prototype exploring future capabilities of a universal AI assistant that can understand the world around you.

1.1K views07:02

Innovation & Research

Apple запускает интеграцию ChatGPT с Siri

В новых версиях ПО для iPhone, iPad и Mac появилась долгожданная интеграция ChatGPT-4o с Siri.

Нейросеть включается, когда пользователь задает сложный для голосового ассистента вопрос. В этом случае Siri запрашивает разрешение на доступ к сервису OpenAI. Акцент делается на конфиденциальность: интеграция будет преимущественно через облачные серверы; OpenAI не сможет хранить запросы.

Apple полагается на Apple Intelligence в маркетинговой кампании линейки iPhone 16. Добавление функций AI будет стимулировать выход обновлений и способствовать росту продаж. В частности, в следующем году ожидается, что Siri станет доступна и внутри приложений.

Для OpenAI интеграция означает получение доступа к огромному рынку пользователей iPhone. Чтобы пользоваться новой функцией, клиенту Apple не нужна учетная запись OpenAI. Также он получает доступ к платной обновленной версии ChatGPT.
Финансовые условия соглашения между компаниями не разглашаются.

#news #бигтехи #AI

https://www.cnbc.com/2024/12/11/apple-launches-its-chatgpt-integration-with-siri.html

Apple Newsroom

Introducing Apple Intelligence for iPhone, iPad, and Mac

Apple today introduced Apple Intelligence, the personal intelligence system for iPhone, iPad, and Mac.

931 views05:02

Innovation & Research

Amazon открывает лабораторию по созданию AI-агентов во главе с соучредителем Adept

Команда новой лаборатории Amazon AGI SF Lab в Сан-Франциско будет работать над AI-агентами, способными учиться на обратной связи, «справляться с составными рабочими процессами» и действовать «в цифровом и физическом мирах».

Команду возглавит соучредитель AI-стартапа Adept Дэвид Луан (David Luan). Луан будет сотрудничать с робототехником Питером Аббелем (Pieter Abbeel), который присоединился к Amazon в рамках сделки с Covariant. Помимо сотрудников из Adept и Amazon в команду планируется пригласить физиков, математиков и финансистов.

Стартап Adept был основан в 2022 г., привлек $415 млн и оценивается свыше $1 млрд. Цель основателей — AI-помощник, способный автономно выполнять задачи, сформулированные на естественном языке. Аналогичные продукты сейчас разрабатывают стартапы Orby, Emergence и Rabbit, а также крупные компании вроде OpenAI, Anthropic и Google.

В свою очередь Amazon анонсировала разговорные модели для платформы Bedrock и добавила агентов в Amazon Q Business assistant для корпоративных клиентов и разработчиков. CEO компании Энди Джесси (Andy Jassy) также намекнул, что Alexa сможет не только отвечать на вопросы, но и совершать действия.

#news #AI

https://techcrunch.com/2024/12/09/amazon-forms-a-new-ai-agent-focused-lab-led-by-adept-co-founder/

TechCrunch

Amazon hires the founders of AI robotics startup Covariant

Amazon announced Friday evening that it has hired Covariant's founders — Pieter Abbeel, Peter Chen, and Rocky Duan — along with “about a quarter” of the

980 views06:05

Innovation & Research

Илья Суцкевер: способность рассуждать сделает AI менее предсказуемым

В ходе конференции NeurIPS основатель стартапа Safe Superintelligence Inc. заявил, что прогресс AI-систем за счет увеличения объема обучающих данных и вычислительных мощностей достиг своего предела. Мы можем увеличивать вычислительные мощности, но количество данных не вырастет, поскольку «у нас только один интернет». Первый сценарий решения проблемы — генерация синтетических данных. Второй — выбор наилучшего варианта. Вместо того, чтобы сразу давать ответ, модель может генерировать несколько вариантов, оценивать их в реальном времени и выбирать оптимальный.

Также Суцкевер уверен, что AI-агенты будут обладать более глубоким пониманием и самосознанием и смогут решать задачи подобно людям. Но есть загвоздка, — «чем больше они рассуждают, тем более непредсказуемыми становятся. Перебор миллиона вариантов делает любой исход неочевидным (…) Так хороший AI-игрок в шахматы непредсказуем для шахматистов-людей», считает предприниматель

#news #AI

https://www.reuters.com/technology/artificial-intelligence/ai-with-reasoning-power-will-be-less-predictable-ilya-sutskever-says-2024-12-14/

Reuters

OpenAI and others seek new path to smarter AI as current methods hit limitations

Artificial intelligence companies like OpenAI are seeking to overcome unexpected delays and challenges in the pursuit of ever-bigger large language models by developing training techniques that use more human-like ways for algorithms to "think".

1.1K views07:01

Innovation & Research

Apple ведет переговоры с Tencent и ByteDance о внедрении AI в iPhone для китайского рынка

Apple ранее анонсировала включение функций ChatGPT в Apple Intelligence, но в Китае, на рынке которого доля Apple падает, AI-стратегия сталкивается с проблемой: ChatGPT в стране недоступен, а сервисы GenAI должны получать одобрение правительства перед запуском на рынок. Поэтому Apple вынуждена искать местных партнеров.

Сейчас рынок генеративного AI в Китае активно растет. Среди наиболее популярных — модели Doubao от ByteDance, Hunyuan от Tencent и Ernie от Baidu. В условиях сильной конкуренции на местном рынке китайские партнёры заинтересованы в сделке не меньше производителя iPhone.

Сообщается о начальной стадии переговоров Apple с Tencent и ByteDance. Ранее корпорация также обсуждала использование AI-модели Baidu в Китае, но переговоры зашли в тупик из-за технических проблем и вопроса конфиденциальности данных пользователей.

Продажи iPhone в КНР в III квартале 2024 г. снизились на 2 п.п. с начала года, а на первое место вышли смартфоны vivo, нарастив долю с 15% до 19%.

#news #AI #бигтехи

https://www.reuters.com/technology/artificial-intelligence/apple-talks-with-tencent-bytedance-roll-out-ai-features-china-sources-say-2024-12-19/

Counterpointresearch

China Smartphone Market Share: Quarterly

China’s smartphone shipments rose 2% YoY in Q1 2024, staying on track to low-digit annual growth.

1.1K views07:04

Innovation & Research

OpenAI развертывает функции поиска ChatGPT для всех пользователей, обостряя соперничество с Google и Microsoft

ChatGPT Search теперь будет доступен любому пользователю, который вошел в учетную запись через мобильное приложение или веб-сайт. После завершения развёртывания поиск от OpenAI также можно будет назначить поиском по умолчанию в браузере.

Компания Альтмана не только бросает вызов существующим поисковым системам — Google и Bing от Microsoft, но и трансформирует сам подход к поисковой выдаче. Вместо привычного списка ссылок пользователь получает диалоговый интерфейс, в котором «умный» поисковик общается с человеком на естественном языке, и новый формат имеет все шансы вытеснить предшественника.

OpenAI также продемонстрировала опцию, которая позволит пользователям получать устные ответы от чат-бота. Функцию представили в рамках презентации новых продуктов компании. Среди них — более дорогая опция подписки ChatGPT Pro и генератор видео Sora.

#news #AI #бигтехи

https://www.bloomberg.com/news/articles/2024-12-16/openai-rolls-out-chatgpt-search-features-to-all-users

Bloomberg.com

OpenAI Rolls Out ChatGPT Search Features to All Users

OpenAI is rolling out a search product to all users of its chatbot ChatGPT beginning on Monday, escalating its rivalry with Alphabet Inc.’s Google.

1.2K views05:04

Innovation & Research

Google DeepMind и Apptronik будут развивать AI для антропоморфных роботов

Компании объединят усилия в разработке базовой модели для роботов, которая поможет роботам лучше воспринимать окружающую среду и эффективнее управлять аппаратной частью.

Основная модель от Apptronik, робот Apollo, имеет высоту 172 см, вес 72,5 кг и нацелена на применение в промышленности и логистике. Конечная цель, которую заявляет руководство стартапа, — доведения робота до такого уровня технологической зрелости, чтобы он мог работать в сложных средах в прямом контакте с большим количеством людей — на объектах здравоохранения и в быту.

В настоящий момент робота испытывают на производстве MercedesBenz и на складах логистической компании GXO.

#AI #бигтехи #роботы

https://www.therobotreport.com/apptronik-partners-google-deepmind-advance-humanoid-robots-ai/

The Robot Report

Apptronik partners with Google DeepMind to advance humanoid robots with AI

Apptronik will combine its iterative design experience and Apollo humanoid in testing with Google DeepMind's AI platforms.

1.1K views05:01

Innovation & Research

В OpenAI обсуждают создание собственного человекоподобного робота

В мае компания возобновила работу внутренней команды по разработке ПО для роботов. Шаг в сторону собственной робототехники подчеркивает растущее стремление компании зайти в разные ниши: от поиска и веб-браузера до серверных чипов и планирования ЦОДов. Человекоподобный робот — меньший приоритет по сравнению с моделями, способными к рассуждениям, и AI-агентами, но его разработка – лишь вопрос времени.

OpenAI ранее инвестировала в Figure и Physical Intelligence, и разработка собственной машины приведёт к соперничеству с Figure и 1X Technologies – стартапами-реципиентами инвестиций. Это не первый случай, когда компания конкурирует со своими клиентами и партнерами: выпуск ChatGPT в 2022 г. застал врасплох маркетинговую фирму Jasper, поисковая система от OpenAI конкурирует с продуктом Perplexity, а приложение для составления документов Canvas — с разработкой портфельной компании Cursor.

Одним из возможных побочных эффектов политики OpenAI является усиление зависимости от Китая, который играет важную роль в цепочке поставок комплектующих и производстве роботов. Более тесное сотрудничество может не понравиться нынешней администрации страны, поэтому OpenAI пытается успокоить правительство, аргументируя тем, что обеспечивает лидерство США с помощью строительства ЦОД и AI-инфраструктуры.

#news #AI #роботы

https://www.theinformation.com/articles/openai-has-discussed-making-a-humanoid-robot

The Information

OpenAI Restarted Its Robotics Team

OpenAI two months ago revived a robotics team it disbanded four years ago, a company spokesperson confirmed on Thursday. The move comes as firms developing humanoid robots, such as Figure AI and 1X Technologies, as well as robotics software makers like Physical…

1.3K views06:47

Innovation & Research

OpenAI анонсировала модель о3, которая сравнима с человеком по уровню «общего интеллекта»

Главное достижение модели — 87,5% на закрытом бенчмарке ARC-AGI для измерения «общего интеллекта». Для сравнения, результат GPT-3 в 2020 г. составил 0%, а GPT-4o в 2024 г. поставила рекорд в 5%.

Модель o3 также продемонстрировала на математической олимпиаде AIME точность свыше 96%, в научных вопросах уровня PhD — более 87%, на SWE-bench — 71% и на сверхсложном EpochAI Frontier Math превзошла 25%.

Также o3 построена на масштабировании обучения с подкреплением и является самой дорогой моделью на этапе тестирования.

OpenAI планирует запустить o3 mini к концу января, и позже — полноценный o3. Компания утверждает, что они превзойдут ранее выпущенную o1 в способности к рассуждению в 3 раза и смогут работать с новыми типами задач.

Сейчас модели проходят внутреннее тестирование на безопасность. Внешние исследователи могут подать заявку на тестирование о3 перед релизом до 10 января.

#news #AI #стартапы #AGI

https://www.reuters.com/technology/artificial-intelligence/openai-unveils-o3-reasoning-ai-models-test-phase-2024-12-20/

ARC Prize

ARC Prize - What is ARC-AGI?

Learn more about the only AI benchmark that measures AGI progress.

1.3K views07:01

Innovation & Research

Saleforce представила фреймворк для кросс-платформенного AI-агента, работающего с графическим интерфейсом

AGUVIS — это фреймворк для автономных GUI-агентов (Graphical User Interface), которая опирается исключительно на визуальную информацию с разных платформ и обеспечивает её обработку и обобщение.

Обучение фреймворка на комплексном наборе данных проходило в два этапа: заземление (grounding) графического интерфейса — процесс идентификации и определения местоположения компонентов интерфейса пользователя — и дальнейшее планирование действий агента с рассуждением.

AGUVIS не опирается на модели с закрытым исходным кодом, не требует доступа к API и специального ПО, это позволяет переключаться между разными платформами — веб, ПК, мобильными устройствами. Так система достигает согласованности действий в различных средах, работая с онлайн и оффлайн сценариями. Это отличает агента от подобных решений на рынке — Copilot Vision от Microsoft и Google Mariner, которые связаны со своими браузерами. Технология пока находится на ранней стадии разработки.

#news #AI #бигтехи

https://aguvis-project.github.io/

1.5K views07:02

About

Blog

Apps

Platform