Innovation & Research
3.39K subscribers
442 photos
69 videos
174 files
4.61K links
“Push-the-envelope” Channel
Download Telegram
Google анонсирует Gemini 2.0: новая эра универсальных и автономных AI-агентов

Новая модель может не только понимать разные виды входных данных, но и генерировать разные типы выходных данных. Gemini 2.0 умеет создавать изображения, воспроизводить аудио, интегрироваться с внешними инструментами, и при этом работает в 2 раза быстрее своего предшественника.

Запуск планируется в 2025 году. Экспериментальная версия Gemini 2.0 Flash уже доступна всем пользователям Gemini.

Модель ляжет в основу 3 проектов:

1. Project Astra — универсальный AI-агент, который может поддерживать беседу в режиме реального времени обо всем, что снято на камеру смартфона, думать на несколько шагов вперед и предпринимать действия от имени пользователя и под его контролем. Помощник понимает несколько языков, запоминает разговоры длиной 10 минут и интегрируется с Google Search, Lens и Maps. Astra также будет протестирована на прототипе «умных» очков.

2. Project Marinerрасширение для браузера Chrome, которое может автоматизировать нажатие клавиш и щелчки мыши. AI-агент способен ориентироваться в веб-интерфейсах и выполнять сложные составные задачи. Первые тесты показали успешное выполнение реальных задач в 83,5% случаев.

3. JulesAI-помощник для кодинга, который интегрируется с GitHub.

Google также изучает возможность применения мультимодальных интерфейсов в играх и робототехнике. Пространственное «мышление» Gemini 2.0 теоретически может произвести революцию в автоматизации физических процессов.

#news #бигтехи #AI

https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/
Apple запускает интеграцию ChatGPT с Siri

В новых версиях ПО для iPhone, iPad и Mac появилась долгожданная интеграция ChatGPT-4o с Siri.

Нейросеть включается, когда пользователь задает сложный для голосового ассистента вопрос. В этом случае Siri запрашивает разрешение на доступ к сервису OpenAI. Акцент делается на конфиденциальность: интеграция будет преимущественно через облачные серверы; OpenAI не сможет хранить запросы.

Apple полагается на Apple Intelligence в маркетинговой кампании линейки iPhone 16. Добавление функций AI будет стимулировать выход обновлений и способствовать росту продаж. В частности, в следующем году ожидается, что Siri станет доступна и внутри приложений.

Для OpenAI интеграция означает получение доступа к огромному рынку пользователей iPhone. Чтобы пользоваться новой функцией, клиенту Apple не нужна учетная запись OpenAI. Также он получает доступ к платной обновленной версии ChatGPT.
Финансовые условия соглашения между компаниями не разглашаются.

#news #бигтехи #AI

https://www.cnbc.com/2024/12/11/apple-launches-its-chatgpt-integration-with-siri.html
Amazon открывает лабораторию по созданию AI-агентов во главе с соучредителем Adept

Команда новой лаборатории Amazon AGI SF Lab в Сан-Франциско будет работать над AI-агентами, способными учиться на обратной связи, «справляться с составными рабочими процессами» и действовать «в цифровом и физическом мирах».

Команду возглавит соучредитель AI-стартапа Adept Дэвид Луан (David Luan). Луан будет сотрудничать с робототехником Питером Аббелем (Pieter Abbeel), который присоединился к Amazon в рамках сделки с Covariant. Помимо сотрудников из Adept и Amazon в команду планируется пригласить физиков, математиков и финансистов.

Стартап Adept был основан в 2022 г., привлек $415 млн и оценивается свыше $1 млрд. Цель основателей — AI-помощник, способный автономно выполнять задачи, сформулированные на естественном языке. Аналогичные продукты сейчас разрабатывают стартапы Orby, Emergence и Rabbit, а также крупные компании вроде OpenAI, Anthropic и Google.

В свою очередь Amazon анонсировала разговорные модели для платформы Bedrock и добавила агентов в Amazon Q Business assistant для корпоративных клиентов и разработчиков. CEO компании Энди Джесси (Andy Jassy) также намекнул, что Alexa сможет не только отвечать на вопросы, но и совершать действия.

#news #AI

https://techcrunch.com/2024/12/09/amazon-forms-a-new-ai-agent-focused-lab-led-by-adept-co-founder/
Илья Суцкевер: способность рассуждать сделает AI менее предсказуемым

В ходе конференции NeurIPS основатель стартапа Safe Superintelligence Inc. заявил, что прогресс AI-систем за счет увеличения объема обучающих данных и вычислительных мощностей достиг своего предела. Мы можем увеличивать вычислительные мощности, но количество данных не вырастет, поскольку «у нас только один интернет». Первый сценарий решения проблемы — генерация синтетических данных. Второй — выбор наилучшего варианта. Вместо того, чтобы сразу давать ответ, модель может генерировать несколько вариантов, оценивать их в реальном времени и выбирать оптимальный.

Также Суцкевер уверен, что AI-агенты будут обладать более глубоким пониманием и самосознанием и смогут решать задачи подобно людям. Но есть загвоздка, — «чем больше они рассуждают, тем более непредсказуемыми становятся. Перебор миллиона вариантов делает любой исход неочевидным (…) Так хороший AI-игрок в шахматы непредсказуем для шахматистов-людей», считает предприниматель

#news #AI

https://www.reuters.com/technology/artificial-intelligence/ai-with-reasoning-power-will-be-less-predictable-ilya-sutskever-says-2024-12-14/
Apple ведет переговоры с Tencent и ByteDance о внедрении AI в iPhone для китайского рынка

Apple ранее анонсировала включение функций ChatGPT в Apple Intelligence, но в Китае, на рынке которого доля Apple падает, AI-стратегия сталкивается с проблемой: ChatGPT в стране недоступен, а сервисы GenAI должны получать одобрение правительства перед запуском на рынок. Поэтому Apple вынуждена искать местных партнеров.

Сейчас рынок генеративного AI в Китае активно растет. Среди наиболее популярных — модели Doubao от ByteDance, Hunyuan от Tencent и Ernie от Baidu. В условиях сильной конкуренции на местном рынке китайские партнёры заинтересованы в сделке не меньше производителя iPhone.

Сообщается о начальной стадии переговоров Apple с Tencent и ByteDance. Ранее корпорация также обсуждала использование AI-модели Baidu в Китае, но переговоры зашли в тупик из-за технических проблем и вопроса конфиденциальности данных пользователей.

Продажи iPhone в КНР в III квартале 2024 г. снизились на 2 п.п. с начала года, а на первое место вышли смартфоны vivo, нарастив долю с 15% до 19%.

#news #AI #бигтехи

https://www.reuters.com/technology/artificial-intelligence/apple-talks-with-tencent-bytedance-roll-out-ai-features-china-sources-say-2024-12-19/
OpenAI развертывает функции поиска ChatGPT для всех пользователей, обостряя соперничество с Google и Microsoft

ChatGPT Search теперь будет доступен любому пользователю, который вошел в учетную запись через мобильное приложение или веб-сайт. После завершения развёртывания поиск от OpenAI также можно будет назначить поиском по умолчанию в браузере.

Компания Альтмана не только бросает вызов существующим поисковым системам — Google и Bing от Microsoft, но и трансформирует сам подход к поисковой выдаче. Вместо привычного списка ссылок пользователь получает диалоговый интерфейс, в котором «умный» поисковик общается с человеком на естественном языке, и новый формат имеет все шансы вытеснить предшественника.

OpenAI также продемонстрировала опцию, которая позволит пользователям получать устные ответы от чат-бота. Функцию представили в рамках презентации новых продуктов компании. Среди них — более дорогая опция подписки ChatGPT Pro и генератор видео Sora.

#news #AI #бигтехи

https://www.bloomberg.com/news/articles/2024-12-16/openai-rolls-out-chatgpt-search-features-to-all-users
Google DeepMind и Apptronik будут развивать AI для антропоморфных роботов

Компании объединят усилия в разработке базовой модели для роботов, которая поможет роботам лучше воспринимать окружающую среду и эффективнее управлять аппаратной частью.

Основная модель от Apptronik, робот Apollo, имеет высоту 172 см, вес 72,5 кг и нацелена на применение в промышленности и логистике. Конечная цель, которую заявляет руководство стартапа, — доведения робота до такого уровня технологической зрелости, чтобы он мог работать в сложных средах в прямом контакте с большим количеством людей — на объектах здравоохранения и в быту.

В настоящий момент робота испытывают на производстве MercedesBenz и на складах логистической компании GXO.

#AI #бигтехи #роботы

https://www.therobotreport.com/apptronik-partners-google-deepmind-advance-humanoid-robots-ai/
В OpenAI обсуждают создание собственного человекоподобного робота

В мае компания возобновила работу внутренней команды по разработке ПО для роботов. Шаг в сторону собственной робототехники подчеркивает растущее стремление компании зайти в разные ниши: от поиска и веб-браузера до серверных чипов и планирования ЦОДов. Человекоподобный робот — меньший приоритет по сравнению с моделями, способными к рассуждениям, и AI-агентами, но его разработка – лишь вопрос времени.

OpenAI ранее инвестировала в Figure и Physical Intelligence, и разработка собственной машины приведёт к соперничеству с Figure и 1X Technologies – стартапами-реципиентами инвестиций. Это не первый случай, когда компания конкурирует со своими клиентами и партнерами: выпуск ChatGPT в 2022 г. застал врасплох маркетинговую фирму Jasper, поисковая система от OpenAI конкурирует с продуктом Perplexity, а приложение для составления документов Canvas — с разработкой портфельной компании Cursor.

Одним из возможных побочных эффектов политики OpenAI является усиление зависимости от Китая, который играет важную роль в цепочке поставок комплектующих и производстве роботов. Более тесное сотрудничество может не понравиться нынешней администрации страны, поэтому OpenAI пытается успокоить правительство, аргументируя тем, что обеспечивает лидерство США с помощью строительства ЦОД и AI-инфраструктуры.

#news #AI #роботы

https://www.theinformation.com/articles/openai-has-discussed-making-a-humanoid-robot
OpenAI анонсировала модель о3, которая сравнима с человеком по уровню «общего интеллекта»

Главное достижение модели — 87,5% на закрытом бенчмарке ARC-AGI для измерения «общего интеллекта». Для сравнения, результат GPT-3 в 2020 г. составил 0%, а GPT-4o в 2024 г. поставила рекорд в 5%.

Модель o3 также продемонстрировала на математической олимпиаде AIME точность свыше 96%, в научных вопросах уровня PhD — более 87%, на SWE-bench — 71% и на сверхсложном EpochAI Frontier Math превзошла 25%.

Также o3 построена на масштабировании обучения с подкреплением и является самой дорогой моделью на этапе тестирования.

OpenAI планирует запустить o3 mini к концу января, и позже — полноценный o3. Компания утверждает, что они превзойдут ранее выпущенную o1 в способности к рассуждению в 3 раза и смогут работать с новыми типами задач.

Сейчас модели проходят внутреннее тестирование на безопасность. Внешние исследователи могут подать заявку на тестирование о3 перед релизом до 10 января.

#news #AI #стартапы #AGI

https://www.reuters.com/technology/artificial-intelligence/openai-unveils-o3-reasoning-ai-models-test-phase-2024-12-20/
Saleforce представила фреймворк для кросс-платформенного AI-агента, работающего с графическим интерфейсом

AGUVIS — это фреймворк для автономных GUI-агентов (Graphical User Interface), которая опирается исключительно на визуальную информацию с разных платформ и обеспечивает её обработку и обобщение.

Обучение фреймворка на комплексном наборе данных проходило в два этапа: заземление (grounding) графического интерфейса — процесс идентификации и определения местоположения компонентов интерфейса пользователя — и дальнейшее планирование действий агента с рассуждением.

AGUVIS не опирается на модели с закрытым исходным кодом, не требует доступа к API и специального ПО, это позволяет переключаться между разными платформами — веб, ПК, мобильными устройствами. Так система достигает согласованности действий в различных средах, работая с онлайн и оффлайн сценариями. Это отличает агента от подобных решений на рынке — Copilot Vision от Microsoft и Google Mariner, которые связаны со своими браузерами. Технология пока находится на ранней стадии разработки.

#news #AI #бигтехи

https://aguvis-project.github.io/