Innovation & Research
3.39K subscribers
442 photos
69 videos
174 files
4.61K links
“Push-the-envelope” Channel
Download Telegram
Илон Маск на встрече с главой TSMC: будущее за роботами, а не электромобилями

Председатель совета директоров и генеральный директор TSMC Си Вэй (CC Wei) и Илон Маск обсудили производство 5-нм чипов Dojo с использованием передовой технологии упаковки InFO-SoW. Они будут применяться при сборке автопилотируемых автомобилей (Full Self-Driving, FSD), а также роботов Optimus.

Во время встречи Маск заявил, что робототехника станет крупнейшей отраслью в мире, и будущее Tesla будет связано в большей степени с человекоподобными роботами, а не автомобилями. Он также выразил обеспокоенность дефицитом мощных чипов для AI. На что Вэй ответил, что Маск будет их получать, пока готов платить.

После встречи Вэй подчеркнул, что многофункциональные роботы представляют большую возможность для Тайваня, поскольку их выпуск требует высокоточных производств и ПО — тех индустрий, на которых специализируется компании региона. Среди других перспективных областей применения технологий TSMC он назвал дроны и AI для оптимизации водо- и энергоснабжения.

#news #роботы #чипы

https://www.electronicsweekly.com/news/business/c-c-wei-and-elon-musk-hooking-up-on-robots-2024-12/
OpenAI развертывает функции поиска ChatGPT для всех пользователей, обостряя соперничество с Google и Microsoft

ChatGPT Search теперь будет доступен любому пользователю, который вошел в учетную запись через мобильное приложение или веб-сайт. После завершения развёртывания поиск от OpenAI также можно будет назначить поиском по умолчанию в браузере.

Компания Альтмана не только бросает вызов существующим поисковым системам — Google и Bing от Microsoft, но и трансформирует сам подход к поисковой выдаче. Вместо привычного списка ссылок пользователь получает диалоговый интерфейс, в котором «умный» поисковик общается с человеком на естественном языке, и новый формат имеет все шансы вытеснить предшественника.

OpenAI также продемонстрировала опцию, которая позволит пользователям получать устные ответы от чат-бота. Функцию представили в рамках презентации новых продуктов компании. Среди них — более дорогая опция подписки ChatGPT Pro и генератор видео Sora.

#news #AI #бигтехи

https://www.bloomberg.com/news/articles/2024-12-16/openai-rolls-out-chatgpt-search-features-to-all-users
В OpenAI обсуждают создание собственного человекоподобного робота

В мае компания возобновила работу внутренней команды по разработке ПО для роботов. Шаг в сторону собственной робототехники подчеркивает растущее стремление компании зайти в разные ниши: от поиска и веб-браузера до серверных чипов и планирования ЦОДов. Человекоподобный робот — меньший приоритет по сравнению с моделями, способными к рассуждениям, и AI-агентами, но его разработка – лишь вопрос времени.

OpenAI ранее инвестировала в Figure и Physical Intelligence, и разработка собственной машины приведёт к соперничеству с Figure и 1X Technologies – стартапами-реципиентами инвестиций. Это не первый случай, когда компания конкурирует со своими клиентами и партнерами: выпуск ChatGPT в 2022 г. застал врасплох маркетинговую фирму Jasper, поисковая система от OpenAI конкурирует с продуктом Perplexity, а приложение для составления документов Canvas — с разработкой портфельной компании Cursor.

Одним из возможных побочных эффектов политики OpenAI является усиление зависимости от Китая, который играет важную роль в цепочке поставок комплектующих и производстве роботов. Более тесное сотрудничество может не понравиться нынешней администрации страны, поэтому OpenAI пытается успокоить правительство, аргументируя тем, что обеспечивает лидерство США с помощью строительства ЦОД и AI-инфраструктуры.

#news #AI #роботы

https://www.theinformation.com/articles/openai-has-discussed-making-a-humanoid-robot
OpenAI анонсировала модель о3, которая сравнима с человеком по уровню «общего интеллекта»

Главное достижение модели — 87,5% на закрытом бенчмарке ARC-AGI для измерения «общего интеллекта». Для сравнения, результат GPT-3 в 2020 г. составил 0%, а GPT-4o в 2024 г. поставила рекорд в 5%.

Модель o3 также продемонстрировала на математической олимпиаде AIME точность свыше 96%, в научных вопросах уровня PhD — более 87%, на SWE-bench — 71% и на сверхсложном EpochAI Frontier Math превзошла 25%.

Также o3 построена на масштабировании обучения с подкреплением и является самой дорогой моделью на этапе тестирования.

OpenAI планирует запустить o3 mini к концу января, и позже — полноценный o3. Компания утверждает, что они превзойдут ранее выпущенную o1 в способности к рассуждению в 3 раза и смогут работать с новыми типами задач.

Сейчас модели проходят внутреннее тестирование на безопасность. Внешние исследователи могут подать заявку на тестирование о3 перед релизом до 10 января.

#news #AI #стартапы #AGI

https://www.reuters.com/technology/artificial-intelligence/openai-unveils-o3-reasoning-ai-models-test-phase-2024-12-20/
Saleforce представила фреймворк для кросс-платформенного AI-агента, работающего с графическим интерфейсом

AGUVIS — это фреймворк для автономных GUI-агентов (Graphical User Interface), которая опирается исключительно на визуальную информацию с разных платформ и обеспечивает её обработку и обобщение.

Обучение фреймворка на комплексном наборе данных проходило в два этапа: заземление (grounding) графического интерфейса — процесс идентификации и определения местоположения компонентов интерфейса пользователя — и дальнейшее планирование действий агента с рассуждением.

AGUVIS не опирается на модели с закрытым исходным кодом, не требует доступа к API и специального ПО, это позволяет переключаться между разными платформами — веб, ПК, мобильными устройствами. Так система достигает согласованности действий в различных средах, работая с онлайн и оффлайн сценариями. Это отличает агента от подобных решений на рынке — Copilot Vision от Microsoft и Google Mariner, которые связаны со своими браузерами. Технология пока находится на ранней стадии разработки.

#news #AI #бигтехи

https://aguvis-project.github.io/
Apple может перейти с процессоров SoC на раздельную архитектуру

Одним из ключевых элементов собственных чипов Apple серий A и M является конструкция System-on-a-Chip (SoC), которая объединяет в одном корпусе CPU, GPU и другие компоненты вроде памяти.

Мин Ки Куо, аналитик, изучающий корпорацию Apple, полагает, что для чипа M5 Pro бигтех воспользуется новейшим процессом корпусирования чипов от TSMC — SoIC-mH (System-on-Integrated-Chips-Molding-Horizontal).

Этот метод интеграции чипов в схему позволяет снизить тепловыделение. В результате, чип может работать на полной мощности дольше, прежде чем начнёт троттлить — снижать частоту, чтобы уменьшить нагрев. Сообщается также, что новая технология повышает выход годных чипов с пластины.

Также вероятно, что корпуса SoIC серверного класса будут применяться для вариантов M5 Pro, Max и Ultra будущего чипа M5. А последние — в серверах Private Cloud Compute (PCC), используемых Apple Intelligence. Куо полагает, что эти процессоры лучше адаптированы для инференса AI и будут способствовать развитию инфраструктуры корпорации.

#news #чипы #бигтехи

https://9to5mac.com/2024/12/23/m5-pro-chip-could-separate-cpu-and-gpu-in-server-grade-chips/
Марк Цукерберг добавит дисплей в очки Ray-Ban

Обновленное устройство планируется выпустить уже во второй половине 2025 г. На небольшой дисплей, скорее всего, будут выводиться уведомления или ответы от виртуального помощника.

Meta* делает ставку на «умные» очки, которые вытеснят экран смартфона как основного пользовательского интерфейса. В сентябре компания представила прототип AR-очков Orion и после первых позитивных отзывов ускорила их разработку. Текущая модель оснащена динамиками, камерами и микрофонами, позволяет делать фотографии и общаться с AI-ассистентом в том числе голосом. Очки от Meta стали прорывом после неудачных релизов подобных устройств от Microsoft и Google.

Сейчас Orion управляются нейробраслетом. Источник, близкий к компании, сообщил, что наряду с ним разрабатываются варианты управления с помощью кольца или мяча. Meta производит очки стоимостью $300 в партнерстве с группой EssilorLuxottica. Вывод на массовый рынок ожидается через несколько лет.

Тем временем Apple, Google и Snap разрабатывают аналогичные продукты, Baidu выпустила похожее устройство в ноябре. Поставки «умных» очков в 2024 г. выросли на 73% по всему рынку.

*организация запрещена в России и признана экстремистской

#news #AI #бигтехи

https://www.ft.com/content/77bd9117-0a2d-4bd7-9248-4dd288f695a4
Google выпустил базовый документ, посвященный AI-агентам

Под агентами в нём понимаются программы, которые расширяют возможности генеративных AI-моделей, позволяя им использовать инструменты для доступа к актуальной информации и выполнения действий во внешнем мире. Агент может включать одну или несколько языковых моделей, которые принимают решения о том, как реагировать на запросы пользователей и управлять своими действиями, опираясь на данные, полученные от внешних инструментов.

Ключевыми аспектами агентного подхода являются:

1. Автономность: агенты способны действовать независимо, часто без прямого вмешательства человека, особенно если они снабжены четкими целями или задачами.

2. Целеполагание: агенты имеют конкретные цели, которых они стремятся достичь, используя свои встроенные инструменты и возможность вести рассуждения.

3. Рассуждение и планирование: агенты используют различные методы рассуждений для анализа ситуации и планирования своих дальнейших шагов.

4. Доступ к инструментам: агенты оснащены инструментами, которые позволяют им взаимодействовать с внешним миром, включая выполнение API-запросов, работу с данными и другие операции, которые модель не могла бы выполнить самостоятельно.

То есть, агенты представляют собой мощное сочетание модели, методов рассуждений и инструментов, которое позволяет действовать более эффективно и гибко в реальных условиях.

Ключевым способом реализации агентов разработчики видят схему «когнитивных архитектур». Её ключевые моменты:

1. Агенты расширяют возможности языковых моделей, используя инструменты для доступа к актуальной информации и выполнения сложных задач автономно. В своей работе они могут использовать одну или несколько LLM для принятия решений о том, как перейти через состояния и использовать внешние инструменты для решения различных задач, которые было бы сложно или невозможно решить с помощью одной модели.

2. Основой работы агента является слой оркестрации — когнитивная архитектура, которая структурирует процессы рассуждения, планирования, принятия решений и направляет действия агента. Различные методы рассуждений, такие как ReAct, Chain-of-Thought и Tree-of-Thoughts, предоставляют структуру для слоя оркестрации, который собирает информацию, обрабатывает ее, генерирует ответы или стимулирует действия.

3. Инструменты — расширения, функции и хранилища данных — служат «ключами» к внешнему миру для агентов, позволяя им взаимодействовать с внешними системами и получать доступ к знаниям за пределами обучающих данных. Расширения соединяют агентов с внешними API для получения актуальной информации. Функции дают разработчикам более детальный контроль над потоком данных и выполнением операций. Хранилища данных открывают доступ к структурированным или неструктурированным данным, поддерживая приложения, основанные на извлечении знаний.

Ожидается, что в будущем агенты покажут значительные достижения благодаря усовершенствованию инструментов и возможностей вести рассуждения. Это позволит им решать все более сложные задачи.

Кроме того, стратегический подход «цепочки агентов», объединяющий специализированных агентов для конкретных задач, будет способствовать созданию комплексных систем, работающих наподобие конвейера, каждое звено которого выполняет свою функцию.

#news #AI #бигтехи #политика

https://www.kaggle.com/whitepaper-agents
Nvidia представляет новую технологию обучения роботов

Глава компании Дженсен Хуанг представил базовые модели Cosmos. Они генерируют реалистичное видео, которое можно использовать для обучения роботов и беспилотных автомобилей с гораздо меньшими затратами, чем при использовании обычных данных.

Создавая так называемые «синтетические» обучающие данные, модели помогают роботам и автомобилям понимать физический мир подобно тому, как LLM помогли чат-ботам генерировать ответы на естественном языке.

Пользователи смогут давать Cosmos текстовое описание, из которого модель сможет сделать видео, причём в нём будут соблюдаться законы физики. Такой подход обещает быть намного дешевле, чем сбор данных из реальности, например, вывод автомобилей на дорогу для съёмки видео или обучение роботов повторяющимся задачам.

Cosmos будет доступен по открытой лицензии.

«Мы действительно надеемся, что Cosmos сделает для мира робототехники и промышленного AI то же, что Llama 3 сделала для корпоративного AI», — провёл аналогии Хуанг.

#news #роботы #бигтехи #AI

https://www.reuters.com/technology/ces-nvidia-ceo-set-take-stage-ces-just-after-shares-hit-record-high-2025-01-07/
NVIDIA планирует выпускать вместе с MediaTek ЦПУ для настольных ПК

Настольный компьютер под названием Project DIGITS содержит новый центральный процессор, над созданием которого работали компании. Машина использует новейший AI-чип Blackwell от NVIDIA и будет стоить $3000.

Заходя на рынок ЦПУ для персональных и корпоративных настольных ПК, американский бигтех вступает в конкуренцию с Intel, AMD и Qualcomm. По словам главы компании Дженсена Хуанга, NVIDIA привлекла MediaTek, одного из лидеров в области мобильных процессоров, для совместной разработки энергоэффективного ЦПУ, которое можно было бы широко тиражировать, и у них на него большие планы.

Он добавил, что компания сможет преодолеть разрыв между операционной системой Linux, которую используют большинство разработчиков AI, и широкодоступной Windows с помощью технологии Windows Subsystem для Linux, которая позволяет использовать обе системы на одном компьютере. ПК, работающие на таких ОС и с компонентами от NVIDIA, Хуанг собирается сделать массовыми продуктами.

#news #чипы #бигтехи #AI

https://www.scmp.com/tech/tech-trends/article/3293830/nvidia-ceo-says-company-has-plans-desktop-chip-designed-mediatek