Innovation & Research
Саудовская Аравия планирует вложить $40 млрд в AI. В последние недели представители Фонда государственных инвестиций Саудовской Аравии обсудили потенциальное партнерство с Andreessen Horowitz, одной из ведущих венчурных фондов Долины. Также, привлечены другие…
Сэм Альтман работает над созданием глобальной коалиции для развития AI
Как стало известно, глава OpenAI встретился с инвесторами и представителями правительства Объединённых Арабских Эмиратов, чтобы обсудить, как компании могут работать с государством для поддержки дорогостоящей и крупномасштабной инфраструктуры искусственного интеллекта: нужны чипы, центры обработки данных и электроэнергия. В этом месяце Сэм Альтман также вёл переговоры с официальными лицами ряда западных стран, в том числе США.
Взаимодействие Альтмана с органами власти по всему миру, похоже, имеет больший масштаб, чем было известно ранее. По словам инсайдеров, в OpenAI рассматривают потребность в огромном количестве энергии для питания AI-систем как одно из самых больших инфраструктурных препятствий, стоящих перед отраслью. Альтман ранее говорил о необходимости энергетического «прорыва», чтобы поддержать энергоёмкую технологию и предполагает, что наиболее эффективными здесь окажутся дешёвая солнечная энергия или термоядерный синтез.
#news #AI #чипы
https://www.bloomberg.com/news/articles/2024-04-10/openai-s-altman-pitches-global-ai-coalition-on-trip-to-middle-east
Как стало известно, глава OpenAI встретился с инвесторами и представителями правительства Объединённых Арабских Эмиратов, чтобы обсудить, как компании могут работать с государством для поддержки дорогостоящей и крупномасштабной инфраструктуры искусственного интеллекта: нужны чипы, центры обработки данных и электроэнергия. В этом месяце Сэм Альтман также вёл переговоры с официальными лицами ряда западных стран, в том числе США.
Взаимодействие Альтмана с органами власти по всему миру, похоже, имеет больший масштаб, чем было известно ранее. По словам инсайдеров, в OpenAI рассматривают потребность в огромном количестве энергии для питания AI-систем как одно из самых больших инфраструктурных препятствий, стоящих перед отраслью. Альтман ранее говорил о необходимости энергетического «прорыва», чтобы поддержать энергоёмкую технологию и предполагает, что наиболее эффективными здесь окажутся дешёвая солнечная энергия или термоядерный синтез.
#news #AI #чипы
https://www.bloomberg.com/news/articles/2024-04-10/openai-s-altman-pitches-global-ai-coalition-on-trip-to-middle-east
Bloomberg.com
OpenAI’s Altman Pitches Global AI Coalition on Trip to Middle East
The CEO met with officials in the UAE this week to push for more infrastructure investment to support the development of artificial intelligence.
AI как инструмент дипломатии
Относительно небольшая сделка - по стандартам Microsoft, в любом случае - приведет к большим геополитическим изменениям сегодня утром.
Технологический гигант инвестирует 1,5 миллиарда долларов в G42, эмиратскую компанию по искусственному интеллекту. Это может показаться просто еще одной попыткой технологического гиганта закрепиться в быстрорастущей компании ИИ, как это было сделано с OpenAI и другими.
Но детали сделки отражают сотрудничество между администрацией Байдена и Microsoft, чтобы убрать Пекин от влияния в Персидском заливе, поскольку США и Китай конкурируют за превосходство AI.
Условия сделки: G42 будет продавать сервисы Microsoft, которые используют мощные чипы; взамен он будет использовать облачные сервисы Microsoft Azure для своих продуктов с ИИ.
Что еще более важно, G42 согласилась исключить из своих систем оборудование китайских компаний, таких как Huawei, устранив то, что, по мнению американских чиновников, может стать потенциальным бэкдором для китайских спецслужб.
Это предназначено для того, чтобы вывести влиятельную AI-компанию в орбиту Америки. G42 рассматривается как важный игрок в Персидском заливе и за его пределами: его председателем является шейх Тахнун бин Заид, высокопоставленный чиновник службы безопасности Эмиратов и брат правителя страны. Он лично заключил ряд громких деловых партнерств и курирует всю сферу безопасности королевства. Пэн Сяо, директор компании, ранее был связан с DarkMatter, эмиратской шпионской компанией, которая наняла бывших шпионов.
#от_редактора #AI
Относительно небольшая сделка - по стандартам Microsoft, в любом случае - приведет к большим геополитическим изменениям сегодня утром.
Технологический гигант инвестирует 1,5 миллиарда долларов в G42, эмиратскую компанию по искусственному интеллекту. Это может показаться просто еще одной попыткой технологического гиганта закрепиться в быстрорастущей компании ИИ, как это было сделано с OpenAI и другими.
Но детали сделки отражают сотрудничество между администрацией Байдена и Microsoft, чтобы убрать Пекин от влияния в Персидском заливе, поскольку США и Китай конкурируют за превосходство AI.
Условия сделки: G42 будет продавать сервисы Microsoft, которые используют мощные чипы; взамен он будет использовать облачные сервисы Microsoft Azure для своих продуктов с ИИ.
Что еще более важно, G42 согласилась исключить из своих систем оборудование китайских компаний, таких как Huawei, устранив то, что, по мнению американских чиновников, может стать потенциальным бэкдором для китайских спецслужб.
Это предназначено для того, чтобы вывести влиятельную AI-компанию в орбиту Америки. G42 рассматривается как важный игрок в Персидском заливе и за его пределами: его председателем является шейх Тахнун бин Заид, высокопоставленный чиновник службы безопасности Эмиратов и брат правителя страны. Он лично заключил ряд громких деловых партнерств и курирует всю сферу безопасности королевства. Пэн Сяо, директор компании, ранее был связан с DarkMatter, эмиратской шпионской компанией, которая наняла бывших шпионов.
#от_редактора #AI
NY Times
Microsoft Makes High-Stakes Play in Tech Cold War With Emirati A.I. Deal
Microsoft said it would invest $1.5 billion in G42, an Emirati company with ties to China, as Washington and Beijing maneuver to secure tech influence in the Persian Gulf.
Чтобы понять, чем должны заниматься корпорации, стартапы и университеты, как разделить их роли, то можно воспользоваться следующей матрицей:
1. Если понятно, как ответить на вопросы «Как это сделать?» и «Как на этом заработать?», то такую задачу можно решить внутри компании.
2. Если понятно, как решить задачу, но непонятно, как на ней заработать, то эта задача для стартапов.
3. Если непонятно, как сделать, но понятно, как можно заработать, то за задачу должны взяться корпоративные лаборатории.
4. Если непонятно ничего, то это задача для университетов – они обладают достаточном опытом и временем.
#от_редактора
1. Если понятно, как ответить на вопросы «Как это сделать?» и «Как на этом заработать?», то такую задачу можно решить внутри компании.
2. Если понятно, как решить задачу, но непонятно, как на ней заработать, то эта задача для стартапов.
3. Если непонятно, как сделать, но понятно, как можно заработать, то за задачу должны взяться корпоративные лаборатории.
4. Если непонятно ничего, то это задача для университетов – они обладают достаточном опытом и временем.
#от_редактора
Innovation & Research
BMW и разработчик человекоподобных роботов Fugure подписали соглашение о сотрудничестве Это первая коммерческая сделка для стартапа, основанного в 2022 г. Согласно договорённостям, роботы будут развёрнуты на заводе автоконцерна в США, в Южной Каролине. Это…
Человекоподобного робота от Sanctuary AI «трудоустроят» на автозаводах канадской Magna
Компания — один из крупнейших поставщиков комплектующих для автомобилей и контрактный сборщик ряда марок, среди которых Mercedes, BMW, Jeep и Jaguar, — проинвестировала в стартап Sanctuary AI в 2021 г. и теперь запускает пилотное внедрение роботов Phoenix на своём производстве. Эта модель весит 70 кг при высоте 170 см, может поднимать до 25 кг и оснащена AI-системой Carbon собственной разработки Sanctuary AI, предназначенной для управления роботом.
На каких именно участках производства будут задействованы человекоподобные роботы, не сообщается. Стартап Sanctuary AI был основан в 2018 г. в Канаде, к настоящему моменту объём известных инвестиций в компанию составляет $85,8 млн, стоимость оценивается в $218 млн. Ранее о пилотных внедрениях антропоморфных роботов Apptronik и Figure заявили Mercedes и BMW соответственно.
#news #роботы
https://techcrunch.com/2024/04/11/european-car-manufacturer-will-pilot-sanctuary-ais-humanoid-robot/
Компания — один из крупнейших поставщиков комплектующих для автомобилей и контрактный сборщик ряда марок, среди которых Mercedes, BMW, Jeep и Jaguar, — проинвестировала в стартап Sanctuary AI в 2021 г. и теперь запускает пилотное внедрение роботов Phoenix на своём производстве. Эта модель весит 70 кг при высоте 170 см, может поднимать до 25 кг и оснащена AI-системой Carbon собственной разработки Sanctuary AI, предназначенной для управления роботом.
На каких именно участках производства будут задействованы человекоподобные роботы, не сообщается. Стартап Sanctuary AI был основан в 2018 г. в Канаде, к настоящему моменту объём известных инвестиций в компанию составляет $85,8 млн, стоимость оценивается в $218 млн. Ранее о пилотных внедрениях антропоморфных роботов Apptronik и Figure заявили Mercedes и BMW соответственно.
#news #роботы
https://techcrunch.com/2024/04/11/european-car-manufacturer-will-pilot-sanctuary-ais-humanoid-robot/
TechCrunch
European car manufacturer will pilot Sanctuary AI’s humanoid robot
Sanctuary AI announced that it will be delivering its humanoid robot to a Magna manufacturing facility. Based in Canada, with auto manufacturing facilities in Austria, Magna manufactures and assembles cars for a number of Europe’s top automakers, including…
Many_Shot_Jailbreaking__2024_04_02_0936.pdf
1.3 MB
Скорострельный джейлбрейк: Anthropic продемонстрировал, что функции безопасности AI можно легко обойти и LLM вынуждены генерировать ответы на потенциально вредные запросы.
Исследования показали, что функции безопасности некоторых из самых мощных инструментов искусственного интеллекта, которые пока не позволяют использовать их для киберпреступности или терроризма, можно просто обойти, наводнив их примерами правонарушений.
В статье исследователи описали атаку, которую они назвали «скорострельным джейлбрейком». Атака была такой же простой, насколько и эффективной.
Claud, как и большинство крупных коммерческих систем искусственного интеллекта, содержит функции безопасности, предназначенные для поощрения отказа от определенных запросов, таких как создание насильственных или ненавистнических высказываний, создание инструкций о незаконной деятельности, обман или дискриминация. Например, пользователь, который запрашивает у системы инструкции по созданию бомбы, получит вежливый отказ от участия.
Но системы искусственного интеллекта часто работают лучше - в любой задаче - когда им даются примеры того, что нужно сделать. И оказывается, что если вы дадите достаточно примеров - сотни - "правильного" ответа на такие вредные вопросы, как "как мне кого-то связать", "как мне подделать деньги" или "как сделать метамфетамин", то система с радостью продолжит тенденцию и ответит на самый последний вопрос.
Включив большое количество текста в конкретную конфигурацию, этот метод может заставить LLM производить потенциально вредные ответы, несмотря на то, что они были обучены не делать этого.
Хотя атака, известная как джейлбрейк, проста, ее раньше не видели, потому что она требует модели искусственного интеллекта с большим «контекстным окном»: способность отвечать на вопрос, который длится много тысяч слов.
Новые, более сложные системы искусственного интеллекта, похоже, более уязвимы к такой атаке, даже если они могут переваривать более длительные входные данные.
Исследования показали, что функции безопасности некоторых из самых мощных инструментов искусственного интеллекта, которые пока не позволяют использовать их для киберпреступности или терроризма, можно просто обойти, наводнив их примерами правонарушений.
В статье исследователи описали атаку, которую они назвали «скорострельным джейлбрейком». Атака была такой же простой, насколько и эффективной.
Claud, как и большинство крупных коммерческих систем искусственного интеллекта, содержит функции безопасности, предназначенные для поощрения отказа от определенных запросов, таких как создание насильственных или ненавистнических высказываний, создание инструкций о незаконной деятельности, обман или дискриминация. Например, пользователь, который запрашивает у системы инструкции по созданию бомбы, получит вежливый отказ от участия.
Но системы искусственного интеллекта часто работают лучше - в любой задаче - когда им даются примеры того, что нужно сделать. И оказывается, что если вы дадите достаточно примеров - сотни - "правильного" ответа на такие вредные вопросы, как "как мне кого-то связать", "как мне подделать деньги" или "как сделать метамфетамин", то система с радостью продолжит тенденцию и ответит на самый последний вопрос.
Включив большое количество текста в конкретную конфигурацию, этот метод может заставить LLM производить потенциально вредные ответы, несмотря на то, что они были обучены не делать этого.
Хотя атака, известная как джейлбрейк, проста, ее раньше не видели, потому что она требует модели искусственного интеллекта с большим «контекстным окном»: способность отвечать на вопрос, который длится много тысяч слов.
Новые, более сложные системы искусственного интеллекта, похоже, более уязвимы к такой атаке, даже если они могут переваривать более длительные входные данные.
Innovation & Research
Корейский производитель коллаборативных роботов провёл успешное IPO Компания Doosan Robotics, крупнейший в Южной Корее производитель коллаборативных роботов (коботов), привлекла в ходе размещения $310 млн — это было крупнейшее IPO в стране в текущем году.…
Интерес инвесторов к человекоподобным роботам помогает развивать и коллаборативные машины
Так, стартап Collaborative Robotics, который разрабатывает мобильных коботов, привлёк $100 млн и теперь оценивается в $0,5 млрд. Раунд В возглавила General Catalyst, в числе инвесторов — Sequoia Capital, Khosla Ventures и Mayo Clinic. Компания основана в 2022 году Брэдом Портером (Brad Porter), бывшим вице-президентом по робототехнике Amazon. Разработчики отмечают рост внимания инвесторов к коботам на волне интереса к универсальным человекоподобным роботам, поскольку в нишах логистики и производства эти два типа машин взаимозаменяемы.
Collaborative Robotics планирует использовать полученные средства для расширения штата и производства. В настоящий момент компания работает над внедрением генеративного искусственного интеллекта на платформы коллаборативных роботов, чтобы последние могли обучаться во взаимодействии с людьми и работать с ними в одном пространстве. Пока компания адаптирует коботов к работе на складах.
#news #роботы
https://www.co.bot/news/robots-come-to-life
Так, стартап Collaborative Robotics, который разрабатывает мобильных коботов, привлёк $100 млн и теперь оценивается в $0,5 млрд. Раунд В возглавила General Catalyst, в числе инвесторов — Sequoia Capital, Khosla Ventures и Mayo Clinic. Компания основана в 2022 году Брэдом Портером (Brad Porter), бывшим вице-президентом по робототехнике Amazon. Разработчики отмечают рост внимания инвесторов к коботам на волне интереса к универсальным человекоподобным роботам, поскольку в нишах логистики и производства эти два типа машин взаимозаменяемы.
Collaborative Robotics планирует использовать полученные средства для расширения штата и производства. В настоящий момент компания работает над внедрением генеративного искусственного интеллекта на платформы коллаборативных роботов, чтобы последние могли обучаться во взаимодействии с людьми и работать с ними в одном пространстве. Пока компания адаптирует коботов к работе на складах.
#news #роботы
https://www.co.bot/news/robots-come-to-life
www.co.bot
Our Robot Comes to Life and Gets Right to Work
Collaborative Robotics is a team of innovators defining the future of robot interaction. Real-World Applicability. Predictable Behaviors. Brilliant Hardware.
Innovation & Research
Юго-Восточная Азия перехватывает инициативу в производстве полупроводников Поскольку торговые правила США вытесняют из Китая многих производителей полупроводников, корпорации вынуждены переносить мощности в другие страны. Так, в Малайзии лидеры рынка Micron…
Вьетнамская Viettel будет развивать полупроводниковую промышленность в стране
Вьетнамское правительство заявило, что в текущем году введет ряд налоговых льгот и учредит инвестиционные фонды для создания национальной полупроводниковой промышленности. До 2030 года планируется построить минимум один полупроводниковый завод, оснащённый импортным оборудованием. Главный претендент на роль оператора проекта — дуополист телеком-рынка страны Viettel, подконтрольный министерству обороны.
Во Вьетнаме уже имеются производственные мощности крупных зарубежных игроков — Intel, Samsung, Amkor, Qualcomm и Marvell, что в теории должно способствовать благоприятному развитию национального производства и сообщества поставщиков и смежников.
#news #чипы
https://www.reuters.com/technology/vietnams-viettel-develop-semiconductor-industry-prime-minister-says-2024-04-10/
Вьетнамское правительство заявило, что в текущем году введет ряд налоговых льгот и учредит инвестиционные фонды для создания национальной полупроводниковой промышленности. До 2030 года планируется построить минимум один полупроводниковый завод, оснащённый импортным оборудованием. Главный претендент на роль оператора проекта — дуополист телеком-рынка страны Viettel, подконтрольный министерству обороны.
Во Вьетнаме уже имеются производственные мощности крупных зарубежных игроков — Intel, Samsung, Amkor, Qualcomm и Marvell, что в теории должно способствовать благоприятному развитию национального производства и сообщества поставщиков и смежников.
#news #чипы
https://www.reuters.com/technology/vietnams-viettel-develop-semiconductor-industry-prime-minister-says-2024-04-10/
Reuters
Vietnam's Viettel to develop semiconductor industry, prime minister says
Vietnamese Prime Minister Pham Minh Chinh has asked military-run telecom company Viettel to develop the semiconductor chip industry in a "more efficient and diverse manner", the government quoted him as saying late on Tuesday.
CEO Boston Dynamics Роберт Плейтер о новом Atlas.
Главное в этом большом интервью выделили для вас эксперты Центра робототехники Сбербанка:
- Компания Boston Dynamics "уже какое-то время" разрабатывает нового полностью электрического робота Atlas с диапазоном движений и силой, превышающей человеческие возможности.
- Робот будет использоваться в различных отраслях промышленности, включая производство и логистику. (Мы собираемся запустить его как продукт, ориентированный на промышленные приложения, логистику и места, которые гораздо более разнообразны, чем те, где вы видите тяжелые объекты со сложной геометрией, вероятно, в производственных средах.)
- Новый Atlas оснащен актуаторами с большим диапазоном движений чем у человека, которые обеспечивают уникальные движения и эффективность.
- Голова робота спроектирована таким образом, чтобы создавать дружелюбное место для получения понимания намерений робота.
- Для разработки Atlas требуется реальный сценарий использования, производительность, надежность, обслуживание и интеграция.
BD сосредоточились на динамическом балансировании, мобильности, возможности поднять что-то и сохранить при этом подвижность - это были темы исследований которыми занимались в прошлом, и с которыми мы теперь научились справляться, и которые, как мне кажется, необходимы для выполнения полезной работы.
“Этот робот будет сильнее в большинстве суставов, чем человек и даже элитный спортсмен, и будет обладать диапазоном движений, превосходящим все, что когда—либо может сделать человек”.
- Boston Dynamics использует свой опыт работы над гуманоидами и коммерциализацией Spot, чтобы превратить Atlas в продукт.
- Компания планирует провести испытания технологии на заводах Hyundai Motor Group уже в следующем году.
Над чем вы будете работать в ближайшем будущем и чем сможете поделиться?
Плейтер: "Мы начнем демонстрировать в новом атласе более искусные манипуляции, которые мы уже показывали в нашем старом атласе. И мы планируем провести испытания технологии proof of technology на заводах Hyundai Motor Group уже в следующем году. HMG действительно в восторге от этого проекта; они хотят преобразовать свое производство и видят в Atlas важную часть этого процесса, и поэтому мы собираемся заняться этим в ближайшее время."
#от_редактора #роботы
Главное в этом большом интервью выделили для вас эксперты Центра робототехники Сбербанка:
- Компания Boston Dynamics "уже какое-то время" разрабатывает нового полностью электрического робота Atlas с диапазоном движений и силой, превышающей человеческие возможности.
- Робот будет использоваться в различных отраслях промышленности, включая производство и логистику. (Мы собираемся запустить его как продукт, ориентированный на промышленные приложения, логистику и места, которые гораздо более разнообразны, чем те, где вы видите тяжелые объекты со сложной геометрией, вероятно, в производственных средах.)
- Новый Atlas оснащен актуаторами с большим диапазоном движений чем у человека, которые обеспечивают уникальные движения и эффективность.
- Голова робота спроектирована таким образом, чтобы создавать дружелюбное место для получения понимания намерений робота.
- Для разработки Atlas требуется реальный сценарий использования, производительность, надежность, обслуживание и интеграция.
BD сосредоточились на динамическом балансировании, мобильности, возможности поднять что-то и сохранить при этом подвижность - это были темы исследований которыми занимались в прошлом, и с которыми мы теперь научились справляться, и которые, как мне кажется, необходимы для выполнения полезной работы.
“Этот робот будет сильнее в большинстве суставов, чем человек и даже элитный спортсмен, и будет обладать диапазоном движений, превосходящим все, что когда—либо может сделать человек”.
- Boston Dynamics использует свой опыт работы над гуманоидами и коммерциализацией Spot, чтобы превратить Atlas в продукт.
- Компания планирует провести испытания технологии на заводах Hyundai Motor Group уже в следующем году.
Над чем вы будете работать в ближайшем будущем и чем сможете поделиться?
Плейтер: "Мы начнем демонстрировать в новом атласе более искусные манипуляции, которые мы уже показывали в нашем старом атласе. И мы планируем провести испытания технологии proof of technology на заводах Hyundai Motor Group уже в следующем году. HMG действительно в восторге от этого проекта; они хотят преобразовать свое производство и видят в Atlas важную часть этого процесса, и поэтому мы собираемся заняться этим в ближайшее время."
#от_редактора #роботы
IEEE Spectrum
Boston Dynamics’ Robert Playter on the New Atlas
The robotics company’s CEO answers our questions about its new humanoid
ОЦЕНИВАТЬ ИИ СТАНОВИТСЯ СЛОЖНЕЕ
Сегодня о работоспособности AI-моделей мы можем судить только на основе заявлений разработчиков и результатов независимых тестов, которые компании официально не обязаны проводить.
ТЕСТЫ ДЛЯ AI МОДЕЛЕЙ НЕ УСПЕВАЮТ ЗА ИХ РАЗВИТИЕМ И МОГУТ ФАЛЬСИФИЦИРОВАТЬ РЕЗУЛЬТАТЫ
Тест Тьюринга. Был наиболее распространённым, но современные AI-модели уже научились его успешно проходить, поэтому приходится придумывать более сложные методы оценки сильных/слабых сторон AI.
MMLU (Massive Multitask Language Understanding). Самый популярный тест в настоящее время, считается «золотым стандартом» для AI компаний. Состоит из ~ 16тыс. вопросов и позволяет оценивать компетентность моделей в области нескольких десятков академических дисциплин.
90% в MMLU набрала модель от Google Gemini Ultra, что является самым высоким показателем за всю историю. При этом сложно понять, насколько данная оценка оправдана, поскольку MMLU уже устаревает. Через 1-2 года MMLU будет недостаточно для объективного тестирования.
Также существует проблема, что в данных, на которых обучаются AI-модели, заложены не только тестовые вопросы, но и ответы, что приводит к фальсификации результатов.
РАЗРАБОТЧИКИ НЕ МОГУТ ОБЪЕКТИВНО ОЦЕНИТЬ AI-МОДЕЛИ И ПОЛАГАЮТСЯ НА ОЩУЩЕНИЯ
Эффективное управление AI зависит от способности осмысленно его оценивать. Должны быть разработаны инструменты, позволяющие правильно измерять перспективы и риски AI, поскольку некачественные измерения создают угрозу безопасности при его использовании.
В отчете “Индекс искусственного интеллекта”, опубликованном Стэнфордским институтом искусственного интеллекта, авторы описывают некачественные измерения как одну из самых серьезных проблем, стоящих перед исследователями AI.
НАЙТИ РЕШЕНИЕ ПОЛУЧИТСЯ, ОБЪЕДИНИВ УСИЛИЯ ПРАВИТЕЛЬСТВ, НАУКИ И БИЗНЕСА
Правительства должны:
1. Разработать надежные программы тестирования, измеряющие исходные возможности и риски безопасности AI моделей;
2. Финансировать гранты и исследовательские проекты, направленные на разработку новых высококачественных оценок.
Академические круги уже работают над решением проблемы:
1. Исследователи из Стэнфорда представили новые подходы к тестированию AI-моделей изображений с привлечением людей-оценщиков, а не просто за счет использования автоматизированных инструментов;
2. Группа исследователей из Калифорнийского университета в Беркли запустила чат-бота Arena, который позволяет :
◦ сопоставлять модели по результатам ответов на запросы. Модели подбираются случайным образом и их названия не видны пользователям;
◦ проводить тестирование моделей, выбирая их открытого списка.
AI компании могут внести вклад, сотрудничая со сторонними оценщиками и аудиторами для тестирования своих моделей и делая новые модели более доступными для исследователей и более прозрачными при обновлении.
#от_редактора #AI
Сегодня о работоспособности AI-моделей мы можем судить только на основе заявлений разработчиков и результатов независимых тестов, которые компании официально не обязаны проводить.
ТЕСТЫ ДЛЯ AI МОДЕЛЕЙ НЕ УСПЕВАЮТ ЗА ИХ РАЗВИТИЕМ И МОГУТ ФАЛЬСИФИЦИРОВАТЬ РЕЗУЛЬТАТЫ
Тест Тьюринга. Был наиболее распространённым, но современные AI-модели уже научились его успешно проходить, поэтому приходится придумывать более сложные методы оценки сильных/слабых сторон AI.
MMLU (Massive Multitask Language Understanding). Самый популярный тест в настоящее время, считается «золотым стандартом» для AI компаний. Состоит из ~ 16тыс. вопросов и позволяет оценивать компетентность моделей в области нескольких десятков академических дисциплин.
90% в MMLU набрала модель от Google Gemini Ultra, что является самым высоким показателем за всю историю. При этом сложно понять, насколько данная оценка оправдана, поскольку MMLU уже устаревает. Через 1-2 года MMLU будет недостаточно для объективного тестирования.
Также существует проблема, что в данных, на которых обучаются AI-модели, заложены не только тестовые вопросы, но и ответы, что приводит к фальсификации результатов.
РАЗРАБОТЧИКИ НЕ МОГУТ ОБЪЕКТИВНО ОЦЕНИТЬ AI-МОДЕЛИ И ПОЛАГАЮТСЯ НА ОЩУЩЕНИЯ
Эффективное управление AI зависит от способности осмысленно его оценивать. Должны быть разработаны инструменты, позволяющие правильно измерять перспективы и риски AI, поскольку некачественные измерения создают угрозу безопасности при его использовании.
В отчете “Индекс искусственного интеллекта”, опубликованном Стэнфордским институтом искусственного интеллекта, авторы описывают некачественные измерения как одну из самых серьезных проблем, стоящих перед исследователями AI.
НАЙТИ РЕШЕНИЕ ПОЛУЧИТСЯ, ОБЪЕДИНИВ УСИЛИЯ ПРАВИТЕЛЬСТВ, НАУКИ И БИЗНЕСА
Правительства должны:
1. Разработать надежные программы тестирования, измеряющие исходные возможности и риски безопасности AI моделей;
2. Финансировать гранты и исследовательские проекты, направленные на разработку новых высококачественных оценок.
Академические круги уже работают над решением проблемы:
1. Исследователи из Стэнфорда представили новые подходы к тестированию AI-моделей изображений с привлечением людей-оценщиков, а не просто за счет использования автоматизированных инструментов;
2. Группа исследователей из Калифорнийского университета в Беркли запустила чат-бота Arena, который позволяет :
◦ сопоставлять модели по результатам ответов на запросы. Модели подбираются случайным образом и их названия не видны пользователям;
◦ проводить тестирование моделей, выбирая их открытого списка.
AI компании могут внести вклад, сотрудничая со сторонними оценщиками и аудиторами для тестирования своих моделей и делая новые модели более доступными для исследователей и более прозрачными при обновлении.
#от_редактора #AI
NY Times
A.I. Has a Measurement Problem (Gift Article)
Which A.I. system writes the best computer code or generates the most realistic image? Right now, there’s no easy way to answer those questions.
AI-новинки от Baidu
Китайский бигтех анонсировал три новые версии своей большой модели Ernie AI — Speed, Lite и Tiny. На базе Ernie работают различные клиентские сервисы — умный поиск, рекомендательные системы и т.п., а также — достаточно мощный помощник по написанию кода Comate. По данным Baidu, за год с момента запуска Comate сгенерировал 27% нового кода в продуктах самой корпорации, а число корпоративных клиентов, использующих сервис, достигло 10 тыс.
Также были представлены три инструмента для разработки AI-агентов — AgentBuilder, AppBuilder и ModelBuilder. Они позволяют создавать диалоговых агентов, использующих веб-поиск Baidu, а также строить приложения, не прибегая к классическому программированию.
Вслед за Google Cloud, Baidu предлагает клиентам более-менее полный стек сервисов для разработки AI-агентов и развития no-code платформ.
#news #Китай #AI
https://www.cnbc.com/2024/04/16/baidu-says-its-chatgpt-like-ernie-bot-exceeds-200-million-users.html
Китайский бигтех анонсировал три новые версии своей большой модели Ernie AI — Speed, Lite и Tiny. На базе Ernie работают различные клиентские сервисы — умный поиск, рекомендательные системы и т.п., а также — достаточно мощный помощник по написанию кода Comate. По данным Baidu, за год с момента запуска Comate сгенерировал 27% нового кода в продуктах самой корпорации, а число корпоративных клиентов, использующих сервис, достигло 10 тыс.
Также были представлены три инструмента для разработки AI-агентов — AgentBuilder, AppBuilder и ModelBuilder. Они позволяют создавать диалоговых агентов, использующих веб-поиск Baidu, а также строить приложения, не прибегая к классическому программированию.
Вслед за Google Cloud, Baidu предлагает клиентам более-менее полный стек сервисов для разработки AI-агентов и развития no-code платформ.
#news #Китай #AI
https://www.cnbc.com/2024/04/16/baidu-says-its-chatgpt-like-ernie-bot-exceeds-200-million-users.html
CNBC
Baidu says its ChatGPT-like Ernie bot exceeds 200 million users
Baidu CEO Robin Li was speaking at the company's annual "Create" conference for artificial intelligence developers. Li is also co-founder and chairman of Baidu.
Анонсировано третье поколение больших моделей Llama
Llama 3, которая обещает стать конкурентом GPT-4 Turbo, но с открытым исходным кодом, представлена в двух версиях: Llama 3 8B и Llama 3 70B, а самая большая версия на 400 млрд параметров пока проходит предобучение. Обучающий датасет для новых моделей в 7 раз больше, чем у Llama 2, и в нём в 4 раза больше кода. При этом никакие пользовательские данные не использовались, хотя Цукерберг заявлял, что у Meta* корпус данных больше, чем весь Common Crawl. Для предобучения Llama 3 использовалась смесь общедоступных интернет-данных и синтетических данных, созданных искусственным интеллектом. В ряде тестов (MMLU, GPQA и др.) Llama 3 демонстрирует результаты выше, чем модели от Mistral и Gemini от Google.
*Организация запрещена в России как экстремистская
#news #AI #бигтехи
https://ai.meta.com/blog/meta-llama-3/
Llama 3, которая обещает стать конкурентом GPT-4 Turbo, но с открытым исходным кодом, представлена в двух версиях: Llama 3 8B и Llama 3 70B, а самая большая версия на 400 млрд параметров пока проходит предобучение. Обучающий датасет для новых моделей в 7 раз больше, чем у Llama 2, и в нём в 4 раза больше кода. При этом никакие пользовательские данные не использовались, хотя Цукерберг заявлял, что у Meta* корпус данных больше, чем весь Common Crawl. Для предобучения Llama 3 использовалась смесь общедоступных интернет-данных и синтетических данных, созданных искусственным интеллектом. В ряде тестов (MMLU, GPQA и др.) Llama 3 демонстрирует результаты выше, чем модели от Mistral и Gemini от Google.
*Организация запрещена в России как экстремистская
#news #AI #бигтехи
https://ai.meta.com/blog/meta-llama-3/
Meta AI
Introducing Meta Llama 3: The most capable openly available LLM to date
Today, we’re introducing Meta Llama 3, the next generation of our state-of-the-art open source large language model. In the coming months, we expect to share new capabilities, additional model sizes, and more.
Есть вещи за которые мы любим науку. Не потому, что она дает свои плоды) а за то, что показывает как прекрасен мир. Смотрите как ИИ помогает раскрыть тайну полета насекомых
Модель машинного обучения, которая показывает как летает муха, помогла исследователям разгадать работу шарнира крыла насекомых. Большинство гипотез этой сложной биомеханической структуре основаны на том, как она выглядит, когда не движется. Система искусственного интеллекта, обученная видеозаписям около 70 000 ударов крыла плодовой мухи, предсказала, как мышечные сокращения вызовут различные движения крыла. Крылатый робот, запрограммированный с помощью результатов модели, затем позволил исследователям создать карту, связываюшую мышечную активность с силами полета.
https://youtu.be/J-guci0Exz8?si=9CttjNrgSnRk4X90
#от_редактора #AI
Модель машинного обучения, которая показывает как летает муха, помогла исследователям разгадать работу шарнира крыла насекомых. Большинство гипотез этой сложной биомеханической структуре основаны на том, как она выглядит, когда не движется. Система искусственного интеллекта, обученная видеозаписям около 70 000 ударов крыла плодовой мухи, предсказала, как мышечные сокращения вызовут различные движения крыла. Крылатый робот, запрограммированный с помощью результатов модели, затем позволил исследователям создать карту, связываюшую мышечную активность с силами полета.
https://youtu.be/J-guci0Exz8?si=9CttjNrgSnRk4X90
#от_редактора #AI
YouTube
AI and robotics demystify the workings of a fly's wing
Machine learning and robotics have shed new light on one of the most sophisticated skeletal structures in the animal kingdom: the insect wing hinge.
Unlike birds or bats, which evolved wings by adapting existing limbs, insect wings are wholly original appendages…
Unlike birds or bats, which evolved wings by adapting existing limbs, insect wings are wholly original appendages…
Boston Dynamics представила обновлённую версию робота Atlas
Компания вывела из эксплуатации гидравлическую версию человекоподобного робота, ставшую за последние годы привычной для публики, и представила новую, полностью электрическую модель. Новинка ближе к Digit от Agility и Apollo от Apptronik, у неё более аккуратный облик — все кабели и приводы убраны внутрь корпуса, есть выраженная голова, похожая на пиксаровскую лампу.
Важная особенность — большее, чем у человека, количество степеней свободы у конечностей, поэтому робот может совершать необычные, на первый взгляд, движения. В частности, чтобы развернуться, роботу не нужно делать оборот, он может развернуть ноги, затем, уже в движении, — голову и торс. При работе на производстве, при челночных движениях, это может сэкономить массу времени. Робот также способен подняться из положения лёжа без посторонней помощи и подобрать что-либо с пола — это стало возможно благодаря системе динамического балансирования и так же снижает простой машины.
По словам разработчиков, сила робота также будет превосходить силу человека.
Робот находится на ранней стадии разработки, пилотные испытания на складах и производствах Hyundai — главного акционера Boston Dynamics — начнутся в начале 2025 г., а массовое производство запустят через несколько лет. О том, какая AI-модель ляжет в основу системы управления роботом, пока не сообщается.
#news #роботы
https://techcrunch.com/2024/04/17/boston-dynamics-atlas-humanoid-robot-goes-electric/
Компания вывела из эксплуатации гидравлическую версию человекоподобного робота, ставшую за последние годы привычной для публики, и представила новую, полностью электрическую модель. Новинка ближе к Digit от Agility и Apollo от Apptronik, у неё более аккуратный облик — все кабели и приводы убраны внутрь корпуса, есть выраженная голова, похожая на пиксаровскую лампу.
Важная особенность — большее, чем у человека, количество степеней свободы у конечностей, поэтому робот может совершать необычные, на первый взгляд, движения. В частности, чтобы развернуться, роботу не нужно делать оборот, он может развернуть ноги, затем, уже в движении, — голову и торс. При работе на производстве, при челночных движениях, это может сэкономить массу времени. Робот также способен подняться из положения лёжа без посторонней помощи и подобрать что-либо с пола — это стало возможно благодаря системе динамического балансирования и так же снижает простой машины.
По словам разработчиков, сила робота также будет превосходить силу человека.
Робот находится на ранней стадии разработки, пилотные испытания на складах и производствах Hyundai — главного акционера Boston Dynamics — начнутся в начале 2025 г., а массовое производство запустят через несколько лет. О том, какая AI-модель ляжет в основу системы управления роботом, пока не сообщается.
#news #роботы
https://techcrunch.com/2024/04/17/boston-dynamics-atlas-humanoid-robot-goes-electric/
TechCrunch
Boston Dynamics’ Atlas humanoid robot goes electric
Atlas lies motionless in a prone position atop interlocking gym mats. The only soundtrack is the whirring of an electric motor. It’s not quiet, exactly,
Mentee Robotics создал человекоподобного робота-помощника по дому
Израильский стартап, основанный в 2022 г., представил Menteebot — антропоморфного робота со встроенной генеративной моделью, способного исполнять речевые команды на естественном языке и ориентироваться в пространстве. Высота модели 175 см, масса — 70 кг, скорость — 5,4 км/ч.
Робот позиционируется как помощник по дому, и это необычно для данного рынка, потому что жилище — куда менее структурированная среда по сравнению с фабрикой или складом, и денег у розничного потребителя меньше, чем у корпораций.
Прототип планируют выпустить к началу следующего года.
#news #роботы
https://techcrunch.com/2024/04/17/a-humanoid-robot-is-on-its-way-from-mobileye-founder/
Израильский стартап, основанный в 2022 г., представил Menteebot — антропоморфного робота со встроенной генеративной моделью, способного исполнять речевые команды на естественном языке и ориентироваться в пространстве. Высота модели 175 см, масса — 70 кг, скорость — 5,4 км/ч.
Робот позиционируется как помощник по дому, и это необычно для данного рынка, потому что жилище — куда менее структурированная среда по сравнению с фабрикой или складом, и денег у розничного потребителя меньше, чем у корпораций.
Прототип планируют выпустить к началу следующего года.
#news #роботы
https://techcrunch.com/2024/04/17/a-humanoid-robot-is-on-its-way-from-mobileye-founder/
TechCrunch
A humanoid robot is on its way from Mobileye founder
Mentee Robotics hasn’t been in stealth, exactly. The Israeli firm caught a small wave of press at the tail end of 2022, following Tesla’s initial humanoid
Вы CRISPR открываете или изобретаете?
Стартап из Беркли, Profluent, опубликовал препринт, в котором описана система основанная на LLM. Еще один пример использования ИИ в науке!
Стартап придумал модель для создания новых редакторов генов на основе анализа огромного количества биологических данных, включая микроскопические механизмы, которые ученые уже используют для редактирования ДНК человека. Если еще проще, то созданная LLM на основании уже использованных, природных редакторов ДНК (CAS), выдает новые комбинации редакторов, которые ранее не встречались в природе. Здесь есть сложность…
В CRISPR нет недостатка в естественных редакторах генов, которые они могли бы использовать для борьбы с болезнями и болезнями. Узкое место находится в стоимости проталкивания этих редакторов к доклиническим исследованиям, таким как безопасность, производство и нормативные требования, прежде чем они могут быть использованы для пациентов.
GenAI имеет громадный потенциал, так как быстро улучшается, обучаясь на все больших объемах данных. Если такие технологии, как Profluent, будут продолжать совершенствоваться, это в конечном итоге позволит ученым редактировать гены гораздо более точными способами.
В краткосрочной перспективе, по мнению экспертов, эта технология ничего не изменит. Но в долгосрочной перспективе это может привести к миру, где лекарства и методы лечения быстро персонализируются быстрее, чем доступно сегодня. Как верно указано в посте. Однако, не так быстро)
Profluent предстоит долгий путь клинических испытаний их редакторов синтетических генов. Неясно, могут ли они соответствовать или превосходить эффективность CRISPR. Однако, сам proof of concept показывает, что AI может делать редакторы, способные редактировать геном человека.
Хотя Profluent опенсорсит редактор, сама модель не выложена в общий доступ.
Еще один важный пример AI как «микроскопа 21 века».
https://www.biorxiv.org/content/10.1101/2024.04.22.590591v1
#от_редактора #llm
Стартап из Беркли, Profluent, опубликовал препринт, в котором описана система основанная на LLM. Еще один пример использования ИИ в науке!
Стартап придумал модель для создания новых редакторов генов на основе анализа огромного количества биологических данных, включая микроскопические механизмы, которые ученые уже используют для редактирования ДНК человека. Если еще проще, то созданная LLM на основании уже использованных, природных редакторов ДНК (CAS), выдает новые комбинации редакторов, которые ранее не встречались в природе. Здесь есть сложность…
В CRISPR нет недостатка в естественных редакторах генов, которые они могли бы использовать для борьбы с болезнями и болезнями. Узкое место находится в стоимости проталкивания этих редакторов к доклиническим исследованиям, таким как безопасность, производство и нормативные требования, прежде чем они могут быть использованы для пациентов.
GenAI имеет громадный потенциал, так как быстро улучшается, обучаясь на все больших объемах данных. Если такие технологии, как Profluent, будут продолжать совершенствоваться, это в конечном итоге позволит ученым редактировать гены гораздо более точными способами.
В краткосрочной перспективе, по мнению экспертов, эта технология ничего не изменит. Но в долгосрочной перспективе это может привести к миру, где лекарства и методы лечения быстро персонализируются быстрее, чем доступно сегодня. Как верно указано в посте. Однако, не так быстро)
Profluent предстоит долгий путь клинических испытаний их редакторов синтетических генов. Неясно, могут ли они соответствовать или превосходить эффективность CRISPR. Однако, сам proof of concept показывает, что AI может делать редакторы, способные редактировать геном человека.
Хотя Profluent опенсорсит редактор, сама модель не выложена в общий доступ.
Еще один важный пример AI как «микроскопа 21 века».
https://www.biorxiv.org/content/10.1101/2024.04.22.590591v1
#от_редактора #llm
bioRxiv
Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences
Gene editing has the potential to solve fundamental challenges in agriculture, biotechnology, and human health. CRISPR-based gene editors derived from microbes, while powerful, often show significant functional tradeoffs when ported into non-native environments…
Forwarded from Мир Робототехники
27 и 28 апреля в Москве пройдет очередная конференция по робототехнике и искусственному интеллекту ROS Meetup.
Это возможность для робототехников всех уровней: от новичков до экспертов, посвятить выходные практическому обучению и нетворкингу. Вы получите советы и рекомендации экспертов, сможете поделиться идеями с другими разработчиками.
Доклады охватывают весь спектр тем: от ROS до reinforcement learning и антропоморфных роботов. Инженеры и руководители компаний поделятся реальным опытом использования ROS в исследовательских и коммерческих проектах.
В этот раз технические доклады будут разбавлены большим количеством тематических дискуссий и нетворкинга.
Вас ждет общение на самые разные темы, включая антропоморфных роботов, reinforcement learning, LLM — large language model, deep learning, беспилотные автомобили и мобильные роботы, манипуляторы и алгоритмы в манипуляции, в том числе MoveIt, ROS-пакеты и другие.
🔹Локация: г. Москва, Кутузовский проспект 32к1
🔹Подробная программа и форма регистрации по ссылке: https://habr.com/ru/companies/sberbank/news/805535/
Это возможность для робототехников всех уровней: от новичков до экспертов, посвятить выходные практическому обучению и нетворкингу. Вы получите советы и рекомендации экспертов, сможете поделиться идеями с другими разработчиками.
Доклады охватывают весь спектр тем: от ROS до reinforcement learning и антропоморфных роботов. Инженеры и руководители компаний поделятся реальным опытом использования ROS в исследовательских и коммерческих проектах.
В этот раз технические доклады будут разбавлены большим количеством тематических дискуссий и нетворкинга.
Вас ждет общение на самые разные темы, включая антропоморфных роботов, reinforcement learning, LLM — large language model, deep learning, беспилотные автомобили и мобильные роботы, манипуляторы и алгоритмы в манипуляции, в том числе MoveIt, ROS-пакеты и другие.
🔹Локация: г. Москва, Кутузовский проспект 32к1
🔹Подробная программа и форма регистрации по ссылке: https://habr.com/ru/companies/sberbank/news/805535/
Black Shark представила «умное» кольцо для мониторинга здоровья
Принадлежащая Xiaomi Black Shark анонсировала «Властелина колец» (Lord of the Rings), собирающего основные жизненные показатели. Устройство создано в концепции «ношение без беспокойства», то есть главная цель — доставлять пользователю как можно меньше неудобств при использовании. Для этого разработчики сделали толщину кольца всего 2,2 мм (у представленных на рынке моделей — 2,6 мм и более), а заряд аккумулятора якобы держится до 180 дней, но пока неясно, касается ли это режима ожидания или какого-то другого. Модели-конкуренты без подзарядки могут продержаться в рабочем режиме около недели. Заряжать «Властелина колец» предполагается при помощи кейса, как наушники. Сроки вывода на рынок и цена пока не объявлены.
#news #электроника
https://www.ithome.com/0/761/588.htm
Принадлежащая Xiaomi Black Shark анонсировала «Властелина колец» (Lord of the Rings), собирающего основные жизненные показатели. Устройство создано в концепции «ношение без беспокойства», то есть главная цель — доставлять пользователю как можно меньше неудобств при использовании. Для этого разработчики сделали толщину кольца всего 2,2 мм (у представленных на рынке моделей — 2,6 мм и более), а заряд аккумулятора якобы держится до 180 дней, но пока неясно, касается ли это режима ожидания или какого-то другого. Модели-конкуренты без подзарядки могут продержаться в рабочем режиме около недели. Заряжать «Властелина колец» предполагается при помощи кейса, как наушники. Сроки вывода на рынок и цена пока не объявлены.
#news #электроника
https://www.ithome.com/0/761/588.htm
Ithome
黑鲨“魔戒”智能戒指厚度 2.2mm,续航至高 180 天 - IT之家
黑鲨官方日前宣布将推出一款名为“黑鲨魔戒”的智能戒指新品,近日官方对这款智能戒指进行了预热,号称“续航 180 天”、“厚度 2.2 mm”。
Бигтехи вошли в Совет по AI Министерства внутренней безопасности США
Министерство внутренней безопасности в пятницу заявило, что создало совет по безопасности искусственного интеллекта, чтобы разобраться в том, как ответственно использовать AI. В состав совета вошли Сэм Альтман, генеральный директор OpenAI; Дженсен Хуан, генеральный директор Nvidia; Сатья Наделла, генеральный директор Microsoft; и Сундар Пичаи, генеральный директор материнской компании Google Alphabet. Государственные чиновники, лидеры в области гражданских прав и ученые также были включены в совет.
Совет разработает рекомендации для операторов энергосистем и трубопроводных сетей, поставщиков интернет-услуг, транспортных компаний и других поставщиков инфраструктуры о том, как правильно использовать AI, говорится в пресс-релизе. Он также разработает рекомендации о том, как предотвратить и подготовиться к сбоям, которые могут быть вызваны технологией.
#от_редактора #бигтехи
Министерство внутренней безопасности в пятницу заявило, что создало совет по безопасности искусственного интеллекта, чтобы разобраться в том, как ответственно использовать AI. В состав совета вошли Сэм Альтман, генеральный директор OpenAI; Дженсен Хуан, генеральный директор Nvidia; Сатья Наделла, генеральный директор Microsoft; и Сундар Пичаи, генеральный директор материнской компании Google Alphabet. Государственные чиновники, лидеры в области гражданских прав и ученые также были включены в совет.
Совет разработает рекомендации для операторов энергосистем и трубопроводных сетей, поставщиков интернет-услуг, транспортных компаний и других поставщиков инфраструктуры о том, как правильно использовать AI, говорится в пресс-релизе. Он также разработает рекомендации о том, как предотвратить и подготовиться к сбоям, которые могут быть вызваны технологией.
#от_редактора #бигтехи