Полезное исследование от бывших коллег из Толоки: внятно потестировали наиболее популярные LLM на вопросы из области естественных наук. Но вопросы не то чтоб со звездочкой, но на понимание, а не знание — причем противоречащее бытовым представлениям.
Вот хороший пример по физике:
“В пасмурный день за окном машины закреплен термометр. Машина начинает движение и быстро набирает скорость. Через несколько минут смотрим на термометр за окном. В какую сторону изменились его показания?”
И, что не удивительно, оказалось, что по иммунобиологии, физике, биоинформатике и пр. ответы даже лучших моделей выглядят так себе. Что логично: язык не содержит в себе понимания физики мира, а из текстов можно скорее извлечь идею “высунулся из окна и свежий ветер охладил…” Так что здесь к созданию помощников по обучению придется подходить осторожно.
https://toloka.ai/blog/are-llms-good-at-natural-science/
Вот хороший пример по физике:
“В пасмурный день за окном машины закреплен термометр. Машина начинает движение и быстро набирает скорость. Через несколько минут смотрим на термометр за окном. В какую сторону изменились его показания?”
И, что не удивительно, оказалось, что по иммунобиологии, физике, биоинформатике и пр. ответы даже лучших моделей выглядят так себе. Что логично: язык не содержит в себе понимания физики мира, а из текстов можно скорее извлечь идею “высунулся из окна и свежий ветер охладил…” Так что здесь к созданию помощников по обучению придется подходить осторожно.
https://toloka.ai/blog/are-llms-good-at-natural-science/
toloka.ai
Are LLMs good at natural sciences? A complex benchmark across 10 subject areas
As the quote from MixtralChat shows, large language models (LLMs) readily assert the importance of mastering STEM subjects (science, technology, engineering, and mathematics). But how good are they at these subjects themselves? Can they truly help students…
Написанный очень простым языком обзор состояния нейроинтерфейсов отчетливо дает понять, со ссылкой на многие годы занимающихся этой темой исследователей, что там идет медленный, постепенный прогресс много лет. Какие бы заявления ни делал Маск, прорывов нет и не предвидится.
Но есть разумный совет: чтобы видеть имеющийся прогресс, надо поумерить собственные ожидания. Мы далеки от единения с цифровыми сущностями, но все большее число больных улучшают свое качество жизни благодаря разным инвазивным и не очень интерфейсам.
We’re still learning how it works, why it works, when it works, when it doesn’t work, what kind of support it needs, and how many places are going to be able to deliver it.
Радует, что в этой области работают не только буйные — но и в то же время легко теряющие интерес и финансирование —стартапы, но и традиционные исследовательские центры, которые постоянно получают новые и важные данные о мозге.
Как часто бывает: надо подождать. https://www.digitaltrends.com/computing/tech-for-change-brain-computer-interface/
Но есть разумный совет: чтобы видеть имеющийся прогресс, надо поумерить собственные ожидания. Мы далеки от единения с цифровыми сущностями, но все большее число больных улучшают свое качество жизни благодаря разным инвазивным и не очень интерфейсам.
We’re still learning how it works, why it works, when it works, when it doesn’t work, what kind of support it needs, and how many places are going to be able to deliver it.
Радует, что в этой области работают не только буйные — но и в то же время легко теряющие интерес и финансирование —стартапы, но и традиционные исследовательские центры, которые постоянно получают новые и важные данные о мозге.
Как часто бывает: надо подождать. https://www.digitaltrends.com/computing/tech-for-change-brain-computer-interface/
Digital Trends
The brain-computer interface revolution is just getting started
Brain-Computer Interfaces fascinate the sci-fi and medical communities in equal measure. Here's how close the transformative technology is to everyday use.
Forwarded from IT|ИТ
Частные расходы на строительство дата-центров выросли почти до $30 млрд/год.
Этот показатель более чем вдвое превышает траты за 2022 год.
Дата-центры стали главным сегментом для строительства: они опережают отели, торговые и развлекательные центры.
США лидируют по объему инвестиций для дата-центров. При этом глобальные расходы на них составят $250 млрд.
👁️
Этот показатель более чем вдвое превышает траты за 2022 год.
Дата-центры стали главным сегментом для строительства: они опережают отели, торговые и развлекательные центры.
США лидируют по объему инвестиций для дата-центров. При этом глобальные расходы на них составят $250 млрд.
👁️
Термины «цифровизация» и «цифровая экономика» возникли еще в прошлом веке, в начале 10-х нынешнего века заговорили о «цифровой трансформации». И продолжают по всему миру говорить, принимать программы, обучать чиновников и руководителей предприятий. Потому что разговоры разговорами, а на деле бизнес (кроме изначально ориентированного на цифровые продукты и инфраструктуру) осторожен и консервативен. Кстати, это демонстрирует график из предыдущего поста: экспоненциальный рост расходов на строение датацентров свидетельствует, что потребность в них все еще на ранних стадиях, в развитой цифровой экономике рост бы уже выполаживался: в реальном мире экспоненты — это чаще всего начальные участки логистических кривых и им подобных.
Это я все к тому, что и с ИИ в бизнесе будет примерно так же. Реальные перемены происходят со сменой поколений управленцев, и пока предприятиями управляют люди, этот масштаб времени вряд ли изменится. Так что в статье по ссылки все ожидаемо и закономерно: ИИ-зация рабочих процессов и мест на практике идет неторопливо. На конец прошлого года в четверти организаций ИИ вообще никак не использовался, и лишь в 8% — использовался системно по всему предприятию (подозреваю, бОльшая часть таких организаций — технологические компании). Полезный reality check и для стартапов, весьма фантазийно оценивающих размеры своих рынков, и для нервных алармистов.
https://localnewsmatters.org/2024/11/17/why-the-ai-ification-of-workplaces-may-move-slower-than-we-think-despite-corporate-hype/
Это я все к тому, что и с ИИ в бизнесе будет примерно так же. Реальные перемены происходят со сменой поколений управленцев, и пока предприятиями управляют люди, этот масштаб времени вряд ли изменится. Так что в статье по ссылки все ожидаемо и закономерно: ИИ-зация рабочих процессов и мест на практике идет неторопливо. На конец прошлого года в четверти организаций ИИ вообще никак не использовался, и лишь в 8% — использовался системно по всему предприятию (подозреваю, бОльшая часть таких организаций — технологические компании). Полезный reality check и для стартапов, весьма фантазийно оценивающих размеры своих рынков, и для нервных алармистов.
https://localnewsmatters.org/2024/11/17/why-the-ai-ification-of-workplaces-may-move-slower-than-we-think-despite-corporate-hype/
Local News Matters
Why the AI-ification of workplaces may move slower than we think, despite corporate hype - Local News Matters
For the last 1.5 years since ChatGPT launched, workers and business leaders have been singing two different tunes about the advent of generative
Появляются интересные инженерные детали китайской миссии, которая будет запущена в 2028 чтобы доставить на Землю полкило марсианского грунта. Весь дизайн миссии подчинен минимизации расхода топлива. Поэтому приходится применять нетривиальные и ранее не испытанные методы перевалки ценнейшего груза. Контейнер с собранным грунтом будет выведен на орбиту небольшим разгонным блоком, но стыковки с орбитальным модулем не предусмотрено: ловушка на модуле должна будет поймать контейнер, загрузить его в возвращаемый блок, который уже доставит контейнер на Землю.
Выглядит как чудеса акробатики на околомарсианской орбите — но китайцам акробатика близка. Очень интересно, как на практике все это сработает.
https://www.scmp.com/news/china/science/article/3286721/how-chinese-spacecraft-will-catch-mars-rock-samples-journey-earth
Выглядит как чудеса акробатики на околомарсианской орбите — но китайцам акробатика близка. Очень интересно, как на практике все это сработает.
https://www.scmp.com/news/china/science/article/3286721/how-chinese-spacecraft-will-catch-mars-rock-samples-journey-earth
South China Morning Post
How a Chinese spacecraft will catch Mars rock samples for journey to Earth
A lightweight device on an orbiting module will capture a container about the size of a coffee can.
Вполне ожидаемо: появилась компания, всерьез сфокусированная на AI-оптимизиции. Собственно, с момента появления коммерческих интересов в интернете, возник и бизнес их обслуживания: как манипулировать трафиком на ресурсы клиента с разных информационных систем в интересах клиента. Но пока системы работали алгоритмически (начиная с Page rank), решения оптимизаторов были тоже алгоритмичными: “ах, он ссылки учитывает — наплодим ссылочные фермы” и т.п.
С ИИ-поиском не так все просто, поэтому неудивительно, что за дело взялась компания, изначально занимавшаяся управлением репутацией в сети, а не реинжинирингом поисковых алгоритмов: approach isn’t about hacking AI systems but rather systematically shaping the web content that feeds these systems.
Изучение изменений ответов ИИ на вопросы — вполне в духе хорошей аналитики: ответы на один и тот вопрос разнятся для разных пользователей, поэтому давайте эмулировать множество пользователей и смотреть, как изменения в интернете влияют на характеристики всей совокупности ответов. Учитывается два канала воздействия на ИИ: изменения в контенте, который используется для тренировки новых версий моделей, и изменения на страницах со свежей информацией, к которым модель обращается при подготовке ответа.
Интересно, получится ли такая же большая индустрия, как традиционное SEO. Первые стартапы уже есть.
https://crazystupidtech.com/archive/can-we-manipulate-ai-as-much-as-it-manipulates-us/
С ИИ-поиском не так все просто, поэтому неудивительно, что за дело взялась компания, изначально занимавшаяся управлением репутацией в сети, а не реинжинирингом поисковых алгоритмов: approach isn’t about hacking AI systems but rather systematically shaping the web content that feeds these systems.
Изучение изменений ответов ИИ на вопросы — вполне в духе хорошей аналитики: ответы на один и тот вопрос разнятся для разных пользователей, поэтому давайте эмулировать множество пользователей и смотреть, как изменения в интернете влияют на характеристики всей совокупности ответов. Учитывается два канала воздействия на ИИ: изменения в контенте, который используется для тренировки новых версий моделей, и изменения на страницах со свежей информацией, к которым модель обращается при подготовке ответа.
Интересно, получится ли такая же большая индустрия, как традиционное SEO. Первые стартапы уже есть.
https://crazystupidtech.com/archive/can-we-manipulate-ai-as-much-as-it-manipulates-us/
Еще 4 года назад тогда еще не запрещенная Meta объявила о проекте ARIA: исследованию будущего AR и VR очков. Больших откровений там не случилось, но анонс прототипа Orion вдохнул немного новой жизни. Теперь публике представлен Aria Research Kit: первые кейсы использования и призыв к сообществу делиться своими наработками.
Процитированные в тексте проекты трудно назвать новаторскими:
1. Картирование окружающего мира с помощью данных, собираемых носителем очков
2. Изучение звукового окружения пользователя, чтобы в дальнейшем помочь людям с потерей слуха не только лучше слышать, но и понимать пространственное расположение источника звука.
3. Улучшенный ассистент водителя, учитывающий события вне его текущего поля зрения
4. Улучшенная навигация в помещениях для пользователей с проблемами зрения
В новом раунде исследований компания предлагает раздать прототипы своих очков исследователям работающим над broad range of research topics, including embodied AI, contextualized AI, human-computer interaction (HCI), robotics, and more.
И ждет, конечно, их отчетов.
https://www.meta.com/en-gb/blog/quest/project-aria-research-kit-case-studies/
Процитированные в тексте проекты трудно назвать новаторскими:
1. Картирование окружающего мира с помощью данных, собираемых носителем очков
2. Изучение звукового окружения пользователя, чтобы в дальнейшем помочь людям с потерей слуха не только лучше слышать, но и понимать пространственное расположение источника звука.
3. Улучшенный ассистент водителя, учитывающий события вне его текущего поля зрения
4. Улучшенная навигация в помещениях для пользователей с проблемами зрения
В новом раунде исследований компания предлагает раздать прототипы своих очков исследователям работающим над broad range of research topics, including embodied AI, contextualized AI, human-computer interaction (HCI), robotics, and more.
И ждет, конечно, их отчетов.
https://www.meta.com/en-gb/blog/quest/project-aria-research-kit-case-studies/
Meta
Project Aria Research Kit: Case Studies + a Call for Applications
Today, we’re sharing some case studies of exciting work undertaken with Project Aria and inviting members of the research community to apply for the Aria Research Kit (ARK).
Foundation models стал популярным термином, все больше отраслей стремятся иметь свои модели, претендующие на фундаментальность. Логично, что появилась Evo, a multimodal artificial intelligence model that can interpret and generate genomic sequences at a vast scale… Evo represents a major advancement in our capacity to comprehend and engineer biology across multiple modalities and multiple scales of complexity
Впрочем, пока, хотя genomic foundation model enables prediction and generation tasks from the molecular to the genome scale — речь о геномах микробов. Насчет существ побольше, включая растения, животных и нас, пока неясно — удастся ли Evo усовершенствовать для работы с геномами такого размера. Но даже и с бактериями перед CRISPR открываются совсем новые перспективы
https://www.science.org/doi/10.1126/science.ado9336
Совсем популярный, но толковый пересказ:
https://singularityhub.com/2024/11/18/a-chatgpt-like-ai-can-now-design-entirely-new-genomes-from-scratch/
Впрочем, пока, хотя genomic foundation model enables prediction and generation tasks from the molecular to the genome scale — речь о геномах микробов. Насчет существ побольше, включая растения, животных и нас, пока неясно — удастся ли Evo усовершенствовать для работы с геномами такого размера. Но даже и с бактериями перед CRISPR открываются совсем новые перспективы
https://www.science.org/doi/10.1126/science.ado9336
Совсем популярный, но толковый пересказ:
https://singularityhub.com/2024/11/18/a-chatgpt-like-ai-can-now-design-entirely-new-genomes-from-scratch/
Science
Sequence modeling and design from molecular to genome scale with Evo
The genome is a sequence that encodes the DNA, RNA, and proteins that orchestrate an organism’s function. We present Evo, a long-context genomic foundation model with a frontier architecture trained on millions of prokaryotic and phage genomes, and ...
Сегодняшний шестой испытательный полет Старшипа не принес сенсаций, а местами оказался даже менее зрелищным, потому что бустер опустили в залив, а не в «руки» Мехазиллы. Как и прежние полеты, этот наверняка добавил кучу полезных данных, в том числе и о неполадках при посадке разгонного блока — но это невидимый фронт. Поэтому ссылка будет не на захватывающее видео, а на статью с впечатляющими цифрами про акустическое воздействие запусков Старшипа на окружающую среду. Они в буквальном смысле слова оглушающие.
even 10 kilometers away, it was as loud as a rock concert. At 20 kilometers, it rivaled the noise of a table saw or snow blower. At 30–35 kilometers, the sound was still as loud as a vacuum cleaner or hair dryer.
Ох и интересная задача будет искать места под космодромы будущего с высокой частотой стартов…
https://phys.org/news/2024-11-roar-spacex-starship-impact-communities.html
even 10 kilometers away, it was as loud as a rock concert. At 20 kilometers, it rivaled the noise of a table saw or snow blower. At 30–35 kilometers, the sound was still as loud as a vacuum cleaner or hair dryer.
Ох и интересная задача будет искать места под космодромы будущего с высокой частотой стартов…
https://phys.org/news/2024-11-roar-spacex-starship-impact-communities.html
phys.org
Researchers study the roar of SpaceX's Starship and its impact on communities and the environment
What does it feel to like to witness a rocket launch—not just any rocket, but SpaceX's Starship, the largest and most powerful rocket in the world?
Свежий лонгрид про Майкрософт: как 50+ лет не смогли состарить компанию, и все предсказания о ее неизбежном сходе со с цены оказались ложными. И очень интересно описана роль Наделлы в траектории компании.
С наступлением мобильной эры разговоры про неадекватность Майкрософт усилились - и на то были причины: неудачи с Windows Mobile были уж больно наглядными. Казалось, что компания, как часто делают гиганты в тяжелой ситуации, вцепилась в своих дойных коров — Windows и Office и просто оттягивает неизбежное. Потом пришли времена ML, и опять казалось, что компания уже не в силах адаптироваться к новациям, трансформирующим цифровой мир вокруг.
А потом случилось странное. Десять лет назад, в 2014, сменился глава компании. Обычно, в ситуации, когда компания начинает немного протухать, ищут внешнего человека, чтоб встряхнул команду, принес свежие идеи и видение, заменил дряхлеющих менеджеров.
Но тут руководство перешло к человеку изнутри компании, который 22 года неторопливо перемещался вверх по карьерной лестнице и никак мне отличался радикализмом. Но при этом одно из знаковых его решений было вложить в 2019 один млрд долларов в OpenAI, известный в довольно тогда узких кругах.
А еще его очень любили и любят сотрудники — что нечасто в очень пестрых и требовательных командах техногигантов.
Почитайте — вроде бы корпоративная история, но история очень современная, показавшая как за 10 лет огромная корпорация сумела пересобрать себя, снова стать лидером технологической гонки и красиво нарастить капитализацию. Очень полезное — и приятное само по себе — чтение, из которого можно много уроков извлечь. Среди них важный: не торопитесь хоронить старичков. Времена изменились, и продолжительность жизни растет не только среди людей, и не только люди имеют серьезные планы на бессмертие:)
https://www.wired.com/story/at-age-50-microsoft-is-an-ai-giant-an-open-source-lover-and-bad-as-it-ever-was/
С наступлением мобильной эры разговоры про неадекватность Майкрософт усилились - и на то были причины: неудачи с Windows Mobile были уж больно наглядными. Казалось, что компания, как часто делают гиганты в тяжелой ситуации, вцепилась в своих дойных коров — Windows и Office и просто оттягивает неизбежное. Потом пришли времена ML, и опять казалось, что компания уже не в силах адаптироваться к новациям, трансформирующим цифровой мир вокруг.
А потом случилось странное. Десять лет назад, в 2014, сменился глава компании. Обычно, в ситуации, когда компания начинает немного протухать, ищут внешнего человека, чтоб встряхнул команду, принес свежие идеи и видение, заменил дряхлеющих менеджеров.
Но тут руководство перешло к человеку изнутри компании, который 22 года неторопливо перемещался вверх по карьерной лестнице и никак мне отличался радикализмом. Но при этом одно из знаковых его решений было вложить в 2019 один млрд долларов в OpenAI, известный в довольно тогда узких кругах.
А еще его очень любили и любят сотрудники — что нечасто в очень пестрых и требовательных командах техногигантов.
Почитайте — вроде бы корпоративная история, но история очень современная, показавшая как за 10 лет огромная корпорация сумела пересобрать себя, снова стать лидером технологической гонки и красиво нарастить капитализацию. Очень полезное — и приятное само по себе — чтение, из которого можно много уроков извлечь. Среди них важный: не торопитесь хоронить старичков. Времена изменились, и продолжительность жизни растет не только среди людей, и не только люди имеют серьезные планы на бессмертие:)
https://www.wired.com/story/at-age-50-microsoft-is-an-ai-giant-an-open-source-lover-and-bad-as-it-ever-was/
WIRED
Microsoft at 50: An AI Giant. A Kinder Culture. And Still Hellbent on Domination
When Satya Nadella took over as CEO, the company was lumbering and uncool. He cleaned up a toxic culture, crafted the deal of the decade, and put Microsoft back on top.
Гибкие дисплеи как-то перестали удивлять — но и применений особо не нашли. LG предлагает следующий уровень: гибкий дисплей, который еще и эластичен, неплохо растягивается. А это значит, что он уже напоминает материалы, используемые в одежде: у дизайнеров появляются интересные перспективы;)
Да, это пока прототип, и разрешение, которого бы постеснялся даже древний дисплей, — но ограничения часто лишь стимулируют фантазию;)
https://www.core77.com/posts/134351
Да, это пока прототип, и разрешение, которого бы постеснялся даже древний дисплей, — но ограничения часто лишь стимулируют фантазию;)
https://www.core77.com/posts/134351
Core77
LG Develops a Stretchable Display
This month LG showed off a prototype of their stretchable display, which can be expanded up to 50%, stretching from 12" to 18". The micro-LED display has a 100ppI resolution and displays RGB. The company was able to achieve the feat by using silicon substrate…
Forwarded from Малоизвестное интересное
Обойдя Японию и Германию, Китай теперь №3.
А США покинули десятку лидеров.
Об индустриальной мощи страны имеет смысл судить не по её парку роботов-андроидов, а по уровню автоматизации её промышленности - количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников.
Вот три примера.
США
Недавно Илон Маск развлекал журналистов шумной презентацией, где роботы-андроиды готовили коктейли и разносили закуски. Это конечно прикольно, но не более того. А тем временем, согласно новому годовому отчету Международной федерации робототехники, США покинули десятку стран мировых лидеров по количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников. Как видно из приведенных диаграмм, США уже который год плавно теряют позиции среди ТОР 25 стран-лидеров, пропустив вперед Швейцарию и Словению и имея шансы в этом году скатиться ниже Тайваня и Нидерландов.
Китай
Поставив роботизацию промышленности среди ключевых приоритетов, Китай, с настойчивость прихватившего противника бульдога, из года в год поднимается в рейтинге все выше. И теперь, обойдя Японию и Германию, Китай ставит цель достать №2 Сингапур. Что сложно, ибо тот на «целый круг» впереди, опережая почти в 2 раза. С лидером – Юж.Корея будет еще сложнее, т.к. он опережает аж «на два круга» (примерно в 3 раза). Но Китай это не смущает. И по их планам 1-е место в мире Китай займет уже в 2030.
Россия
Тут могу лишь сказать, что при показателях Китая и США 479 и 295 эксплуатируемых промышленных роботов на 10 тыс. сотрудников и среднем по миру показателе в 162 робота, в России сейчас этот показатель равен 11 (т.е. отставание от США в 27 раз, а от Китая в 44 раза. Планирующий контролировать более 50% рынка робототехники в России "Росатом" обещает к 2030 г. увеличить число роботов в 9,5 раз (с 10 тыс до 95 тыс), что в 2 раза меньше последнего (№25) в сегодняшнем списке стран-лидеров. А в 2030, когда этот список планирует возглавить Китай, цифры лидеров должны будут вырасти, минимум, еще в 4 раза.
#роботы
А США покинули десятку лидеров.
Об индустриальной мощи страны имеет смысл судить не по её парку роботов-андроидов, а по уровню автоматизации её промышленности - количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников.
Вот три примера.
США
Недавно Илон Маск развлекал журналистов шумной презентацией, где роботы-андроиды готовили коктейли и разносили закуски. Это конечно прикольно, но не более того. А тем временем, согласно новому годовому отчету Международной федерации робототехники, США покинули десятку стран мировых лидеров по количеству эксплуатируемых промышленных роботов на 10 тыс. сотрудников. Как видно из приведенных диаграмм, США уже который год плавно теряют позиции среди ТОР 25 стран-лидеров, пропустив вперед Швейцарию и Словению и имея шансы в этом году скатиться ниже Тайваня и Нидерландов.
Китай
Поставив роботизацию промышленности среди ключевых приоритетов, Китай, с настойчивость прихватившего противника бульдога, из года в год поднимается в рейтинге все выше. И теперь, обойдя Японию и Германию, Китай ставит цель достать №2 Сингапур. Что сложно, ибо тот на «целый круг» впереди, опережая почти в 2 раза. С лидером – Юж.Корея будет еще сложнее, т.к. он опережает аж «на два круга» (примерно в 3 раза). Но Китай это не смущает. И по их планам 1-е место в мире Китай займет уже в 2030.
Россия
Тут могу лишь сказать, что при показателях Китая и США 479 и 295 эксплуатируемых промышленных роботов на 10 тыс. сотрудников и среднем по миру показателе в 162 робота, в России сейчас этот показатель равен 11 (т.е. отставание от США в 27 раз, а от Китая в 44 раза. Планирующий контролировать более 50% рынка робототехники в России "Росатом" обещает к 2030 г. увеличить число роботов в 9,5 раз (с 10 тыс до 95 тыс), что в 2 раза меньше последнего (№25) в сегодняшнем списке стран-лидеров. А в 2030, когда этот список планирует возглавить Китай, цифры лидеров должны будут вырасти, минимум, еще в 4 раза.
#роботы
Поразительно, как не нравятся людям зеркала:) Вот вышла очередная тревожная работа команды гуманитарных исследователей из Германии и Великобритании.
Проанализировав сайты, созданные разными популярными генеративными моделями (ChatGPT, Claude 3.5, Gemini 1.5 Flash), они обнаружили, что дизайн содержит различные манипулятивные элементы, побуждающие пользователя к тем или иным действиям.
Вроде нет вопросов, откуда взялся такой стиль: модель училась на вполне человеческих творениях, которые все это добро содержат сплошь и рядом, и там элементы манипуляции были заложены в ТЗ заказчиками или отвечали собственному представлению вебдизайнеров о прекрасном.
Но исследователи волнуются, что модели демонстрируют не самое лучшее и бескорыстное поведение и требуют, как обычно, дополнительного регулирования и ограничений для моделей.
О каких-то ограничениях для людей вопрос даже не ставится. В итоге призыв выглядит как неуклюжая попытка сохранить коммуникационные функции за людьми: только белковым дано право манипулировать себе подобными:)
https://arxiv.org/pdf/2411.03108
Проанализировав сайты, созданные разными популярными генеративными моделями (ChatGPT, Claude 3.5, Gemini 1.5 Flash), они обнаружили, что дизайн содержит различные манипулятивные элементы, побуждающие пользователя к тем или иным действиям.
Вроде нет вопросов, откуда взялся такой стиль: модель училась на вполне человеческих творениях, которые все это добро содержат сплошь и рядом, и там элементы манипуляции были заложены в ТЗ заказчиками или отвечали собственному представлению вебдизайнеров о прекрасном.
Но исследователи волнуются, что модели демонстрируют не самое лучшее и бескорыстное поведение и требуют, как обычно, дополнительного регулирования и ограничений для моделей.
О каких-то ограничениях для людей вопрос даже не ставится. В итоге призыв выглядит как неуклюжая попытка сохранить коммуникационные функции за людьми: только белковым дано право манипулировать себе подобными:)
https://arxiv.org/pdf/2411.03108
Добрый старый Zoom решил освежить бренд: после окончания пандемийного бума бороться с конкуренцией техногигантов все сложнее. Да и слово Video в названии компании не очень уже соблазняет в эпоху всеобщего ИИ.
Так что предлагается ознакомиться с Zoom 2.0: AI-first company delivering modern, hybrid work solutions that enable you to collaborate seamlessly.
Прямо сейчас трансформация выглядит довольно скромно, следуя привычной уже модели ИИ-помощников: By summarizing meeting tasks, drafting email responses, and preparing you for meetings, AI Companion is your digital assistant that reduces your overall workload.
А в будущем обещают полноценного цифрового двойника — главная фишка которого в том, что с его помощью можно будет перейти на 4-дневную рабочую неделю. Забавно, что сейчас такие заявления уже не возбуждают, и даже хочется заботливо спросить: “Ребята, у вас точно все норм?” Обычно заявления типа “we’re still just as committed to delivering happiness as we were in 2011” (2011 — год основания компании) делаются не от хорошей жизни.
А продукт ведь вполне крутой.
https://www.zoom.com/en/blog/introducing-zoom-communications-inc/
Так что предлагается ознакомиться с Zoom 2.0: AI-first company delivering modern, hybrid work solutions that enable you to collaborate seamlessly.
Прямо сейчас трансформация выглядит довольно скромно, следуя привычной уже модели ИИ-помощников: By summarizing meeting tasks, drafting email responses, and preparing you for meetings, AI Companion is your digital assistant that reduces your overall workload.
А в будущем обещают полноценного цифрового двойника — главная фишка которого в том, что с его помощью можно будет перейти на 4-дневную рабочую неделю. Забавно, что сейчас такие заявления уже не возбуждают, и даже хочется заботливо спросить: “Ребята, у вас точно все норм?” Обычно заявления типа “we’re still just as committed to delivering happiness as we were in 2011” (2011 — год основания компании) делаются не от хорошей жизни.
А продукт ведь вполне крутой.
https://www.zoom.com/en/blog/introducing-zoom-communications-inc/
А вот Nvidia продолжает демонстрировать, что компания не только про чипы, но и про собственные модели, иллюстрирующие красоту генеративного ИИ и крутость продуктов Nvidia — full version uses 2.5 billion parameters and was trained on a bank of Nviidia DGX systems packing 32 H100 Tensor Core GPUs 🙂
Модель по имени Fugatto (от Foundational Generative Audio Transformer Opus 1) описывается как a Swiss Army knife for sound, а сравнение ее с другими моделями звучит немножко токсично: some AI models can compose a song or modify a voice, none have the dexterity of the new offering 🙂
Музыкантам предлагается использовать новый инструмент на разных стадиях процесса — от прототипирования до улучшения качества имеющихся треков. Модель умеет создавать неожиданные эффекты: For instance, Fugatto can make a trumpet bark or a saxophone meow. Whatever users can describe, the model can create. Черрипики в приложенном треке звучат впечатляюще.
Осталось дождаться реакции и без того в последнее время нервных музыкантов:)
https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/
Модель по имени Fugatto (от Foundational Generative Audio Transformer Opus 1) описывается как a Swiss Army knife for sound, а сравнение ее с другими моделями звучит немножко токсично: some AI models can compose a song or modify a voice, none have the dexterity of the new offering 🙂
Музыкантам предлагается использовать новый инструмент на разных стадиях процесса — от прототипирования до улучшения качества имеющихся треков. Модель умеет создавать неожиданные эффекты: For instance, Fugatto can make a trumpet bark or a saxophone meow. Whatever users can describe, the model can create. Черрипики в приложенном треке звучат впечатляюще.
Осталось дождаться реакции и без того в последнее время нервных музыкантов:)
https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/
NVIDIA Blog
Now Hear This: World’s Most Flexible Sound Machine Debuts
Fugatto generates or transforms any mix of music, voices and sounds described with prompts using any combination of text and audio files.
Ну наконец-то кто-то вслух высказался на тему бесконечных пузомерок из мира ИИ-моделей, называемых умным словом benchmarks, которые не только маркетологи в хвост и в гриву используют, но и более техничные ребята начали воспринимать всерьез — ну потому что как жить без пузомерки? Ленты новостей и каналы про ИИ завалены ежедневными сводками с полей разных арен и бенчмарков; мне вспоминаются времена, когда в еще некрупном Рунете было принято по утрам изучать счетчик Рамблера и делать из этого глубокомысленные выводы. Технологии изменились, людская (а разработчики тоже люди) психология — нет.
Так вот, группа исследователей решила разобраться с тем, что these benchmarks are poorly designed, the results hard to replicate, and the metrics they use are frequently arbitrary. Это становится уже серьезной проблемой, потому что за бенчмарки схватились и законодатели, которым же надо порегулировать на якобы объективной основе.
Авторы работы подтвердили и наличие, и серьезность проблемы и, как положено, предложили свои способы решения. Интересно, что из этого возьмет на вооружение сообщество. Есть у меня некий скепсис…
https://www.technologyreview.com/2024/11/26/1107346/the-way-we-measure-progress-in-ai-is-terrible/
Оригинал работы - https://arxiv.org/abs/2411.12990
Так вот, группа исследователей решила разобраться с тем, что these benchmarks are poorly designed, the results hard to replicate, and the metrics they use are frequently arbitrary. Это становится уже серьезной проблемой, потому что за бенчмарки схватились и законодатели, которым же надо порегулировать на якобы объективной основе.
Авторы работы подтвердили и наличие, и серьезность проблемы и, как положено, предложили свои способы решения. Интересно, что из этого возьмет на вооружение сообщество. Есть у меня некий скепсис…
https://www.technologyreview.com/2024/11/26/1107346/the-way-we-measure-progress-in-ai-is-terrible/
Оригинал работы - https://arxiv.org/abs/2411.12990
MIT Technology Review
The way we measure progress in AI is terrible
Many of the most popular benchmarks for AI models are outdated or poorly designed.
Название статьи обидное для Apple, но фактически точное: Xiaomi сумел сделать то, чего ждали от Apple, но так и не дождались.
Китайский производитель гаджетов весной этого года представил свой первый электромобиль, который сразу стал хитом: за первые сутки было собрано 90 000 заказов на SU7. Планы продаж до конца года компания подняла до 130 000 штук.
Про технические характеристики можно почитать в статье или на автосайтах, но о многом говорит тот факт, что CEO Ford Джим Фарли, предположительно неплохо разбирающийся в автомобилях и имеющий возможности выбирать, на чем ему ездить, наплевал на корпоративный патриотизм и ездит как раз на SU7 и не устает им восхищаться.
Достойны упоминания еще два факта: операционка автомашины прекрасно работает с iOS и Android, превратив автомобиль в идеально совместимый с устройствами водителя и пассажира гаджет. А сборку компания не аутсорсит (как бывает со стартапами), а построила собственный полномасштабный автозавод.
Тем временем ходят слухи, что готовится выпуск еще двух моделей. Автор статьи иронично отмечает, что наконец-то фанаты получили свой iCar, вот только прибыл он из Китая
https://www.wired.com/story/phone-maker-xiaomi-made-the-car-that-apple-couldnt/
Китайский производитель гаджетов весной этого года представил свой первый электромобиль, который сразу стал хитом: за первые сутки было собрано 90 000 заказов на SU7. Планы продаж до конца года компания подняла до 130 000 штук.
Про технические характеристики можно почитать в статье или на автосайтах, но о многом говорит тот факт, что CEO Ford Джим Фарли, предположительно неплохо разбирающийся в автомобилях и имеющий возможности выбирать, на чем ему ездить, наплевал на корпоративный патриотизм и ездит как раз на SU7 и не устает им восхищаться.
Достойны упоминания еще два факта: операционка автомашины прекрасно работает с iOS и Android, превратив автомобиль в идеально совместимый с устройствами водителя и пассажира гаджет. А сборку компания не аутсорсит (как бывает со стартапами), а построила собственный полномасштабный автозавод.
Тем временем ходят слухи, что готовится выпуск еще двух моделей. Автор статьи иронично отмечает, что наконец-то фанаты получили свой iCar, вот только прибыл он из Китая
https://www.wired.com/story/phone-maker-xiaomi-made-the-car-that-apple-couldnt/
WIRED
Phone Maker Xiaomi Made the Car That Apple Couldn’t
Great build, deeply integrated tech, and unrivaled connectivity—with its very first EV, Xiaomi is already showing the likes of Ford and Volvo where they’re going wrong, and what Apple could have done.
Forwarded from Метаверсошная
This media is not supported in your browser
VIEW IN TELEGRAM
Умные очки с дисплеем есть не только у Цукера.
Вот например, девушка получила Hearview Glasses - очки, которые улавливают звук, распознают речь и выводят субтитры.
Основная аудитория - люди, у которых проблемы со слухом.
Цена $1300, вес 52 гр, 7 часов без подзарядки, точность распознавания текста 95%.
Субтитры выводятся на правую линзу, распознавание и перевод могут быть на несколько языков, в том числе на русский.
Вот например, девушка получила Hearview Glasses - очки, которые улавливают звук, распознают речь и выводят субтитры.
Основная аудитория - люди, у которых проблемы со слухом.
Цена $1300, вес 52 гр, 7 часов без подзарядки, точность распознавания текста 95%.
Субтитры выводятся на правую линзу, распознавание и перевод могут быть на несколько языков, в том числе на русский.
У меня сегодня в новостных лентах — сплошь КМУ в Сочи и выступления о важности для науки цифровых технологий вообще и ИИ в частности. На этом фоне контекстно выглядит интересный и глубокий (простите за невольный каламбур) манифест DeepMind о роли ИИ в науке. Там 30 с небольшим страниц, стоят того, чтоб всем интересующимся прочитать: и про возможности, и про суть, и про риски.
Основная идея: сегодня все науки, от генетики до метеорологии, сталкиваются с ростом масштабов и сложности во всей деятельности ученого, от работы с потоком литературы до сложнейших экспериментов, генерящих массу данных. Но именно с проблемами нарастания масштабов и сложности отлично работает глубокое ML.
Но внедрение ИИ-центричных подходов к научным исследованиям требует серьезной стратегии, а не попыток прикрутить ИИ любой ценой.
our essay can inform such a strategy. It is aimed at those who make and influence science policy, and funding decisions. We first identify 5 opportunities where there is a growing imperative to use AI in science and examine the primary ingredients needed to make breakthroughs in these areas. We then explore the most commonly-cited risks from using AI in science
Перечисленные пять возможностей:
1. Работа со знаниями
2. Работа с данными
3. Подготовка, моделирование и проведение сложных экспериментов
4. Построение моделей сложных систем и взаимодействий
5. Поиск новых решений в областях с очень большим пространством возможных решений (проблема синтеза белков тому примером)
Перечисленные пять рисков:
1. Не снизит ли ИИ креативность и новизну научных прорывов
2. Не пострадает ли надежность и воспроизводимость результатов, способность науки корректрировать собственные ошибки
3. Не заменят ли полезные работающие решения глубокое понимание их сути
4. Не затруднит ли ИИ доступ к науке представителям уязвимых групп
5. Не затормозит ли ИИ старания снизить углеродный след человечества
Как в начале прошлого века Гильберт сформулировал 23 проблемы, решение которых во многом определило математику XX века, так и сейчас ученым совместно со специалистами по ИИ предстоит определить направления, в которых использование ИИ важней всего.
Есть, правда, серьезная засада: scientific data is uncollected, partial, uncurated or inaccessible, making it unavailable to train AI models
И ее тоже придется решать, если мы хотим реально ускорить научный прогресс.
https://deepmind.google/public-policy/ai-for-science/
Основная идея: сегодня все науки, от генетики до метеорологии, сталкиваются с ростом масштабов и сложности во всей деятельности ученого, от работы с потоком литературы до сложнейших экспериментов, генерящих массу данных. Но именно с проблемами нарастания масштабов и сложности отлично работает глубокое ML.
Но внедрение ИИ-центричных подходов к научным исследованиям требует серьезной стратегии, а не попыток прикрутить ИИ любой ценой.
our essay can inform such a strategy. It is aimed at those who make and influence science policy, and funding decisions. We first identify 5 opportunities where there is a growing imperative to use AI in science and examine the primary ingredients needed to make breakthroughs in these areas. We then explore the most commonly-cited risks from using AI in science
Перечисленные пять возможностей:
1. Работа со знаниями
2. Работа с данными
3. Подготовка, моделирование и проведение сложных экспериментов
4. Построение моделей сложных систем и взаимодействий
5. Поиск новых решений в областях с очень большим пространством возможных решений (проблема синтеза белков тому примером)
Перечисленные пять рисков:
1. Не снизит ли ИИ креативность и новизну научных прорывов
2. Не пострадает ли надежность и воспроизводимость результатов, способность науки корректрировать собственные ошибки
3. Не заменят ли полезные работающие решения глубокое понимание их сути
4. Не затруднит ли ИИ доступ к науке представителям уязвимых групп
5. Не затормозит ли ИИ старания снизить углеродный след человечества
Как в начале прошлого века Гильберт сформулировал 23 проблемы, решение которых во многом определило математику XX века, так и сейчас ученым совместно со специалистами по ИИ предстоит определить направления, в которых использование ИИ важней всего.
Есть, правда, серьезная засада: scientific data is uncollected, partial, uncurated or inaccessible, making it unavailable to train AI models
И ее тоже придется решать, если мы хотим реально ускорить научный прогресс.
https://deepmind.google/public-policy/ai-for-science/
Google DeepMind
A new golden age of discovery
In this essay, we take a tour of how AI is transforming scientific disciplines from genomics to computer science to weather forecasting. Some scientists are training their own AI models, while...
ChatGPT отмечает двухлетнюю годовщину. Читать интернет на эту тему прикольно. Кто-то иронизирует «уже два года прошло, а я еще не потерял свою работу», а кто-то как раз рассказывает, что ее потерял; кто-то причитает, что апокалипсис теперь совсем уже завтра, а другие рассказывают о начавшихся сбываться крутых ожиданиях. Одни восторгаются достигнутым, другие считают, что ИИ провалился в овраг разочарований на гартнеровской кривой и там и сгниет. Как всегда — реакция определяется верой и убеждениями: технофобы стенают, технофилы рукоплещут:)
Некий формальный и безэмоциональный анализ можно почитать в тексте от IBM (хотя, конечно, это позиция технологической компании, и потому скорее оптимистическая).
Основные пункты:
1. Демократизация ИИ. “Now people can leverage these tools without needing millions of dollars of investment. We will soon see one-person unicorns.”
2. Коллаборация людей и машин
3. Достигнута мультимодальность
4. Началось развертывание рассуждающих моделей
5. Прогресс в области малых моделей
6. Идут обсуждения пределов возможного для современных моделей, но плохо с метриками и вообще методами их оценок. “We don’t want AI to replicate humans; we want AI to be really good at what it does.”
7. Гонка инноваций, в которой не обязательно будет единственный победитель, хотя пока OpenAI похож на лидера.
С этой подборкой я скорее согласен:) И в любом случае — всяческие поздравления команде по случаю двухлетия малыша! или уже и не малыша…
https://www.ibm.com/think/news/chatgpt-turns-2.
Тем, кому этот оптимизм неприятен, можно посоветовать, например, посты в X от Gary Marcus, его прогноз таков:
Within 12 months, the GenAI bubble will have burst.
• The economics don’t work
• The current approach has reached a plateau
• There is no killer app
• Hallucinations remain
• Boneheaded errors remain
• Nobody has a moat
• People are starting to realize all of the above.
Некий формальный и безэмоциональный анализ можно почитать в тексте от IBM (хотя, конечно, это позиция технологической компании, и потому скорее оптимистическая).
Основные пункты:
1. Демократизация ИИ. “Now people can leverage these tools without needing millions of dollars of investment. We will soon see one-person unicorns.”
2. Коллаборация людей и машин
3. Достигнута мультимодальность
4. Началось развертывание рассуждающих моделей
5. Прогресс в области малых моделей
6. Идут обсуждения пределов возможного для современных моделей, но плохо с метриками и вообще методами их оценок. “We don’t want AI to replicate humans; we want AI to be really good at what it does.”
7. Гонка инноваций, в которой не обязательно будет единственный победитель, хотя пока OpenAI похож на лидера.
С этой подборкой я скорее согласен:) И в любом случае — всяческие поздравления команде по случаю двухлетия малыша! или уже и не малыша…
https://www.ibm.com/think/news/chatgpt-turns-2.
Тем, кому этот оптимизм неприятен, можно посоветовать, например, посты в X от Gary Marcus, его прогноз таков:
Within 12 months, the GenAI bubble will have burst.
• The economics don’t work
• The current approach has reached a plateau
• There is no killer app
• Hallucinations remain
• Boneheaded errors remain
• Nobody has a moat
• People are starting to realize all of the above.
Ibm
ChatGPT turns two: How it started, and how it’s going | IBM
AI was hardly a new discipline when OpenAI released ChatGPT in November 2022. But allowing anyone with an internet connection and a computer to chat with a machine in a free, user-friendly interface was certainly a major turning point.