88 subscribers
31 photos
2 videos
20 files
238 links
Machine learning
Download Telegram
Несколько лет назад директор Института машинного интеллекта Люк Мюэльхаузер попытался подсчитать, насколько изменила благосостояние человечества промышленная революция

Он выделил 6 критериев, по которым можно судить о благосостоянии (и по которым есть данные): ожидаемая продолжительность жизни при рождении, ВВП на душу населения, доля живущих в крайней бедности, количество потребляемых килокалорий человеком в день, технологический уровень и уровень политической свободы

Как он все это подсчитал и где взял данные, описано
в его посте

А вывод получился вполне ожидаемым: перемены последних двух столетий в благополучии людей совершенно не сопоставимы по масштабу ни с чем в предыдущей истории

Эти перемены настолько велики, что любые колебания в прошлом человечества для нас малозаметны – с точки зрения человека, живущего на современном уровне благополучия, до промышленной революции человечество пребывало на самом дне по любым показателям уровня жизни

И это мало зависело от исторического периода, все всегда было очень плохо и очень стабильно

Все лучшие события в мировой истории случилось с человечеством за последние пару сотен лет, - и даже мировые войны не затормозили прогресс (вместе с «испанкой» они убили 7 % населения планеты, - бывало, кстати, и похуже, Черная смерть или Чингисхан выкашивали по 10 %)

Самые существенные изменения в образе жизни, благополучии и даже в политических свободах человечеству приносит развитие технологий, а не войны, реформы или революции

Так происходит и сейчас: в 20-е годы повседневную жизнь человечества больше всего меняют нейросети, в десятые – смартфоны, в нулевые – интернет, в 90-е персональные компьютеры, и т.д.
«По словам французского нейрофизиолога Жан-Пьера Шанжё:
«С моей точки зрения, аксиоматический метод (применяющийся, например, в евклидовой геометрии) – выражение способностей головного мозга, связанное с его использованием
Ведь основная характеристика языка – это именно его генеративный характер (Changeux and Connes 1995)»



Однако, если математика – тот же язык, как объяснить, что, хотя дети легко учатся родному языку, математика дается многим с таким трудом?

Марджори Флеминг (1803–1811), шотландская девочка-вундеркинд, не дожившая до 9 лет, оставила дневник – более девяти тысяч слов прозы и около пятисот стихотворных строк – где, помимо всего прочего, очаровательно описывает, с какими сложностями сталкиваются дети при изучении математики

В одном месте Марджори жалуется:
«А теперь я хочу рассказать тебе, дорогой дневник, как страшно и ужасно мучает меня таблица умножения, ты себе и представить не можешь!
Самое кошмарное – это восемь на восемь и семь на семь, это противно самой природе!»
Исследователи из 18 ведущих университетов мира запустили новую открытую платформу aiXiv, предназначенную для размещения научных работ, созданных при участии искусственного интеллекта

Сегодняшний академический ландшафт сталкивается с противоречием: с одной стороны, Ml уже способен генерировать статьи определенного качества, с другой — отсутствует подходящая площадка для их систематической публикации

Tрaдиционные журналы пока принципиально исключают AI-авторство, а arXiv не обеспечивает должного контроля качества
В итоге перспективные идеи и тексты, созданные Ml, часто остаются «невидимыми» для научного сообщества

Как устроен
aiXiv

Рецензирование
Внутри платформы работает замкнутый цикл оценки качества
На первом этапе статьи анализируются агентом с RAG-моделями на основе Semantic Scholar API, который подбирает релевантные источники для замечаний

Затем система распределяет работу по подтемам и формирует команды из 3–5 специализированных «рецензентов-агентов»

Итоговое заключение выносится агрегирующим редактором
В тестировании на материалах ICLR 2024/25 aiXiv продемонстрировал точность отбора лучших статей до 81 %, что выше предыдущих решений вроде DeepReview

Доработка статей
Авторы, как и в традиционной публикационной модели, получают замечания, могут исправлять текст, загружать обновленные версии и при необходимости добавлять «response letter»
Это повышает вероятность принятия работы

Финальное решение
Вопрос о публикации ставится на голосование пяти ведущих LLM
Для выхода статьи в открытый доступ требуется минимум три положительных голоса
Принятые материалы получают DOI и становятся доступны для широкой дискуссии

Особенность платформы в том, что публиковаться на ней могут не только Ml, но и люди

Препринт с подробным описанием проекта доступен
тут
👍1
Anthropic выпустили инструкцию как правильно управлять вниманием и памятью Ml-агентов, чтобы они работали умнее и надёжнее на сложных задачах
Кожаным мешкам приготовиться: Ml приблизились по качеству работы к отраслевым экспертам

При этом Ml могут выполнять работу в 44 профессиях из 9 отраслей примерно в 100 раз быстрее и в 100 раз дешевле


OpenAI создала GDPval - бенчмарк моделей на реальных задачах экономики
Он измеряет эффективность модели при выполнении 1.230 задач, взятых непосредственно из реальных знаний опытных специалистов из широкого спектра профессий и секторов, вносящих наибольший вклад в ВВП США.

Бенчмарк предоставляет четкую картину того, как модели работают с экономически значимыми задачами по сравнению с экспертами – людьми

Каждое задание основано на реальных результатах работы, таких как юридическое задание, инженерный проект, беседа со службой поддержки клиентов или план ухода за больными

Все эти задания были тщательно разработаны и проверены опытными специалистами со средним опытом работы в этих областях более 14 лет

Результат:
1) Ml работают уже почти на уровне экспертов – людей
«Мы обнаружили, что лучшие на сегодняшний день передовые модели уже приближаются по качеству к работе, выполненной отраслевыми экспертами», — пишут авторы
Claude Opus 4.1 занял первое место с общим процентом побед или ничьих 47.6 % по сравнению с работой, выполненной человеком, за ним следуют GPT-5-high с 38.8 % и o3 high с 34.1 %

2) Ml несравненно эффективней людей.
«Мы обнаружили, что передовые модели могут выполнять задачи GDPval примерно в 100 раз быстрее и в 100 раз дешевле, чем отраслевые эксперты»

Самое важное.
Это всего лишь сегодняшние модели
Через год новые модели будут сильно умней и умелей экспертов людей
И профессий будет уже не 44 в 9 отраслях, а много больше.

Подробней
[1, 2]
🔥1
Про Ml

"Один человек из аудитории спросил меня, являются ли математики скорее «изобретателями» — то есть творцами нового мира, созданного их воображением,— или же «первооткрывателями» предсуществующей реальности
Я ответил, что, как и почти все математики, я скорее склоняюсь к платонизму и воспринимаю математику как реальность, независимую от нас, которая существовала в нас, но была сокрыта, укрыта покровом, и наша задача — обнажить её

Однако, поразмыслив, я прихожу к выводу, что для характеристики деятельности математика (или, в более широком смысле, учёного, ищущего истину) существует слово более точное и куда более глубокое, чем «изобретатель» или «первооткрыватель», слово также полностью библейское, которое появляется в конце длинного отрывка из Гротендика, процитированного мною: математик — это слуга

Слуга — это тот, кто заботится о чём-то ином, а не о себе: так же и математик, который в моменты погружения в математику теряет даже сознание собственного «я»

Слуга не решает: математик никогда не решает, что является истинным, но постоянно натыкается на сопротивление истины

Он прилагает усилия к истине, но не может её исказить, кроме как немедленно введя себя в заблуждение; он может лишь прилепиться к ней, повиноваться

Слуга — это один из многих, и более того, он, по слову Христа, «раб неключимый»: то, что он делает, другой мог бы сделать на его месте
Точно так же математик чувствует себя крошечным перед лицом огромной традиции математики, лишь ничтожную часть которой он знает и которую ему было бы не под силу выстроить самостоятельно
Лучшее, на что он может надеяться, — это продвинуть её чуть-чуть вперёд, в то же время осознавая, что его работа будет быстро превзойдена, что многие другие способны сделать то же самое не хуже него и что они неизбежно сделают это однажды, если он сам не приложит к этому руку

Он также знает, что даже самые сложные проблемы покажутся лёгкими и перестанут впечатлять, как только будут решены в первый раз, так что любой прогресс, которого он добивается, растворяет, стирает и заставляет забыть о трудности, которую пришлось преодолеть

Слуга не говорит, он слушает

Математик должен замолкнуть внутренне и прислушаться, напрячь своё существо, чтобы услышать столь тонкий и деликатный голос вещей, каковы они есть, и позволить руке бежать под их диктовку

Как это ни странно, но именно становясь слугой математических реальностей и их голосом, их переводчиком, математик реализует себя

Величайшие математические тексты одновременно и самые безличные — в том смысле, что каждый, читая их, испытывает глубокую эмоцию, видя, как из тумана невысказанного, строка за строкой, появляется нечто, что он всегда в себе носил, что жаждало быть высказанным и до сих пор не могло обрести выражения, — и самые личные — в том смысле, что сразу узнаёшь почерк их автора"


Лоран Лафорг
(перевод с французского)
Себ Крие из DeepMind о том, как Ml-агенты могут изменить общество и государство

Эту
статью Себ Крие написал от собственного имени, а не Google, где он работает над разработкой политики

Себ предлагает концепцию, что Ml-агенты могут радикально снизить "транзакционные издержки": затраты на поиск, переговоры и исполнение договорённостей, которые мешают людям напрямую договариваться друг с другом, вместо того, чтобы полагаться на государственное регулирование

Как это работает на практике? Представьте себе умного цифрового помощника, который:
• знает все ваши предпочтения в мельчайших деталях
• может мгновенно вести переговоры с миллионами других агентов
• находит решения, выгодные для всех сторон

Ключевые преимущества системы:
Подотчётность
:
Все сделки прозрачны и зафиксированы
Коллективная сила:
Тысячи людей могут мгновенно объединиться через своих агентов для переговоров
Гибкость:
Правила адаптируются в реальном времени, а не ждут решения чиновников

Государство не исчезает, но меняет роль: вместо "центрального планировщика" оно становится "гарантом правил" — обеспечивает права собственности, исполнение контрактов и защиту от насилия

Себ предлагает модель "матрёшки":
Внешний слой: Закон
Средний слой: Рыночная конкуренция между провайдерами агентов
Внутренний слой: Личная лояльность агента к пользователю
9 октября в МЦНМО на семинаре учителей математики А. Заславский, В. Конышев, С. Кузнецов, Ю. Нагуманов будут рассказывать про новые методы в олимпиадной геометрии

«В последнее время в олимпиадной геометрии наряду с традиционными стали широко использоваться такие инструменты, как движение точек, кубические кривые, теорема Дезарга об инволюциях и др.
В докладе будет рассказано об этих методах и разобран ряд сложных задач, предлагаемых на недавних олимпиадах»

(как всегда трансляции не будет)
mccme.ru/nir/seminar/