Истории (не)успеха (ИИ)ЕИ
419 subscribers
158 photos
87 videos
2 files
227 links
Просто о математике, нейросетях, программировании, спорте, политике, культуре. Общение, контакты, международные онлайн дискуссии/лекции в формате лайвстрим, встречи на спорт в Мюнхене.
Download Telegram
🧠 К важной теме интерпретируемости — как искусственных, так и биологических нейросетей — вышла сильная работа. Пока не успел нормально вчитаться, но оставляю здесь как напоминание самому себе (и, возможно, вам тоже) разобраться подробнее:

📄 Mixture of Cognitive Reasoners: Modular Reasoning with Brain-Like Specialization
👥 Badr AlKhamissi, C. Nicolò De Sabbata, Zeming Chen, Martin Schrimpf, Antoine Bosselut
📚 arXiv | 💻 Code & demos

Краткий разбор уже появился у Григория Сапунова:
🔗 https://t.iss.one/gonzo_ML/3728



TL;DR

Что сделали?
Предложили архитектуру MICRO — модульную языковую модель, вдохновлённую функциональной специализацией мозга. Вместо одного трансформера:
🗣 Language (язык)
🔍 Logic (логика)
🧠 Social (социальное мышление)
🌍 World (знания о мире)

Каждый соответствует отдельной когнитивной сети мозга. Модули обучаются в три этапа: сначала индивидуально на «своих» данных, потом совместно — и это прививает специализацию и улучшает интерпретируемость.

Зачем это всё?
MICRO — это попытка сделать reasoning более управляемым и прозрачным. Модель:
• объяснима на уровне маршрутизации запросов между модулями;
• допускает прямое вмешательство в инференс (можно отключить, например, социального эксперта);
• и при этом работает лучше сопоставимых LLM на задачах рассуждения.



Если успею прочитать внимательно — потом поделюсь заметками.
Если кто уже вникал — буду рад обсуждению 👇

#Interpretability #Explainability #DevInterp #MechInterp #TODO@easy_about_complex
👍3
Media is too big
VIEW IN TELEGRAM
Дорогие друзья, специально для вас! Желаем вам отличных выходных и, как сказано в этом видео, таки следующий шикарный физмат-лайв-стрим с супер-крутыми гостями 23-го июля.

Официальный анонс


#LiveStream #НастроениеСубботы #Culture

@easy_about_complex
🔥32👍1
В копилку, что стоит почитать когда будет время. А пока работать. Эх. 👇

#TODO@easy_about_complex
Мне показались очень интересными описание и содержание следующей (пока что недописанной) книги:

https://geometricdeeplearning.com/book/

The Geometric Deep Learning textbook is a resource intended to help students and practitioners enter the field of geometric deep learning. As we prepare for releasing our book with MIT Press, we will make individual draft chapters of the book available here. We are expecting a cadence of roughly 2–3 weeks per individual chapter release. Once published here, the chapters will remain online, for free.

In addition, we have leveraged the material from the GDL Textbook to support Master’s level courses at both Oxford and Cambridge. Wherever relevant, we will also use this page to share lecture slides corresponding to individual chapters.


Кроме того, до этого я с интересом читала научные статьи по крайней мере двух из четырех авторов этой книги - Petar Veličković и Michael Bronstein (думаю, их знают все, кто занимается графовыми нейросетями, так как они написали основополагающие работы в этой области; однако я больше заинтересовалась их статьями по интерпретируемости LLM).

Тем не менее, я пока что я не нашла достаточного количества времени и сил, чтобы вникнуть в материал самой книги поглубже. Поэтому решила узнать: может, кто-то из читателей уже ознакомился с книгой и может поделиться впечатлениями? 🤔 Если да, то, пожалуйста, напишите в комментариях о своих мыслях и рекомендуете ли книгу к прочтению или нет.

#учебные_материалы
Please open Telegram to view this post
VIEW IN TELEGRAM
1/3
🔸 Прочитал сверх-интересный пост про серьёзный математический вопрос, который носит забавное название - проблема Усердного Бобра(Busy Beaver). Я получил большое удовольствие от прочтения! ❤️

Я бы тут хотел обратить внимание на несколько другие аспекты этой темы, чем те, на которых фокусируется автор поста — на невычислимость Усердного Бобра и одно интересное следствие из этого.

🧠 Что такое усердный бобр?

Усердный бобр с n состояниями — это такая машина Тьюринга, которая среди всех машин Тьюринга с n состояниями делает максимальное количество шагов до остановки стартуя, скажем, с пустой входной ленты(при условии, что она вообще останавливается — неостанавливающиеся машины не учитываются).

Функция BB(n) (от Busy Beaver) — это максимальное число шагов, которое может выполнить любая останавливающаяся машина Тьюринга с n состояниями, прежде чем завершить работу.

Важно: функция BB(n) невычислима, то есть не существует алгоритма, который мог бы точно вычислить её значение для всех n.
Продолжение👇
🔥21👍1
2/3. Начало тут 👆

Важно: функция BB(n) невычислима, то есть не существует алгоритма, который мог бы точно вычислить её значение для всех n. Доказывается это через проблему остановки. Чтобы вычислить BB(n) для машин с n состояниями нам по-любому надо определить какие машины не останавливаются. Это, увы, не вычислимо.

📈 Более того, BB(n) растёт быстрее, чем любая вычислимая функция.

🔍 Как это доказывается?

Представим, что у нас есть вычислимая функция f(n), которая, предположим, растёт быстрее, чем BB(n). То есть:
f(n) > BB(n) начиная с какого-то n, и при этом разница f(n) − BB(n) стремится к бесконечности при n → ∞.

Но тогда мы можем использовать f(n), чтобы вычислить BB(n):

- Сгенерировать все машины Тьюринга с n состояниями (их конечное число).

- Симулировать каждую не более чем f(n) шагов (по нашему предположению этого достаточно, чтобы все, кто должны остановиться, уже остановились по определению BB(n)).

- Из всех остановившихся выбрать ту, которая делала максимум шагов — и получить BB(n).

👉 Но это противоречит тому, что BB(n) невычислима. Следовательно, никакая вычислимая функция не может расти так быстро как BB(n).

🌌 А теперь — самое интересное:

Если предположить, что всё в физическом мире алгоритмизуемо (то есть, физический тезис Чёрча–Тьюринга верен и вселенная — это в каком-то смысле алгоритм) тогда из доказательства выше следуют 8 новых физических принципов, о которых мы расскажем завтра.

Пока кратко
: усердный бобр и BB(n) ограничиваeт, как быстро или насколько медленно может расти или сходиться любая измеримая физическая величина.

💥 Эти принципы не следуют из известных физических принципов или законов.

Вот pабота про это:
🔗 Bounds on the rates of growth and convergence of
all physical processes


💬 Если тезис Чёрча–Тьюринга верен за физическими процессами скрываются алгоритмы в том или ином виде, то физические процессы вдруг оказываются ограниченными не только симметриями, энергиями и скоростями, но и границами вычислимости и из них следуют новые физические принципы, которые не так уж и очевидны.

Как по мне, то глубокая связь между информатикой и естественными науками.

Продолжение 👇

#Computability #Turing #Physics #Beauty
👍4
Продолжаем тему усердного бобра. Начало👆

Придётся немного подумать: идея кажется простой, но на самом деле хитрая 🤔.

В статье «Bounds on the Rates of Growth and Convergence of All Physical Processes» Тоби Орд рассматривает любые измеряемые физические величины и показывает, что скорость их роста или убывания обязана находиться в определённых пределах .

Помните невычислимую функцию бобра BB(n)? Если бы физический процесс протекал с такой же скоростью, как функция бобра, мы могли бы вычислить BB(n) просто измеряя физические величины 📏. Но это невозможно, если принять физический тезис Чёрча–Тьюринга: любой физически реализуемый процесс можно смоделировать на машине Тьюринга 🤖.

Pаз машина Тьюринга не может вычислить BB(n), то и физический процесс не может вычислить BB(n) — то есть не может протекать
со скоростью BB(n)
(см. доказательство тут).

Вы спросите: а почему бы физическим процессам не протекать быстрее функции бобра?

Продолжение 👇
👍1🔥1
Продолжение. Предыдущая часть тут 👆

Дело в том, что легко показать: все функции растущие быстрее функции бобра - тоже невычислимы ⚠️

Если бы физические процессы протекали с этими скоростями - мы могли бы вычислять невычислимые функции просто производя измерения физических величин.

📌 Из этого вытекают целых восемь физических принципов, которые не следуют из известных законов природы. Они возникают только из логики — из тезиса Чёрча–Тьюринга и невычислимости BB(n).

Тоби Орд вводит ещё трёх персонажей, дополняющих нашего замечательного бобра. Итак, у нас есть:

1. Усердный Бобр (Busy Beaver, BB(t))
→ максимальное число шагов останавливающейся машины Тьюринга с t состояниями. Это верхняя граница роста: если тезис Чёрча–Тьюринга верен, ничто во Вселенной не может расти быстрее. Ни расширение вселенной после большого взрыва, ни искривление пространства-времени при приближении к сингулярности в центре чёрной дыры. Ничего вообще.

2. Сонный Ленивец (Sleepy Sloth, SS(t) = BB⁻¹(t))
→ обратная функция к BB(t). Если BB(t) растёт невероятно быстро, то SS(t) — невероятно медленно. Нижняя граница роста 🐌. Если бы период колебаний системы увеличивался так катастрофически быстро, что его частота (то есть 1/период) уменьшалась бы медленнее SS(x) - такого не может быть в природе, это запрещено.

3. Асимптотический Ахиллес (Asymptoting Achilles, AA(t) = 1 / BB(t))
→ стремится к нулю очень быстро. Это верхняя граница скорости сходимости: никакой процесс не может приближаться к пределу быстрее, чем AA(t) 🏃‍♂️💨. Если вы сжимаете газ, его объём не может уменьшаться к нулю быстрее, чем AA(x), даже при бесконечном давлении. Скорость любого процесса, приближающегося к стабильному состоянию, имеет верхний предел.

4. Медлительный Мечтатель (Dawdling Daydreamer, DD(t) = 1 / SS(t))
→ стремиться к нулю очень медленно. Нижняя граница скорости сходимости: даже самые медленные приближения к равновесию не могут быть медленнее, чем DD(t) 🐢. Процесс химической реакции не может "замирать" на долгое время, оставаясь вдали от равновесия. Должен быть минимальный темп приближения.

5-8: Принципы 5, 6, 7 и 8 я пока что опущу, но если вы напишете в комментариях, что хотите, то можем и их разобрать либо в комментариях к этому посту письменно, либо на нашем традиционном онлайн-стриме.

Кстати, напомню, следующий онлайн-стрим с очень крутыми гостями как раз из физики - 23-го июля вечером! Официальный анонс следует!


🧠 💪 А пока предлагаю всем читателям доказать в качестве простого упражнения:

- любая функция, которая растёт быстрее BB(n) - невычислима
- функции BB⁻¹(n), 1/BB(n) и 1/BB⁻¹(n) - невычислимы


Анализ и выводы из этой темы следуют скоро 👇

@easy_about_complex

#Computability #Physics #Logic #Philosophy #Turing #LiveStream
👍32🔥1
Истории (не)успеха (ИИ)ЕИ pinned «Продолжение. Предыдущая часть тут 👆 Дело в том, что легко показать: все функции растущие быстрее функции бобра - тоже невычислимы ⚠️ Если бы физические процессы протекали с этими скоростями - мы могли бы вычислять невычислимые функции просто производя измерения…»
Сегодня в 19:00 по немецкому времени, в 20:00 по Киеву/Москве можем поговорить про усердного бобра 👆Вдруг кому случайно будет нечего делать в воскресенье вечером )

Вверху будет кнопочка «присоединиться к стриму»
2👍2
стрим начался
я отойду на пару минут, всё равно по опыту нужно подождать пока люди подойдут
Live stream finished (38 minutes)
Live stream finished (13 seconds)
стрим сегодня был кратким, чётким и очень познавательным. отчёт следует. Не забываем, что стрим, где всем надо быть - 23-го июля! напоминание в песенном виде 👇
Media is too big
VIEW IN TELEGRAM
Дорогие друзья, специально для вас! Желаем вам отличных выходных и, как сказано в этом видео, таки следующий шикарный физмат-лайв-стрим с супер-крутыми гостями 23-го июля.

Официальный анонс скоро в этом канале.


#LiveStream #НастроениеСубботы #Culture

@easy_about_complex
👍4
1/2

🌀 Квантовая физика, здравый смысл и немного здоровой дерзости

Автор: М. Кацнельсон (Фейсбук)

Вот это всеобщее радостное бульканье о полной непостижимости квантовой физики... В общем, я совсем перестал понимать, что имеется в виду. Ох - соотношение неопределенности Гейзенберга! Вы только подумайте - квантовая частица не имеет одновременно точного значения координаты и скорости. Караул - спасите - хулиганы зрения лишают.

А что - то, что в классической механике задание координаты и скорости однозначно определяет движение - это вот прямо очевидно? Вот прямо проснулся в шесть часов, разобрался с пресловутой резинкой и сразу думаешь: ну да - законы движения представляют собой дифференциальное уравнение второго порядка, ежику понятно, не третьего ведь и не первого, значит, функция и производная нужны, чтобы определить задачу Коши. Проще некуда!

Продолжение 👇
4