Разработан метод, который позволяет видеть, как внутри ИИ появляются смыслы и менять их в процессе генерации без переобучения модели
Исследователи из T-Bank AI Research представили на ICML 2025 метод, позволяющий анализировать и управлять поведением языковых моделей без переобучения. Он отслеживает, как смыслы формируются внутри модели, и позволяет точечно усиливать или подавлять темы в генерации текста. Метод не требует дополнительных расходов и применим для уже обученных LLM.
📚Paper
@datascienceiot
Исследователи из T-Bank AI Research представили на ICML 2025 метод, позволяющий анализировать и управлять поведением языковых моделей без переобучения. Он отслеживает, как смыслы формируются внутри модели, и позволяет точечно усиливать или подавлять темы в генерации текста. Метод не требует дополнительных расходов и применим для уже обученных LLM.
📚Paper
@datascienceiot
Deep Research Agents with Test-Time Diffusion
Google keeps pushing on diffusion.
📚Paper
@datascienceiot
Google keeps pushing on diffusion.
📚Paper
@datascienceiot
Schmidhuber’s Fast-Weight work of 1991-92 introduced an explicit mechanism for token-to-token interaction inside recurrent neural networks (RNNs).
Each time step wrote an outer-product fast weight that linked the current hidden state (a “key”) with a “value.”
📚Статья
@datascienceiot
Each time step wrote an outer-product fast weight that linked the current hidden state (a “key”) with a “value.”
📚Статья
@datascienceiot
На ИТ-Пикнике планируют поднять темы о том, как ИИ учится рассуждать, как устроено автономное вождение, зачем людям нужен опенсорс и кто кого доучит: GenAI или платформы. Крупнейший ИТ-фестиваль пройдет уже в следующую субботу.
@datascienceiot
@datascienceiot
Share Your Attention: Transformer Weight Sharing via Matrix-based Dictionary Learning
📚 Read
@datascienceiot
📚 Read
@datascienceiot
A Comprehensive Survey of Self-Evolving AI Agents
A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems
📚 Читать
@datascienceiot
A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems
📚 Читать
@datascienceiot
<code_editing_rules>
<guiding_principles>
- Every component should be modular and reusable
</guiding_principles>
<frontend_stack_defaults>
- Styling: TailwindCSS
</frontend_stack_defaults>
</code_editing_rules>
<self_reflection>
- Think of a rubric first
- Deeply analyze each part
- Use rubric to iterate best solution
</self_reflection>
<persistence>
- Don’t ask human for confirmation
- Make best assumption
- Document it after acting
</persistence>
📌 Полный PDF со всеми деталями — тут
🚀 Генератор/оптимизатор промптов для GPT-5 — тут.
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM