the last neural cell

Forwarded from Михаил Лебедев (Mikhail Lebedev) — нейроученый

Спешите подать на BCI award. Дедлайн — 1 сентября.

https://www.bci-award.com/Home

BCI Award

BCI Award: Submit now!

The Annual BCI Award, endowed with 3,000 USD, is one of the top accolades in BCI research.

898 viewsAleksandr Kovalev, 17:45

the last neural cell

Forwarded from LIFT feed

Свежее от Precision Neuroscience: они вновь испытали на людях свои тонкопленочные сверхплотные микроэлектродные ЭКоГ массивы, каждый размером с почтовую марку и содержит 1024 электрода. Через узкую щель (900 мкм) в черепе пациентам заводили до четырех пленок, покрывая примерно 8 см² коры более чем 4 тыс. электродами. — По сравнению с предыдущим результатом добавили нейромодуляцию. На сегодня Precision имплантировали своё устройство уже >50 пациентам и получили разрешение FDA на имплантацию.

#tech | #readout | #modulation | #brain

Nature

Minimally invasive implantation of scalable high-density cortical microelectrode arrays for multimodal neural decoding and stimulation

Nature Biomedical Engineering - A 1,024-channel microelectrode array is delivered to the brain cortex via a minimally invasive incision in the skull and dura, and allows recording, stimulation and...

⚡4❤3

499 viewsAleksandr Kovalev, 11:14

the last neural cell

next-token-diffusion.png

8.9 MB

tasty next-token diffusion papers

Autoregressive Image Generation without Vector Quantization (MAR)
tl;dr: propose diffusion head to model each token's distribution instead of cross-entropy (no need to use VQ-VAE)
- bidirectional attention (MAE-style) + random order lets model see full context, unlike causal AR - generates 64 tokens at once
- diffusion head is tiny (2M params works same as 45M) - proves transformer backbone learned everything, head just samples
link: https://arxiv.org/abs/2406.11838

Multimodal Latent Language Modeling with Next-Token Diffusion (LatentLM)
tl;dr: extend MAR's approach to multimodal LLMs, unifying text, image, and audio generation in a single framework
- make VAE more stable: σ-VAE where encoder predicts mean, sigma samples independently, which fixes variance collapse
- use the same diffusion loss as in MAR paper
link: https://arxiv.org/abs/2412.08635

industry-level solution

VibeVoice: A Frontier Open-Source Text-to-Speech Model
tl;dr: apply LatentLM architecture to long-form conversational audio synthesis
- train σ-VAE for audio compression: 7.5Hz is insane (3200x compression)
- model can generate up to 90min with 4 speakers
- beats Gemini + ElevenLabs on human eval, 10x fewer steps than VALL-E 2
link: https://microsoft.github.io/VibeVoice/

NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale
tl;dr: scale next-token diffusion to 14B parameters with lightweight flow matching for state-of-the-art image generation
- start to use flow matching for diffusion loss
- 14B transformer + 157M flow head (same quality as 528M head) - ratio doesn't matter, confirms transformer does all modeling
- add channel-wise norm in tokenizer critical for stability at high CFG
link: https://stepfun.ai/research/en/nextstep1

my thoughts

The core win: continuous latents via diffusion head = no VQ-VAE bottleneck. Smoother reconstruction, fewer artifacts, VAE training just works. Diffusion head size doesn't matter (2M vs 45M, same quality). Means transformer already learned everything, head just samples.

Clean merge of AR and diffusion - not Frankenstein hybrid, just "model sequences autoregressively, sample via diffusion instead of argmax."

In addition this inherits the entire causal LLM toolkit (KV caching, flash attention, etc.) - transformer backbone stays autoregressive, only head changed.

I guess it should perfectly work as neural foundation models. Let's see.

❤3🔥1🤔1

661 viewsAleksandr Kovalev, edited 13:00

the last neural cell

Forwarded from Egor Levchenko

🆕 Мы тут выпустили новую базу данных фМРТ!

Она называется Naturalistic Neuroimaging Database 3T (NNDb3T+) и в ней 40 испытуемых и около 160 часов сканирования.

Что внутри:
• 2х часовой просмотр фильма в сканере (вместе с ай трекером и физиологией)
• Задачи по созданию отдельных карт соматомоторных, слуховых и зрительных отделов (somatotopy, tonotopy и retinotopy)

Датасет лежит на openneuro
Препринт на biorxiv
Есть код на гитхабе с анализом

Ну и посты в соц сетях - если хотите помочь spread the word 🙂
LinkedIn
Bsky
Twitter

Мы будем рады, если датасетом будут пользоваться!

bioRxiv

A neuroimaging database combining movie-watching, eye-tracking, sensorimotor mapping, and cognitive tasks

We provide a multimodal naturalistic neuroimaging database (NNDb-3T+), designed to support the study of brain function under both naturalistic and controlled experimental conditions. The database includes high-quality 3T fMRI data from 40 participants acquired…

⚡8❤6🔥2

494 viewsAleksandr Kovalev, 19:59

the last neural cell

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Самый забавный момент с презентации робота от 1Х

Подпись смешную сами придумаете)

❤6

616 viewsAleksandr Kovalev, 14:53

the last neural cell

Forwarded from gonzo-обзоры ML статей

Ну что, ждём сегодня Gemini 3.0?

❤4

251 viewsAleksandr Kovalev, 10:24

the last neural cell

Forwarded from Борис опять

Gemini 3 Pro бенчмарки простыми словами

- Очень большой рост на Humanity's Last Exam: это про решение очень сложных задач.
- Очень большой рост на Arc AGI 2: это про способность понимать правила задачи по парочке примеров и далее применять их в новых случаях.
- Большой рост по способностям понимать сложные изображения вроде скриншотов и графиков (бывшие коллеги из eBay обратите внимание).
- SWE-bench verified лишь незначительно отстаёт от Sonnet 4.5: это про способность решать реальные задачи по разработке софта. Короче модель на уровне Соннета.
- Большой рост по всему, что касается тулколлов и агентности. Особенно Vending Bench 2 выделяется — это про долгосрочное планирование.

Все стандартные бенчи типа MMMLU чуть-чуть выросли.

В общем большая ставка на агентность. Возможно на этой модели уже можно сделать какой-то рабочий computer use.

Выглядит как рост уровня того, что было при переходе от GPT-3.5 к GPT-4. Давно такого не было! Но подождем результатов на арене, SWE Rebench и прочих штуках, где нельзя оверфитнуться на тест

🔥4❤2

236 viewsAleksandr Kovalev, 14:30

the last neural cell

Forwarded from LIFT feed

Обезьянам с повреждением спинного мозга помогла подсадка нейральных стволовых клеток, полученных из ESCs человека. Клетки отрастили сотни тысяч новых аксонов на глубину до 4 см, связались с тканями хозяина и восстановили подвижность рук.

Также по терапии стволовыми клетками на днях вышел обзор в контексте восстановления мозга после инсульта. Акцент сделан на взаимодействии между стволовыми и иммунными клетками, как оно влияет на воспаление, пластичность и ремоделирование нейронных связей.

#cell | #therapy | #bioengineering

Nature

Extensive restoration of forelimb function in primates with spinal cord injury by neural stem cell transplantation

Nature Biotechnology - Stem cell repair of injured monkey spinal cords restores hand function in 53% of trials.

🔥6❤1

176 viewsAleksandr Kovalev, 13:05

About

Blog

Apps

Platform