Flow matching in 4 mins
https://x.com/jbhuang0604/status/1950883022942978254?t=BsQv2hm_9VQGHNF0gQsK7A&s=35
https://x.com/jbhuang0604/status/1950883022942978254?t=BsQv2hm_9VQGHNF0gQsK7A&s=35
From GPT-2 to gpt-oss: Analyzing the Architectural Advances
By: Sebastian Raschka
https://magazine.sebastianraschka.com/p/from-gpt-2-to-gpt-oss-analyzing-the
By: Sebastian Raschka
https://magazine.sebastianraschka.com/p/from-gpt-2-to-gpt-oss-analyzing-the
Sebastianraschka
From GPT-2 to gpt-oss: Analyzing the Architectural Advances
And How They Stack Up Against Qwen3
🔥2
Forwarded from Tensorflow(@CVision)
بالاخره صدای زبان فارسی هم شنیده شد!😳
مدل Whisper رو خیلیها میشناسن؛ یکی از قویترین مدلها برای تبدیل صدا به متنه.
اما یه مشکلی که داشت این بود که وقتی نوبت زبان فارسی میشد، دقتش پایین میومد و خیلی از کلمات رو درست نمتونست بنویسه.
اما حالا یه نسخه جدید به اسم Whisper-large-fa-v1 منتشر کرده که میتونه زبان فارسی رو به متن تبدیل کنه.
یه فرقی که این نسخه داره اینکه این نسخه روی یه دیتاست تازه به اسم Persian-Voice-v1 دوباره آموزش داده شده. دیتاستی که لهجههای مختلف فارسی و اصطلاحات خاص فارسی رو شامل میشه.
نتیجه چیشده؟
تشخیص و رونویسی گفتار فارسی خیلی دقیقتر شده.
این یعنی توی کاربردهایی مثل:
✅زیرنویسگذاری خودکار
✅ساخت دستیارهای صوتی
✅ابزارهای NLP فارسی
و مهم از همه اینکه این همهچی متنباز منتشر شده؛ یعنی هر پژوهشگر یا تیمی میتونه راحت استفاده کنه، تغییر بده و پروژههای جدید بسازه.
لینک مدل: https://huggingface.co/vhdm/whisper-large-fa-v1
لینک دیتاست: https://huggingface.co/datasets/vhdm/persian-voice-v1
منبع: https://www.linkedin.com/feed/update/urn:li:activity:7364194597717073925/
مدل Whisper رو خیلیها میشناسن؛ یکی از قویترین مدلها برای تبدیل صدا به متنه.
اما یه مشکلی که داشت این بود که وقتی نوبت زبان فارسی میشد، دقتش پایین میومد و خیلی از کلمات رو درست نمتونست بنویسه.
اما حالا یه نسخه جدید به اسم Whisper-large-fa-v1 منتشر کرده که میتونه زبان فارسی رو به متن تبدیل کنه.
یه فرقی که این نسخه داره اینکه این نسخه روی یه دیتاست تازه به اسم Persian-Voice-v1 دوباره آموزش داده شده. دیتاستی که لهجههای مختلف فارسی و اصطلاحات خاص فارسی رو شامل میشه.
نتیجه چیشده؟
تشخیص و رونویسی گفتار فارسی خیلی دقیقتر شده.
این یعنی توی کاربردهایی مثل:
✅زیرنویسگذاری خودکار
✅ساخت دستیارهای صوتی
✅ابزارهای NLP فارسی
و مهم از همه اینکه این همهچی متنباز منتشر شده؛ یعنی هر پژوهشگر یا تیمی میتونه راحت استفاده کنه، تغییر بده و پروژههای جدید بسازه.
لینک مدل: https://huggingface.co/vhdm/whisper-large-fa-v1
لینک دیتاست: https://huggingface.co/datasets/vhdm/persian-voice-v1
منبع: https://www.linkedin.com/feed/update/urn:li:activity:7364194597717073925/
❤2
Diffusion models demystified, once and for all!
https://www.youtube.com/watch?v=Fk2I6pa6UeA&list=WL&index=19
https://www.youtube.com/watch?v=Fk2I6pa6UeA&list=WL&index=19
YouTube
More Than Image Generators: A Science of Problem-Solving using Probability | Diffusion Models
This is my entry to #SoME4, 3Blue1Brown's Summer of Math Exposition Competition!
Diffusion models are typically portrayed as models that learn to denoise a corrupted image. This way, they can generate new images by gradually removing noise from a sample…
Diffusion models are typically portrayed as models that learn to denoise a corrupted image. This way, they can generate new images by gradually removing noise from a sample…
🔥4
ML & AI resources
https://www.youtube.com/watch?v=R0uMcXsfo2o
YouTube
But how do AI images and videos actually work? | Guest video by Welch Labs
Diffusion models, CLIP, and the math of turning text into images
Welch Labs Book: https://www.welchlabs.com/resources/imaginary-numbers-book
Sections
0:00 - Intro
3:37 - CLIP
6:25 - Shared Embedding Space
8:16 - Diffusion Models & DDPM
11:44 - Learning Vector…
Welch Labs Book: https://www.welchlabs.com/resources/imaginary-numbers-book
Sections
0:00 - Intro
3:37 - CLIP
6:25 - Shared Embedding Space
8:16 - Diffusion Models & DDPM
11:44 - Learning Vector…
🔥1
Forwarded from DeepMind AI Expert (Farzad 🦅)
اندرو کارپثی گفته بود:
Can you take my 2h13m tokenizer video and translate [into] a book chapter.
We've done it! It includes prose, code & key images. It's a great way to learn this key piece of how LLMs work.
https://www.fast.ai/posts/2025-10-16-karpathy-tokenizers
https://solve.it
Can you take my 2h13m tokenizer video and translate [into] a book chapter.
We've done it! It includes prose, code & key images. It's a great way to learn this key piece of how LLMs work.
https://www.fast.ai/posts/2025-10-16-karpathy-tokenizers
https://solve.it
fast.ai
Let’s Build the GPT Tokenizer: A Complete Guide to Tokenization in LLMs – fast.ai
A text and code version of Karpathy’s famous tokenizer video.