ML & AI resources
168 subscribers
165 photos
13 videos
7 files
505 links
Explore AI & Deep Learning with us. Join our Telegram channel for the latest insights and tutorials, managed by CE students from Amirkabir University of Technology.

🆔 @ML_AI_resourses
Download Telegram
Forwarded from Tensorflow(@CVision)
بالاخره صدای زبان فارسی هم شنیده شد!😳

مدل Whisper رو خیلی‌ها می‌شناسن؛ یکی از قوی‌ترین مدل‌ها برای تبدیل صدا به متنه.
اما یه مشکلی که داشت این بود که وقتی نوبت زبان فارسی می‌شد، دقتش پایین میومد و خیلی از کلمات رو درست نمتونست بنویسه.

اما حالا یه نسخه جدید به اسم Whisper-large-fa-v1 منتشر کرده که میتونه زبان فارسی رو به متن تبدیل کنه.
یه فرقی که این نسخه داره اینکه این نسخه روی یه دیتاست تازه به اسم Persian-Voice-v1 دوباره آموزش داده شده. دیتاستی که لهجه‌های مختلف فارسی و اصطلاحات خاص فارسی رو شامل میشه.

نتیجه چیشده؟

تشخیص و رونویسی گفتار فارسی خیلی دقیق‌تر شده.
این یعنی توی کاربردهایی مثل:

زیرنویس‌گذاری خودکار
ساخت دستیارهای صوتی
ابزارهای NLP فارسی

و مهم از همه اینکه این همه‌چی متن‌باز منتشر شده؛ یعنی هر پژوهشگر یا تیمی می‌تونه راحت استفاده کنه، تغییر بده و پروژه‌های جدید بسازه.


لینک مدل: https://huggingface.co/vhdm/whisper-large-fa-v1

لینک دیتاست: https://huggingface.co/datasets/vhdm/persian-voice-v1

منبع: https://www.linkedin.com/feed/update/urn:li:activity:7364194597717073925/
2
Forwarded from DeepMind AI Expert (Farzad 🦅)
اندرو کارپثی گفته بود:
Can you take my 2h13m tokenizer video and translate [into] a book chapter.

We've done it! It includes prose, code & key images. It's a great way to learn this key piece of how LLMs work.
https://www.fast.ai/posts/2025-10-16-karpathy-tokenizers

https://solve.it