ML & AI resources
168 subscribers
165 photos
13 videos
7 files
505 links
Explore AI & Deep Learning with us. Join our Telegram channel for the latest insights and tutorials, managed by CE students from Amirkabir University of Technology.

🆔 @ML_AI_resourses
Download Telegram
سایت Scholar inbox به شما این قابلیت رو میده که personal digest داشته باشین؛ یعنی پیپرهای مرتبط به فیلدتون رو روزانه بهتون بده (مثل scholar alert ولی همراه با قابلیت‌های دیگه مثل مپ و .‌..)

https://arxiv.org/pdf/2504.08385v1
🔥2👍1
Forwarded from Tensorflow(@CVision)
بالاخره صدای زبان فارسی هم شنیده شد!😳

مدل Whisper رو خیلی‌ها می‌شناسن؛ یکی از قوی‌ترین مدل‌ها برای تبدیل صدا به متنه.
اما یه مشکلی که داشت این بود که وقتی نوبت زبان فارسی می‌شد، دقتش پایین میومد و خیلی از کلمات رو درست نمتونست بنویسه.

اما حالا یه نسخه جدید به اسم Whisper-large-fa-v1 منتشر کرده که میتونه زبان فارسی رو به متن تبدیل کنه.
یه فرقی که این نسخه داره اینکه این نسخه روی یه دیتاست تازه به اسم Persian-Voice-v1 دوباره آموزش داده شده. دیتاستی که لهجه‌های مختلف فارسی و اصطلاحات خاص فارسی رو شامل میشه.

نتیجه چیشده؟

تشخیص و رونویسی گفتار فارسی خیلی دقیق‌تر شده.
این یعنی توی کاربردهایی مثل:

زیرنویس‌گذاری خودکار
ساخت دستیارهای صوتی
ابزارهای NLP فارسی

و مهم از همه اینکه این همه‌چی متن‌باز منتشر شده؛ یعنی هر پژوهشگر یا تیمی می‌تونه راحت استفاده کنه، تغییر بده و پروژه‌های جدید بسازه.


لینک مدل: https://huggingface.co/vhdm/whisper-large-fa-v1

لینک دیتاست: https://huggingface.co/datasets/vhdm/persian-voice-v1

منبع: https://www.linkedin.com/feed/update/urn:li:activity:7364194597717073925/
2
Forwarded from DeepMind AI Expert (Farzad 🦅)
اندرو کارپثی گفته بود:
Can you take my 2h13m tokenizer video and translate [into] a book chapter.

We've done it! It includes prose, code & key images. It's a great way to learn this key piece of how LLMs work.
https://www.fast.ai/posts/2025-10-16-karpathy-tokenizers

https://solve.it