Forwarded from Reza Jafari
مدلی جمعوجور اما قوی؛ نگاهی به EmbeddingGemma گوگل
مدل EmbeddingGemma یکی از جدیدترین مدلهای گوگل در حوزهی text embedding هست که با وجود حجم کم، عملکرد چشمگیری ارائه میده. این مدل فقط ۳۰۸ میلیون پارامتر داره اما در بنچمارک معتبر MTEB تونسته در میان مدلهای زیر ۵۰۰ میلیون، جزو بهترینها باشه. همین ویژگی باعث شده هم سبک و سریع باشه، هم دقت بالایی داشته باشه.
ساختار EmbeddingGemma بر پایهی Gemma3 طراحی شده و برخلاف بسیاری از مدلهای مشابه که صرفاً از causal attention استفاده میکنن، این مدل از bi-directional attention بهره میبره. نتیجه اینه که مثل یک encoder قدرتمند عمل میکنه و در وظایفی مثل semantic search یا retrieval کیفیت بهتری نشون میده. ورودیهای طولانی تا حدود ۲۰۴۸ توکن رو پردازش میکنه و خروجی اولیهاش یک بردار ۷۶۸ بعدی هست. علاوه بر این، با کمک روش Matryoshka Representation Learning (MRL) میشه ابعاد رو تا ۱۲۸ کاهش داد، بدون افت محسوس در کیفیت.
از نظر کاربرد، EmbeddingGemma دامنهی گستردهای رو پوشش میده: از semantic search و دستهبندی و خوشهبندی متن گرفته تا retrieval-augmented generation (RAG) و حتی code search. این مدل با ابزارهایی مثل Sentence Transformers، LangChain، LlamaIndex و Haystack بهطور کامل سازگاره و همین باعث میشه هم در محیطهای سروری و هم روی دستگاههای شخصی یا حتی در مرورگرها بهراحتی استفاده بشه، بدون نیاز به اینترنت و مصرف حافظهای کمتر از 200 مگابایت در نسخههای کوانتایز شده.
دادههای آموزشی EmbeddingGemma شامل حدود ۳۲۰ میلیارد توکن از منابع مختلف مثل متون عمومی، مستندات فنی، دادههای کد و دادههای ساختهشده برای وظایف خاصه. تمام این دادهها پیش از آموزش با دقت انتخاب و فیلتر شدن تا کیفیت و ایمنی نهایی مدل حفظ بشه.
قابلیت fine-tuning هم یکی از نقاط قوت اصلی این مدل محسوب میشه. برای نمونه، نسخهای که روی دیتاست پزشکی MIRIAD بازآموزی فاین تون شده، عملکردی بهتر از مدلهایی با دو برابر اندازه نشون داده. این یعنی EmbeddingGemma برای حوزههای تخصصی هم بهراحتی قابل تطبیقه و میتونه خروجی قابل اعتماد ارائه بده.
در مجموع، EmbeddingGemma مدلی سبک، سریع و امنه که در عین حال چندزبانه هم هست. ترکیب این ویژگیها باعث میشه گزینهای ایدهآل برای پژوهشگران، توسعهدهندگان و شرکتهایی باشه که به دنبال یک راهکار کارآمد برای تولید embedding با کیفیت بالا و هزینهی پایین هستن.
🔗 لینک صفحه hf مدل
🔤 🔤 🔤 🔤 🔤 🔤 🔤
🥇 اهورا اولین اپراتور هوش مصنوعی راهبردی ایران در حوزه ارائه خدمات و سرویسهای زیرساخت هوش مصنوعی
🛍 کد تخفیف ۱۰ درصدی محصولات اهورا برای اعضای کانال
🌐 لینک وبسایت اهورا
@reza_jafari_ai
مدل EmbeddingGemma یکی از جدیدترین مدلهای گوگل در حوزهی text embedding هست که با وجود حجم کم، عملکرد چشمگیری ارائه میده. این مدل فقط ۳۰۸ میلیون پارامتر داره اما در بنچمارک معتبر MTEB تونسته در میان مدلهای زیر ۵۰۰ میلیون، جزو بهترینها باشه. همین ویژگی باعث شده هم سبک و سریع باشه، هم دقت بالایی داشته باشه.
ساختار EmbeddingGemma بر پایهی Gemma3 طراحی شده و برخلاف بسیاری از مدلهای مشابه که صرفاً از causal attention استفاده میکنن، این مدل از bi-directional attention بهره میبره. نتیجه اینه که مثل یک encoder قدرتمند عمل میکنه و در وظایفی مثل semantic search یا retrieval کیفیت بهتری نشون میده. ورودیهای طولانی تا حدود ۲۰۴۸ توکن رو پردازش میکنه و خروجی اولیهاش یک بردار ۷۶۸ بعدی هست. علاوه بر این، با کمک روش Matryoshka Representation Learning (MRL) میشه ابعاد رو تا ۱۲۸ کاهش داد، بدون افت محسوس در کیفیت.
از نظر کاربرد، EmbeddingGemma دامنهی گستردهای رو پوشش میده: از semantic search و دستهبندی و خوشهبندی متن گرفته تا retrieval-augmented generation (RAG) و حتی code search. این مدل با ابزارهایی مثل Sentence Transformers، LangChain، LlamaIndex و Haystack بهطور کامل سازگاره و همین باعث میشه هم در محیطهای سروری و هم روی دستگاههای شخصی یا حتی در مرورگرها بهراحتی استفاده بشه، بدون نیاز به اینترنت و مصرف حافظهای کمتر از 200 مگابایت در نسخههای کوانتایز شده.
دادههای آموزشی EmbeddingGemma شامل حدود ۳۲۰ میلیارد توکن از منابع مختلف مثل متون عمومی، مستندات فنی، دادههای کد و دادههای ساختهشده برای وظایف خاصه. تمام این دادهها پیش از آموزش با دقت انتخاب و فیلتر شدن تا کیفیت و ایمنی نهایی مدل حفظ بشه.
قابلیت fine-tuning هم یکی از نقاط قوت اصلی این مدل محسوب میشه. برای نمونه، نسخهای که روی دیتاست پزشکی MIRIAD بازآموزی فاین تون شده، عملکردی بهتر از مدلهایی با دو برابر اندازه نشون داده. این یعنی EmbeddingGemma برای حوزههای تخصصی هم بهراحتی قابل تطبیقه و میتونه خروجی قابل اعتماد ارائه بده.
در مجموع، EmbeddingGemma مدلی سبک، سریع و امنه که در عین حال چندزبانه هم هست. ترکیب این ویژگیها باعث میشه گزینهای ایدهآل برای پژوهشگران، توسعهدهندگان و شرکتهایی باشه که به دنبال یک راهکار کارآمد برای تولید embedding با کیفیت بالا و هزینهی پایین هستن.
AHURA5@reza_jafari_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from نوشتههای ترمینالی
یه ویژگی جالب (و البته عجیب) که مدت هاست در گولنگ وجود داره ولی من تازه کشفش کردم امکان دانلود toolchainئه. به شکل خاص، از گولنگ ۱.۲۱ گولنگ این امکان رو داره که بر اساس نسخه گولنگی که توی go.mod نوشتین، خودش موقع فراخوانی کامندهای go، بره و toolchain مناسب رو دانلود کنه و یه جا قرار بده و نیاز نباشه شما اصلا درگیر چیزی بشین.
https://kokada.dev/blog/quick-bits-go-automatically-downloads-a-newer-toolchain-if-needed/
نکته خوبش طبیعتا راحتیشه. نکته منفیای که دوستش ندارم اینه که بدون اجازه کاربر میره و یه binary از یه جایی که خودش میدونه دانلود میکنه و اجرا میکنه.
https://kokada.dev/blog/quick-bits-go-automatically-downloads-a-newer-toolchain-if-needed/
نکته خوبش طبیعتا راحتیشه. نکته منفیای که دوستش ندارم اینه که بدون اجازه کاربر میره و یه binary از یه جایی که خودش میدونه دانلود میکنه و اجرا میکنه.
Forwarded from Linuxor ?
اگه خواستین TensorFlow یاد بگیرین این لیست رو یه نگاهی بندازین، کلی منبع از کتاب بگیر تا پروژه های از قبل آماده توش هست، TensorFlow یه فریمورک متنبازه که توسط گوگل ساخته شده برای کار با یادگیری ماشین و شبکههای عصبی. اصل ایدهش اینه که بتونی محاسبات پیچیده ریاضی (مثل ماتریسها و تنسورها) رو به شکل راحتتری پیاده کنی و بعد اونها رو روی سختافزارهای مختلف (CPU، GPU یا حتی TPU) اجرا کنی.
github.com/jtoy/awesome-tensorflow
@Linuxor
github.com/jtoy/awesome-tensorflow
@Linuxor
Forwarded from linuxtnt(linux tips and tricks) (hosein seilany https://seilany.ir/)
اموزش دستور rfkill
برای مشاهده وضعیت بلوک بودن سخت افزاری و نرم افزاری سخت افزارهایی از قبیل :بلوتوس و وایرلس از این دستور استفاده می نماییم. در صورتی که device بلوک شده باشد در خروجی مقدار yes داده می شود. با دستور unblock میتوان وسیله مورد نظر را از بلوک خارج نمود
در صورتی که device بلوک شده باشد در خروجی مقدار yes :
root@kalihost:~# rfkill list
0: phy0: Wireless LAN
Soft blocked: no
Hard blocked: no
1: hci0: Bluetooth
Soft blocked: no
Hard blocked: no
2: hp-wifi: Wireless LAN
Soft blocked: no
Hard blocked: no
3: hp-bluetooth: Bluetooth
Soft blocked: no
Hard blocked: no
برای unblockکردن device
$sudo rfkill unblock all
حسین_سیلانی
Learninghive.ir
برای مشاهده وضعیت بلوک بودن سخت افزاری و نرم افزاری سخت افزارهایی از قبیل :بلوتوس و وایرلس از این دستور استفاده می نماییم. در صورتی که device بلوک شده باشد در خروجی مقدار yes داده می شود. با دستور unblock میتوان وسیله مورد نظر را از بلوک خارج نمود
در صورتی که device بلوک شده باشد در خروجی مقدار yes :
root@kalihost:~# rfkill list
0: phy0: Wireless LAN
Soft blocked: no
Hard blocked: no
1: hci0: Bluetooth
Soft blocked: no
Hard blocked: no
2: hp-wifi: Wireless LAN
Soft blocked: no
Hard blocked: no
3: hp-bluetooth: Bluetooth
Soft blocked: no
Hard blocked: no
برای unblockکردن device
$sudo rfkill unblock all
حسین_سیلانی
Learninghive.ir
Forwarded from Linuxor ?
کسایی که توی پروژه های تیمی بودن می دونن تقسیم پروژه چه کار سختیه Bit میتونه کمک کنه پروژهت رو به کامپوننتهای مستقل تقسیم کنی، با نسخهبندی خودکار و اسمگذاری (مثل org/ui.button) دیگه نیازی نیست همهچیز رو تو یه رپو نگه داری. فرض کن یکی فقط داره فرمها رو توسعه میده، یکی داره backend رو؛ هرکدوم میتونن کامپوننتهای خودشون رو جدا ببینن و منتشر کنن.
مستندات :
bit.dev/docs/intro
@Linuxor
مستندات :
bit.dev/docs/intro
@Linuxor
Forwarded from کدنویس یکروزه
Media is too big
VIEW IN TELEGRAM
فقط یک برنامه ولی قابل نصب
در اپل، اندروید یا ویندوز!
از سال ۲۰۱۶ این تکنیک به برنامه نویسان هدیه شده! یعنی دیگه برای هیچ نرم افزار تحت وب لازم نیست دوباره کدنویسی بشه تا با آیکون مناسب روی گوشی یا لپتاپ نصب بشن!
همونطور که در فیلم هم میگم فقط کافیه حتماً طبق آموزش دو تا فایل به همراه آیکون های مد نظر کنار فایلهای هر سایتی کپی شده باشه و این نرم افزار حتماً تحت سِرور اجرا شده باشه!
بعد از نصب ممکنه حتا بسته به عملکرد برنامه نیازی به اینترنت هم دیگه برای اجرای اپ های نصب شده با این روش نباشه! یعنی فقط جایی که ارجاع به دیتابیس و سرچ لازمه ممکنه بره سراغ اینترنت و برای ورق زدن صفحات کاملاً آفلاین عمل می کنه!
در ادامه کدهای نمونه رو هم میفرستم هرچند که با یک اپ ساده و رایگان هوش مصنوعی می تونید به اونها دسترسی داشته باشین و یا حتا برای یک سایت وردپرس با افزونه اونو فعال کنید! فراموش نکنید که تا این فایلها روی یک سِرور نباشن کار نمی کنن.
در اپل، اندروید یا ویندوز!
از سال ۲۰۱۶ این تکنیک به برنامه نویسان هدیه شده! یعنی دیگه برای هیچ نرم افزار تحت وب لازم نیست دوباره کدنویسی بشه تا با آیکون مناسب روی گوشی یا لپتاپ نصب بشن!
همونطور که در فیلم هم میگم فقط کافیه حتماً طبق آموزش دو تا فایل به همراه آیکون های مد نظر کنار فایلهای هر سایتی کپی شده باشه و این نرم افزار حتماً تحت سِرور اجرا شده باشه!
بعد از نصب ممکنه حتا بسته به عملکرد برنامه نیازی به اینترنت هم دیگه برای اجرای اپ های نصب شده با این روش نباشه! یعنی فقط جایی که ارجاع به دیتابیس و سرچ لازمه ممکنه بره سراغ اینترنت و برای ورق زدن صفحات کاملاً آفلاین عمل می کنه!
در ادامه کدهای نمونه رو هم میفرستم هرچند که با یک اپ ساده و رایگان هوش مصنوعی می تونید به اونها دسترسی داشته باشین و یا حتا برای یک سایت وردپرس با افزونه اونو فعال کنید! فراموش نکنید که تا این فایلها روی یک سِرور نباشن کار نمی کنن.
Forwarded from کدنویس یکروزه
dice.zip
42.2 KB
نمونه برنامهی تاس به صورت PWA یا برنامهی قابل نصب در هر سیستم عامل که برای فعال شدن امکان نصب باید حتماً روی یک هاست یا سِرور وب قرار بگیرد.
Forwarded from Linuxor ?
این هم یه جایگزین دیگه برای گوگل آنالیتیکس، ظاهرش سادس و فعال سازی و ثبت نامش هم سادس یه ایمیل میخواد و یه اسکریپت بهتون میده توی سایتتون میزارین، اوپن سورس هم هست
تست آنلاین :
eu.umami.is/share/LGazGOecbDtaIwDr/umami.is
@Linuxor
تست آنلاین :
eu.umami.is/share/LGazGOecbDtaIwDr/umami.is
@Linuxor
Forwarded from Armon technical logs (armon Taheri)
برای نوشتن کامند لاین خیلی دنبال یه سورس خوب و قابل اتکا بودم که بشه ازش الهام گرفت و اصولی cli نوشت بهترین چیزی که توی این مدت پیدا کردم این کتگوری دیسکورس اوبونتو بود
https://discourse.ubuntu.com/c/design-system/cli-guidelines/62
https://discourse.ubuntu.com/c/design-system/cli-guidelines/62
Ubuntu Community Hub
CLI Guidelines
The CLI guidelines are Canonical’s best practices around designing command line tools and console UIs.
Forwarded from IRCF | اینترنت آزاد برای همه
This media is not supported in your browser
VIEW IN TELEGRAM
دو مدالآور المپیاد جهانی نجوم میگویند #فیلترینگ، حتی سایتهای علمی و ویکیپدیا را از دسترسشان خارج کرده و مانعی بزرگ در مسیر پژوهش است.
بعد میگوییم چرا نخبهها میروند ...
© AzadehMokhtari
🔍 ircf.space
@ircfspace
بعد میگوییم چرا نخبهها میروند ...
© AzadehMokhtari
🔍 ircf.space
@ircfspace
Forwarded from Abolfazl Devs (ixAbolfazl)
این ریپو اومده یه لیستی از چیزایی که اپن سورس هست و میتونید سلف هاست کنید رو گزاشته
از وی پی ان تا پسورد منیجر و تایم ترکر و کلی چیزای دیگه
اگه ازونایی هستید که حریم خصوصی براتون خیلی مهمه و میخواید کنترل همه چیز دست خودتون باشه میتونه براتون کاربردی باشه
لینک ریپو👇
https://github.com/awesome-selfhosted/awesome-selfhosted
📌 ixAbolfazl | @abolfazl_devs
این ریپو اومده یه لیستی از چیزایی که اپن سورس هست و میتونید سلف هاست کنید رو گزاشته
از وی پی ان تا پسورد منیجر و تایم ترکر و کلی چیزای دیگه
اگه ازونایی هستید که حریم خصوصی براتون خیلی مهمه و میخواید کنترل همه چیز دست خودتون باشه میتونه براتون کاربردی باشه
لینک ریپو👇
https://github.com/awesome-selfhosted/awesome-selfhosted
📌 ixAbolfazl | @abolfazl_devs
Forwarded from کدنویس یکروزه
ساخت یک انجمن گفتگوی ساده
یا همان شبکههای اجتماعی
بعد از نسل ۱ وب که فقط صفحات کاتالوگی و اطلاع رسانی یکطرفه به صورت صفحات وب ساده و HTML بود،
در نسل ۲ وب نوبت به انجمن ها رسید که با کمک زبانهایی مثل PHP و اتصال به بانک اطلاعات امکان درج گفتگو و تعامل کاربران و فضای تعاملی و دوطرفه ایجاد شد.
در شروع کار هم،
طبعاً خبری از داشتن تصاویر و ارسال عکس و فیلم نبود! یعنی انجمن های گفتگو فقط و فقط متن و اسامی نویسندگان رو نشون میدادن! در واقع توئیتر از این الگو هنوز تبعیت می کنه.
اینجا یک نمونه کد از اون انجمن ها رو داریم که سعی کردم تا حدودی رابط کاربری رو به فارسی برگردونم!
در ادامه کد اون رو هم ارسال می کنم. ولی کد انگلیسی رو هم میشه از این آدرس گرفت.
https://www.sourcecodester.com/php/16423/simple-forum-website-using-php-and-sqlite3-source-code-free-download.html
یا همان شبکههای اجتماعی
بعد از نسل ۱ وب که فقط صفحات کاتالوگی و اطلاع رسانی یکطرفه به صورت صفحات وب ساده و HTML بود،
در نسل ۲ وب نوبت به انجمن ها رسید که با کمک زبانهایی مثل PHP و اتصال به بانک اطلاعات امکان درج گفتگو و تعامل کاربران و فضای تعاملی و دوطرفه ایجاد شد.
در شروع کار هم،
طبعاً خبری از داشتن تصاویر و ارسال عکس و فیلم نبود! یعنی انجمن های گفتگو فقط و فقط متن و اسامی نویسندگان رو نشون میدادن! در واقع توئیتر از این الگو هنوز تبعیت می کنه.
اینجا یک نمونه کد از اون انجمن ها رو داریم که سعی کردم تا حدودی رابط کاربری رو به فارسی برگردونم!
در ادامه کد اون رو هم ارسال می کنم. ولی کد انگلیسی رو هم میشه از این آدرس گرفت.
https://www.sourcecodester.com/php/16423/simple-forum-website-using-php-and-sqlite3-source-code-free-download.html
SourceCodester
Simple Forum Website using PHP and SQLite3 Source Code Free Download
This is a simple project entitled Simple Forum Website. It is a web-based application that provides an online platform to a small organization to discuss certain and different topics that only their verified and approved users are allowed to access.
Forwarded from کدنویس یکروزه
forum.zip
1.4 MB
کد فارسی شده انجمن گفتگوی ساده
با کد کاربری : admin
و رمز عبور : password
با کد کاربری : admin
و رمز عبور : password
Forwarded from کدنویس یکروزه
تصویر نمونه از نسخهی فارسی شده انجمن ساده با داده های آزمایشی که کاربران عادی وقتی توسط ادمین تأیید شوند قادر به ارسال پست و کامنت گذاری برای پست های دیگران خواهند بود.
تصور کنید نیازمند یک سیستم ارسال و دریافت سادهی پیام در سازمان خود هستید که فارغ از شبکه های اجتماعی عمومی و اختصاصی برای خودتان باشد. این قطعاً نمونه ای عالی می تواند باشد!
تصور کنید نیازمند یک سیستم ارسال و دریافت سادهی پیام در سازمان خود هستید که فارغ از شبکه های اجتماعی عمومی و اختصاصی برای خودتان باشد. این قطعاً نمونه ای عالی می تواند باشد!
Forwarded from 🎄 یک برنامه نویس تنبل (Lazy 🌱)
This media is not supported in your browser
VIEW IN TELEGRAM
🔶 قسمت جدید طراحی سایت شرکتی با لاراول ۱۲ منتشر شد.
۸- ایجاد صفحه معرفی
قیمت دوره با تخفیف ۴۰ درصد : ۹۰۰,۰۰۰ تومان
https://rayium.ir/course/?p=1613
#لاراول
@TheRaymondDev
۸- ایجاد صفحه معرفی
قیمت دوره با تخفیف ۴۰ درصد : ۹۰۰,۰۰۰ تومان
https://rayium.ir/course/?p=1613
#لاراول
@TheRaymondDev
Forwarded from Gopher Academy
🔵 عنوان مقاله
Go 1.25 Released
🟢 خلاصه مقاله:
انتشار Go 1.25 همزمان با تعطیلات نویسنده بود و باعث شد پوشش فوری آن ممکن نشود. بااینحال این نسخه، مطابق روال نسخههای جزئی گو، بهبودهای تدریجی در پایداری، کارایی و تجربه توسعهدهنده ارائه میدهد. توصیه میشود یادداشتهای انتشار بررسی شود، نسخه جدید در محیط آزمایشی امتحان گردد و ارتقا بهصورت کنترلشده انجام شود. بهزودی مرور دقیقتری از نکات برجسته و تغییرات ظریف یا موارد از ردهخارج ارائه خواهد شد. از تلاشهای تیم و مشارکتکنندگان گو نیز قدردانی میشود.
🟣لینک مقاله:
https://golangweekly.com/link/173113/web
➖➖➖➖➖➖➖➖
👑 @gopher_academy
Go 1.25 Released
🟢 خلاصه مقاله:
انتشار Go 1.25 همزمان با تعطیلات نویسنده بود و باعث شد پوشش فوری آن ممکن نشود. بااینحال این نسخه، مطابق روال نسخههای جزئی گو، بهبودهای تدریجی در پایداری، کارایی و تجربه توسعهدهنده ارائه میدهد. توصیه میشود یادداشتهای انتشار بررسی شود، نسخه جدید در محیط آزمایشی امتحان گردد و ارتقا بهصورت کنترلشده انجام شود. بهزودی مرور دقیقتری از نکات برجسته و تغییرات ظریف یا موارد از ردهخارج ارائه خواهد شد. از تلاشهای تیم و مشارکتکنندگان گو نیز قدردانی میشود.
🟣لینک مقاله:
https://golangweekly.com/link/173113/web
➖➖➖➖➖➖➖➖
👑 @gopher_academy
go.dev
Go 1.25 is released - The Go Programming Language
Go 1.25 adds container-aware GOMAXPROCS, testing/synctest package, experimental GC, experimental encoding/json/v2, and more.