VIRSUN
14.7K subscribers
225 photos
163 videos
1 file
164 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
😎 وقتی با این همه علم هوش مصنوعی از سر کار برمی‌گردی، حس می‌کنی یه ابرقهرمان دیجیتالی هستی!

🕺 هوش مصنوعی روی شونه‌ت
🎧 پرامپت‌ها توی ذهنت
💻 و کلی پروژه توی لپ‌تاپت!

📍 @rss_ai_ir
#زندگی_با_AI #حس_خفن #مهندس_هوش_مصنوعی #techvibes
😁2👍1🕊1
💠 نسل جدید دارایی‌های سه‌بعدی با ویژگی‌های فیزیکی واقعی PhysX‑3D:

داده بساز، رفتار فیزیکی شبیه‌سازی کن، مدل سه‌بعدی واقعی بساز.
---

🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکت‌های سه‌بعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکت‌پذیری و...) را نیز تولید می‌کند.

📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:

📌 توزیع اجزای مدل‌ها (شکل a):
اکثر آبجکت‌ها بین 1 تا 20 جزء دارند، که نشان‌دهنده طراحی ساده و کاربردی است.

📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازه‌ای بین 50 تا 200 سانتی‌متر دارند؛ بسیار مناسب برای کاربردهای واقع‌گرایانه مثل متاورس، AR/VR یا ربات‌ها.

📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتی‌اند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.

📌 خواص فیزیکی مواد (شکل c - میانی و راست):

* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³

📌 توزیع موضوعی داده‌ها (شکل d):
ابر کلمات نشان می‌دهد بیشترین آبجکت‌ها شامل:
Furniture, Table, Chair, Lamp, Lighting, Cabinet هستند.

📌 PhysXNet-XL (شکل e)
نسخه بزرگ‌تر دیتاست با تولید رویه‌ای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.

---

🎯 این آمار نشون می‌ده که:

* دیتاست بسیار گسترده و تنوع‌پذیر طراحی شده.
* ویژگی‌های فیزیکی کاملاً قابل کنترل و واقعی‌اند.
* کاربرد در رباتیک، بازی‌سازی، شبیه‌سازهای صنعتی و آموزش مدل‌های فیزیک‌محور بسیار بالاست.

🖥 Github: https://github.com/ziangcao0312/PhysX-3D

📕 Paper: https://arxiv.org/pdf/2507.12465v1.pdf

🔗 Dataset: https://paperswithcode.com/dataset/shapenet

📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir

#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سه‌بعدی #AI_3D
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 سنسور‌ال‌ام (SensorLM)؛ ساعتی که شما را مثل کتاب می‌خواند!

گوگل با استفاده از حدود ۶۰ میلیون ساعت داده ناشناس از ساعت‌های هوشمند فیت‌بیت و پیکسل واچ، مدلی توسعه داده که قادر است اطلاعات خامی مثل ضربان قلب، تعداد قدم‌ها و دمای بدن را به زبان طبیعی تبدیل کند.

📌 به‌جای نمایش نمودارهای خشک، این مدل جملاتی مانند این تولید می‌کند:
«بعد از نوشیدن دومین فنجان قهوه، سطح استرس افزایش یافت، اما یک پیاده‌روی ۱۵ دقیقه‌ای شما را به تعادل برگرداند.»

📊 روش کار تیم گوگل به این صورت بود:
۱. ساخت دیتاست عظیم شامل ۲.۵ میلیون روز فعالیت انسانی از ۱۲۷ کشور
۲. ایجاد برچسب‌گذاری چندلایه برای هر روز:
آمار: «پالس بین ۵۴ تا ۱۷۸، میانگین ۷۲»
ساختار: «افزایش تدریجی ضربان از ساعت ۱۱ تا ۱۲ ظهر»
معنا: «تمرین قدرتی به مدت ۲۶ دقیقه»
۳. آموزش ترنسفورمر چندوجهی با دو هدف:
مقایسه بین داده‌ی سنسور و متن (مثل مدل کلیپ)
تولید توضیح متنی (مثل مدل کوکا)

🚀 توانایی‌های این مدل شامل موارد زیر است:
✔️ شناسایی دقیق فعالیت و استرس بدون نیاز به آموزش مجدد
✔️ پاسخ به درخواست‌هایی مانند «چه زمانی استرسم بالا بود؟» با بازه‌های زمانی دقیق
✔️ تطبیق با سبک زندگی کاربر تنها با چند نمونه

📌 مدل SensorLM، داده‌های سنسوری دقیقه‌ای را به زبان انسانی تبدیل می‌کند؛ حرکتی مهم برای از بین بردن شکاف میان داده‌ی خام و درک انسانی.
📄 مقاله: لینک
📎 بلاگ: لینک
📡 @rss_ai_ir
#سلامت_هوشمند #هوش_مصنوعی #گوگل #SensorLM #پوشیدنی #CLIP #CoCa #سلامت #AI
2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مدل Aleph از Runway؛ فتوشاپی برای ویدیو، اما با جادوی هوش مصنوعی!

پلتفرم Runway به‌تازگی از مدل Aleph رونمایی کرده؛ مدلی که می‌توان آن را «فوتوشاپ برای ویدیو» نامید – البته فعلاً فقط برای ویدیوهای ۵ ثانیه‌ای!

🧪 این مدل به کاربران اجازه می‌دهد تا:

🎭 چهره‌ها، اجسام و صحنه‌ها را با دستورات متنی یا بصری تغییر دهند

🖌 بافت و استایل دلخواه را به کلیپ‌ها اضافه کنند

🪄 ویدیوها را فریم به فریم ادیت کنند، بدون نیاز به مهارت فنی در تدوین


🧠 از پایه برای ویرایش و بازسازی واقع‌گرایانه ویدیو طراحی شده؛ درست مثل یک مدل مولد قدرتمند که دنیای گرافیک را متحول می‌کند.

📎 اطلاعات بیشتر:
https://runwayml.com/research/introducing-runway-aleph

🧩 نتیجه؟ همان‌طور که Stable Diffusion عکاسی را تغییر داد، Aleph نیز آماده است تا تدوین ویدیو را متحول کند.

🎬 منتظر ویدیوهای خلاقانه‌تر، کوتاه‌تر و باحال‌تر از همیشه باشید!

📡 @rss_ai_ir
#ویدیو_هوشمند #runway #Aleph #هوش_مصنوعی #ویرایش_ویدیو #مدل_مولد #AI
👍2🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
📚 حالت Study Mode به ChatGPT اضافه شد!

✳️هوش مصنوعی دیگه فقط برای گرفتن جواب نیست! با ویژگی جدید OpenAI، یعنی Study Mode، یادگیری تعاملی و هدفمند وارد مرحله تازه‌ای شده.

🧠 در این حالت:
♻️به‌جای دادن پاسخ نهایی، مدل سوال‌های راهنما می‌پرسه
♻️آموزش رو مرحله‌به‌مرحله جلو می‌بره
♻️سطح شما، هدف یادگیری و حتی تاریخچه چت‌ها رو در نظر می‌گیره
♻️کوییز می‌گیره، نکات رو ارزیابی می‌کنه و یادگیری فعال رو تقویت می‌کنه


🔍 این یعنی ChatGPT تبدیل میشه به یک معلم خصوصی که:
♻️شما رو به فکر کردن وادار می‌کنه
♻️مفاهیم سخت رو با تصویرسازی شفاف توضیح میده (در نسخه‌های آینده)
♻️و به‌مرور پیشرفت‌تون رو دنبال می‌کنه


🎓 برای همه کاربران نسخه رایگان، پلاس، پرو و تیم فعال شده. هنوز در مرحله ابتدایی هست ولی با بازخورد کاربرها قراره بهتر هم بشه!

📎 chatgpt.com/study
🔸 @rss_ai_ir
#مطالعه_هوشمند #آموزش_تعاملی #هوش_مصنوعی #ChatGPT #StudyMode #یادگیری
👍31🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🛥 استفاده‌ی هوشمندانه از عامل ChatGPT برای کنترل دوربین مداربسته!

✳️در این کاربرد جذاب، یک عامل (Agent) مبتنی بر ChatGPT به صورت زنده دوربین نظارتی را کنترل می‌کند — دنبال یک قایق فیروزه‌ای رنگ می‌گردد و سعی می‌کند نام نوشته‌شده روی آن را بخواند.

📸 چه کارهایی انجام می‌دهد؟

♻️خودش دوربین را زوم می‌کند
♻️زاویه را به سمت چپ یا راست تغییر می‌دهد
♻️زاویه دید مناسب را انتخاب می‌کند
♻️و در طول کار، به‌صورت زنده گزارش عملکردش را می‌دهد:
«زوم می‌کنم... کمی به چپ حرکت می‌دم... دوربین را می‌چرخونم تا زاویه بهتری بگیرم...»


⚡️ نتیجه؟
این عامل به‌خوبی از عهده‌ی کاری برمی‌آید که تا همین چند وقت پیش فقط از انسان‌ها برمی‌آمد.

🔸 @rss_ai_ir
#هوش_مصنوعی #عامل_هوشمند #دوربین_هوشمند #ChatGPT #AI_Agent
👍32🔥1👏1
📸 رتبه‌بندی جدید مدل‌های تولید تصویر با هوش مصنوعی منتشر شد
@rss_ai_ir

🏆 مدل «Seedream 3.0» از شرکت ByteDance موفق شد جایگاه نخست را از GPT-4o بگیرد و در صدر قرار گیرد.

📉 مدل GPT-4o از OpenAI با اختلافی اندک در رتبه دوم قرار گرفته و مدل‌های مختلف Imagen 4 از گوگل همچنان در تعقیب هستند اما هنوز به صدر نرسیده‌اند.

📅 این مدل‌ها همگی در بازه زمانی فروردین تا خرداد ۱۴۰۴ منتشر شده‌اند و رقابت میان آن‌ها شدیدتر از همیشه است.

⚙️ نکته جالب آن است که Seedream تنها با یک کارت گرافیک اجرا می‌شود و با این حال دقت بالایی دارد.

آیا عصر جدیدی برای تولید تصویر با هوش مصنوعی آغاز شده؟
آیا گوگل می‌تواند در به‌روزرسانی بعدی صدر را پس بگیرد؟

📲 دیدگاه شما درباره این رقابت چیست؟

#هوش_مصنوعی #مدل_تصویرساز #تولید_تصویر
@rss_ai_ir
👍1🔥1👏1
🎬 تحولی بزرگ در نسل جدید تولید ویدیو با هوش مصنوعی
@rss_ai_ir

در کمتر از یک سال، سطح تولید ویدیو توسط مدل‌های هوش مصنوعی جهش قابل توجهی داشته. در حال حاضر می‌توان با اطمینان گفت که گوگل با مدل Veo 3 در صدر قرار دارد؛ چه از نظر کیفیت خروجی و چه از نظر تجربه کاربری.

📝 یکی از جذاب‌ترین قابلیت‌های این مدل، امکان تولید ویدیو بر اساس «استوری‌بورد» یا همان طرح اولیه صحنه‌هاست. کافیست یک طرح ساده یا دیاگرام حرکتی از صحنه موردنظر بارگذاری کنید تا مدل، حرکت دوربین، اشیاء و افکت‌ها را مطابق آن تولید کند.

🎥 چنین چیزی تا چند سال پیش غیرقابل تصور بود! حالا نه‌تنها ممکن شده، بلکه در حال ورود به بازار حرفه‌ای سینماست.

📉 با اینکه قیمت این ابزارها برای کاربران عادی هنوز بالاست، اما در مقایسه با هزینه‌های ساخت سریال یا فیلم در استودیوها، مقرون‌به‌صرفه و سریع‌تر است. به‌همین دلیل، نتفلیکس به‌تازگی برای اولین‌بار از فوتیج تولید شده با هوش مصنوعی در یکی از سریال‌هایش استفاده کرده.

🔄 این چرخه یعنی:
«کارایی → صرفه‌جویی → کیفیت بیشتر → سود → کارایی بیشتر»

📌 کاربرد این مدل‌ها در صنعت فیلم و انیمیشن فقط شروع ماجراست.

#تولید_ویدیو #هوش_مصنوعی #Veo
@rss_ai_ir
2🔥2😱1🙏1
📉 کاهش چشمگیر نرخ نادیده‌گرفتن هشدارها با کمک AI در پزشکی
@rss_ai_ir

نمودار بالا نشان می‌دهد چگونه نرخ نادیده‌گیری هشدارهای قرمز (left in red rate) در پزشکانی که از دستیار هوشمند (AI) استفاده کردند به‌مرور کاهش یافت.

🔹 در شروع (ژانویه ۲۰۲۵)، هر دو گروه (با و بدون AI) نرخ مشابهی در حدود ۳۵ تا ۴۰ درصد داشتند.
🔹 اما از هفته اول مارس به بعد — یعنی شروع استفاده کامل از AI — پزشکان گروه هوشمند عملکرد بهتری نشان دادند و نرخ نادیده‌گیری به زیر ۲۰٪ کاهش یافت.

یعنی پزشکان بیشتر با توصیه‌های سیستم موافقت کردند و خطاها را اصلاح کردند.

💬 تمامی پزشکان این گروه (۱۰۰٪) گفتند که AI باعث بهبود کیفیت درمان شده و ۷۵٪ هم تأثیر آن را "قابل‌توجه" دانستند.

یکی از آن‌ها گفته:
«این سیستم بارها من را در تصمیم‌گیری‌های بالینی درست یاری کرد.»
دیگری آن را «مشاور داخل مطب» نامیده.

📚 همچنین با گذشت زمان، پزشکان کمتر مرتکب اشتباهات تکراری می‌شدند — یعنی در واقع از سیستم یاد می‌گرفتند.

📌 در هیچ‌یک از توصیه‌های AI، موردی ثبت نشد که پیشنهاد آن برای بیمار مضر باشد — حتی یک‌بار هم نه.

📎 اگر علاقه‌مند به پیاده‌سازی چنین سیستمی در کلینیک یا مرکز درمانی خود هستید، تمام دستورالعمل‌ها (prompts) در مقاله اصلی موجود است:
https://cdn.openai.com/pdf/a794887b-5a77-4207-bb62-e52c900463f1/penda_paper.pdf

📩 برای مشاوره مستقیم در همین حوزه به ما پیام دهید.
@rss_ai_ir

#پزشکی_هوشمند #هوش_مصنوعی #AIinMedicine #سلامت_دیجیتال
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 گامی به سوی مغز واحد برای ربات‌ها
@rss_ai_ir

✳️تیمی از بهترین متخصصان رباتیک دنیا در حال توسعه یک مغز هوش مصنوعی واحد هستند — سیستمی که بتواند هر نوع رباتی را در هر وظیفه‌ای کنترل کند.

♻️نه صرفاً یک قطعه کد، بلکه ذهنی عمومی برای تمام جهان ماشین‌هاست.

🔧 از ربات‌های صنعتی تا انسان‌نماها، هدف ایجاد زبانی واحد برای فهم، تصمیم‌گیری و اجراست — درست مثل مغز انسان.

🌐 آینده‌ای که در آن هر ربات بدون نیاز به برنامه‌ریزی اختصاصی می‌تواند آموزش ببیند، تطبیق پیدا کند و مستقل عمل کند، حالا دور از دسترس نیست.

#رباتیک #هوش_مصنوعی #AI #اتوماسیون #فناوری_روز
👍3🔥1👏1
📚 یکی از بهترین دوره‌های رایگان برای یادگیری تقویتی!

♻️دانشگاه UCL با همکاری DeepMind دوره‌ای ۲۰ ساعته ارائه داده که به‌جرئت میشه گفت یکی از کامل‌ترین و محبوب‌ترین منابع آموزش یادگیری تقویتی تو دنیاست.


🔍 از مفاهیم پایه مثل Q-Learning و SARSA شروع می‌کنه، بعد سراغ الگوریتم‌های پیشرفته‌تری مثل Rainbow DQN می‌ره و در ادامه مفاهیمی مثل off-policy، eligibility trace و multi-step learning رو هم با دقت آموزش می‌ده.

🎓 تا الان بیش از ۲۵۰ هزار نفر از محقق‌ها و توسعه‌دهنده‌های AI ازش استفاده کردن.


📺 ویدئوها روی یوتیوب هستن
💻 کدها و پروژه‌ها توی گیت‌هاب
🔗 لینک‌ها:
YouTube Playlist
GitHub Repo

#یادگیری_تقویتی #هوش_مصنوعی #RL #AI

@rss_ai_ir
3🔥1👏1
🔍 تفاوت بین دوربین صنعتی (مثل Basler) و دوربین‌های معمولی چیه؟
@rss_ai_ir

خیلی از افراد فکر می‌کنن همه دوربین‌ها یکی هستن؛ اما دوربین‌های صنعتی مثل Basler برای دنیای مهندسی و صنعت طراحی شدن، نه فقط برای عکس گرفتن!

📌 تفاوت‌های اصلی:

پایداری و دقت بالا
دوربین صنعتی می‌تونه ساعت‌ها بدون وقفه کار کنه، با نویز بسیار کم و ثبات فوق‌العاده در شرایط نوری مختلف.

کنترل‌پذیری بالا
دوربین‌های صنعتی از طریق نرم‌افزارهایی مثل pypylon یا GenICam قابل کنترل کامل هستن؛ حتی میشه exposure، gain، trigger و بسیاری از پارامترها رو به‌صورت برنامه‌نویسی‌شده تغییر داد.

سینک شدن با خط تولید
در پروژه‌های صنعتی، لازمه دوربین دقیقاً در لحظه‌ای خاص عکس بگیره؛ این کار با پورت‌های Trigger و I/O امکان‌پذیره — چیزی که دوربین‌های معمولی ندارن.

سنسور حرفه‌ای
سنسور دوربین صنعتی طراحی شده برای اندازه‌گیری، پردازش تصویر، بینایی ماشین، نه فقط زیبایی عکس! به همین خاطر دقت رنگ و جزئیات در نور کم بسیار بهتره.

رابط‌های صنعتی (GigE, USB3 Vision)
برخلاف دوربین‌های معمولی که اکثراً USB2 دارن، دوربین‌های Basler معمولاً از GigE یا USB3 Vision پشتیبانی می‌کنن تا سرعت بالا و انتقال بدون تأخیر داده‌ها در محیط‌های صنعتی تضمین بشه.

🚀 پس اگه دنبال دوربینی هستی که بشه روش برای کاربردهای بینایی ماشین، کنترل کیفیت، یا اتوماسیون صنعتی حساب کرد، دوربین‌های معمولی جواب نمی‌دن؛ باید بری سراغ صنعتی‌ها مثل Basler.

#بینایی_ماشین #دوربین_صنعتی #Basler #بینایی_ماشین #MachineVision #هوش_مصنوعی
👍3👏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🧺 ربات Figure 02 حالا می‌تونه ماشین لباسشویی رو روشن کنه و کار باهاش رو یاد بگیره!

این یعنی یک قدم دیگه به سمت ربات‌هایی که کارهای روزمره‌ خونه رو انجام می‌دن 👕🤖

ربات با استفاده از هوش مصنوعی نه‌تنها ماشین لباسشویی رو شناسایی کرده، بلکه موفق شده مراحل روشن‌کردن و راه‌اندازی اون رو اجرا کنه — دقیقاً مثل یک انسان!

این قابلیت نشون می‌ده که چطور مدل‌های چندمنظوره مثل Figure 02 می‌تونن از تماشا و تجربه یاد بگیرن و وارد زندگی واقعی ما بشن.

📌 @rss_ai_ir
#رباتیک #هوش_مصنوعی #ربات_خانگی #Figure02 #روبات_لباسشویی #روبات_خدمتکار
👍5👏1👌1
🔧 مدل جدید Mistral برای برنامه‌نویسی سازمانی معرفی شد!

شرکت Mistral با معرفی اکوسیستم کامل توسعه‌ نرم‌افزار، حالا رقیب جدی GitHub Copilot محسوب میشه. هسته این سیستم، مدل‌های خانواده Codestral هستن — به‌ویژه نسخه جدید Codestral 25.08.

📌 بهبودهای کلیدی:

♻️افزایش ۳۰٪ در پذیرش تکمیل خودکار کد توسط توسعه‌دهنده‌ها
♻️افزایش ۱۰٪ در مقدار کدی که بعد از پیشنهاد حفظ میشه
♻️کاهش ۵۰٪ در تولید کدهای طولانی و اشتباه
♻️در حالت چت هم عملکرد بهتر شده؛ طبق ارزیابی IF Eval v8 و آزمون MultiplE، دقت و مهارت برنامه‌نویسی این مدل حدود ۵٪ افزایش داشته.

🔍 مرحله بعدی: جستجوی معنایی در کل پروژه مدل Codestral Embed برای تولید امبدینگ برداری اختصاصی کد طراحی شده. طبق تست‌های واقعی بازیابی کد، از امبدینگ‌های OpenAI و Cohere بهتر عمل می‌کنه. حتی امکان تنظیم ابعاد امبدینگ (تا ۲۵۶ بعد با INT8) هم فراهمه.

🛠 وقتی بافت مرتبط پیدا شد، نوبت به Agentها می‌رسه: سیستم Devstral برای انجام کارهایی مثل ری‌فکتور، تولید تست و ساخت Pull Request فعاله. مدل Devstral Small روی یک GPU مثل RTX 4090 یا Mac با ۳۲GB RAM اجرا میشه.

نتایج بنچمارک SWE-Bench:

Devstral Small: امتیاز ۵۳.۶٪

Devstral Medium: امتیاز ۶۱.۶٪
(بالاتر از Claude 3.5 و GPT-4.1-mini)


🧩 همه این قابلیت‌ها در افزونه Mistral Code برای IDEهای JetBrains و VS Code قابل استفاده‌ست. افزونه نه‌تنها کد رو کامل می‌کنه، بلکه وظایف تکراری مثل نوشتن commit یا docstring رو با کمک Devstral انجام می‌ده.

✳️قابلیت‌ها:
♻️پشتیبانی از Git diff و تاریخچه ترمینال
♻️جستجوی معنایی

استفاده محلی یا ابری با امنیت سازمانی (SSO، audit log، بدون تلِمتری اجباری)


📌 @rss_ai_ir
#هوش_مصنوعی #برنامه‌نویسی #کد_اتوماتیک #Mistral #Codestral #Devstral
👍2🔥1👏1
📦 کتابخانه LangExtract از گوگل؛ استخراج ساختار از متن به کمک هوش مصنوعی

🔍 گوگل به‌تازگی از LangExtract رونمایی کرده؛ یک کتابخانه اپن‌سورس پایتون برای استخراج اطلاعات ساختار‌یافته از متون بلند، با بهره‌گیری از مدل‌های LLM مثل Gemini.

📌 ویژگی‌های برجسته LangExtract:

ردیابی دقیق منبع اطلاعات:
هر داده‌ای که استخراج می‌شود (مثل نام، تاریخ یا دوز دارو)، به مکان دقیق آن در متن اصلی اشاره دارد. این یعنی می‌توان منشأ دقیق اطلاعات را بررسی کرد.

فرمت خروجی قابل‌اعتماد و مشخص:
با استفاده از چند مثال و تعیین ساختار موردنظر، خروجی همیشه فرمتی منسجم و قابل‌پیش‌بینی دارد.

پشتیبانی از متون بسیار طولانی:
متن‌ها به بخش‌هایی تقسیم شده و به‌صورت موازی پردازش می‌شوند. این باعث افزایش دقت و مقیاس‌پذیری در داده‌های سنگین می‌شود.

نمایش گرافیکی HTML:
با خروجی تعاملی HTML می‌توانید هزاران برچسب استخراج‌شده را در متن به‌صورت بصری بررسی کنید.

سازگار با LLMهای مختلف:
گرچه توسط گوگل توسعه یافته، اما فقط محدود به Gemini نیست. می‌توانید از مدل‌های دیگر به‌صورت محلی یا ابری استفاده کنید.

قابلیت غنی‌سازی با دانش عمومی مدل‌ها:
بعضی داده‌ها ممکن است از "دانش درونی" مدل استخراج شوند؛ مثلاً اطلاعاتی که صراحتاً در متن نیست اما مدل بر اساس دانش عمومی خود پیشنهاد می‌دهد.

🔬 کاربرد اصلی اولیه: تحلیل گزارش‌های پزشکی گوگل در دمو RadExtract نشان داده که این ابزار چگونه می‌تواند از گزارش‌های رادیولوژی، داده‌های مهم را استخراج و ساختاردهی کند.

🧪 دمو آنلاین: RadExtract در Hugging Face
📚 توضیح رسمی: مقاله وبلاگ گوگل
💾 سورس‌کد: LangExtract در گیت‌هاب
🔖 لایسنس: Apache 2.0

@rss_ai_ir
#استخراج_اطلاعات #هوش_مصنوعی #Google #LangExtract #LLM #پردازش_زبان_طبیعی
2👍1🙏1