در هفته ای ک گذشت چه مقالاتی در رشته علوم پزشکی منتشر شد:
◾️ Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
◾️ LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction
◾️ RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment
◾️ CTP-LLM: Clinical Trial Phase Transition Prediction Using Large Language Models
◾️ Hibou: A Family of Foundational Vision Transformers for Pathology
◾️ LLaVA-Surg: Towards Multimodal Surgical Assistant via Structured Surgical Video Learning
◾️ MEDCO: Medical Education Copilots Based on A Multi-Agent Framework
◾️ Clinical Insights: A Comprehensive Review of Language Models in Medicine
◾️ FEDKIM: Adaptive Federated Knowledge Injection into Medical Foundation Models
◾️ MSDiagnosis: An EMR-based Dataset for Clinical Multi-Step Diagnosis
#ایده_جذاب #علوم_پزشکی #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
◾️ LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction
◾️ RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment
◾️ CTP-LLM: Clinical Trial Phase Transition Prediction Using Large Language Models
◾️ Hibou: A Family of Foundational Vision Transformers for Pathology
◾️ LLaVA-Surg: Towards Multimodal Surgical Assistant via Structured Surgical Video Learning
◾️ MEDCO: Medical Education Copilots Based on A Multi-Agent Framework
◾️ Clinical Insights: A Comprehensive Review of Language Models in Medicine
◾️ FEDKIM: Adaptive Federated Knowledge Injection into Medical Foundation Models
◾️ MSDiagnosis: An EMR-based Dataset for Clinical Multi-Step Diagnosis
#ایده_جذاب #علوم_پزشکی #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍9👌3🆒2👎1
تعدادی مقاله #هوش_مصنوعی جالب رو میتونین موضوعات رو دنبال کنید
◾️ Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model
◾️ To Code, or Not To Code? Exploring Impact of Code in Pre-training
◾️ Automated Design of Agentic Systems
◾️ LLM Pruning and Distillation in Practice: The Minitron Approach
◾️ Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model
◾️ To Code, or Not To Code? Exploring Impact of Code in Pre-training
◾️ Automated Design of Agentic Systems
◾️ LLM Pruning and Distillation in Practice: The Minitron Approach
◾️ Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4
😁16
Select which of the following are true for non-singular matrices.
Anonymous Poll
52%
In a non-singular matrix, rows are linearly independent.
21%
In a non-singular matrix a row can be a multiple of the other one.
21%
In a non-singular matrix, rows are linearly dependent.
36%
In a non-singular matrix there is only a unique solution for the represented system of equations
Forwarded from زندگی به عنوان سرویس
This media is not supported in your browser
VIEW IN TELEGRAM
این ویدئو باحاله. میاد تمام مکانیزم Feed Forward توی یه شبکهی عصبی چند لایه(MLP) رو با دست و روی کاغذ جلو میبره و تمام محاسبات رو هم انجام میده.
#video
#learning
#ML
@lifeAsAService
#video
#learning
#ML
@lifeAsAService
❤5👍3
بسیاری از ماها که در #هوش_مصنوعی فعالیت میکنیم و سرعت انتشار مدلهای متن باز هر روز داره بیشتر میشه و میخواییم سهم کوچک خودمون رو برای زبان فارسی انجام بدیم اما با کمبود مدلهای فاین توین شده و ترین کردن طرف بودیم و الان تیمی قوی از دوستانی حرفه ای و کاربلد این کارو انجام دادند اینجا میتونین داستان اینکه چطوری بزرگترین مدل زبان فارسی منتشر شده رو بخونین و از parsbench استفاده کنید.
https://hooshio.com/parsbench-persian-llms/
https://github.com/ParsBench/ParsBench
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://hooshio.com/parsbench-persian-llms/
https://github.com/ParsBench/ParsBench
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
هوشیو
پارسبنچ: ابزاری نوین برای ارزیابی مدلهای بزرگ زبانی فارسی
ابزار پارسبنچ ابزاری برای سنجش قدرت مدلهای زبانی در تواناییهای فارسی است که به صورت بازمتن منتشر شده.
👍3❤1
Asabani
Shayea
❤8😁4👎3👍2🔥1
آیا VLM ها می توانند اشعه ایکس قفسه سینه واقع گرایانه را از توضیحات متن تولید کنند؟
▪️ A vision-language foundation model for generating realistic chest X-rays from text prompts
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ A vision-language foundation model for generating realistic chest X-rays from text prompts
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍5❤3👎1
Forwarded from DeepMind AI Expert (Farzad 🦅)
Robust NLP Models.pdf
1.6 MB
Building Robust NLP Models with Data augmentaion
#کتاب #پردازش_زبان_طبیعی #الگوریتمها
#book
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
#کتاب #پردازش_زبان_طبیعی #الگوریتمها
#book
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤3
دوستان یک سرور دیسکورد ساختن داخل اون به صورت گروهی به مطالعه پایتون، ریاضی و هوش مصنوعی و.... میپردازند
در حال استارت زدن ریاضیات هوش مصنوعی و clean code هستند
اونجا هستیم اگه دوست داشتین بیایین اونجا رفع اشکال درس میخونیم
https://discord.com/invite/qhCqN6Am
در حال استارت زدن ریاضیات هوش مصنوعی و clean code هستند
اونجا هستیم اگه دوست داشتین بیایین اونجا رفع اشکال درس میخونیم
https://discord.com/invite/qhCqN6Am
👍10❤5
آیا مدل های یادگیری عمیق می توانند گزارش های رادیولوژی را مانند رادیولوژیست های انسانی به درستی درک کنند؟
▪️ Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍7
تعدادی مقاله راجب RAG که تازه به دستم رسید😁
[1] Meta Knowledge for Retrieval Augmented Large Language Models
[2] RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation
[3] Graph Retrieval-Augmented Generation: A Survey
[4] CommunityKG-RAG: Leveraging Community Structures in Knowledge Graphs for Advanced Retrieval-Augmented Generation in Fact-Checking
[5] W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
[1] Meta Knowledge for Retrieval Augmented Large Language Models
[2] RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation
[3] Graph Retrieval-Augmented Generation: A Survey
[4] CommunityKG-RAG: Leveraging Community Structures in Knowledge Graphs for Advanced Retrieval-Augmented Generation in Fact-Checking
[5] W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👌5👍1
تعدادی مقاله جالب
[1] SelectLLM: Query-Aware Efficient Selection Algorithm for Large Language Models
[2] Open-FinLLMs: Open Multimodal Large Language Models for Financial Application
[3] LLM Pruning and Distillation in Practice: The Minitron Approach
[4] A Strategy to Combine 1stGen Transformers and Open LLMs for Automatic Text Classification
[5] Flexora: Flexible Low Rank Adaptation for Large Language Models
[6] StructuredRAG: JSON Response Formatting with Large Language Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
[1] SelectLLM: Query-Aware Efficient Selection Algorithm for Large Language Models
[2] Open-FinLLMs: Open Multimodal Large Language Models for Financial Application
[3] LLM Pruning and Distillation in Practice: The Minitron Approach
[4] A Strategy to Combine 1stGen Transformers and Open LLMs for Automatic Text Classification
[5] Flexora: Flexible Low Rank Adaptation for Large Language Models
[6] StructuredRAG: JSON Response Formatting with Large Language Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤4👍2
انتشار مدلهای قدرتمند Qwen2-VL
تیم Qwen امروز اعلام کرد که نسخه جدید مدلهای Qwen2-VL را منتشر کردهاند. این مجموعه شامل مدلهای Qwen2-VL-2B و Qwen2-VL-7B است که تحت مجوز متنباز Apache 2.0 عرضه شدهاند، و API مدل قدرتمند Qwen2-VL-72B نیز در دسترس قرار گرفته است.
این مدلها در فهم تصاویر، ویدیوهای طولانی و پشتیبانی چندزبانه به سطوح بیسابقهای از دقت رسیدهاند. همچنین، در اکثر معیارهای ارزیابی، عملکرد Qwen2-VL از مدلهای پیشرفتهای مانند GPT-4 و Claude 3.5 Sonnet بهتر بوده است.
این مدل از اکثر زبانها از جمله فارسی پشتیبانی میکند.
🔗 برای آشنایی بیشتر و دریافت این مدلها، به لینکهای زیر مراجعه کنید:
- وبلاگ Qwen2-VL
- گیتهاب Qwen2-VL
- هاگینگفیس
- توییت مربوطه
#ایده_جذاب #مدل_متن_باز
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
تیم Qwen امروز اعلام کرد که نسخه جدید مدلهای Qwen2-VL را منتشر کردهاند. این مجموعه شامل مدلهای Qwen2-VL-2B و Qwen2-VL-7B است که تحت مجوز متنباز Apache 2.0 عرضه شدهاند، و API مدل قدرتمند Qwen2-VL-72B نیز در دسترس قرار گرفته است.
این مدلها در فهم تصاویر، ویدیوهای طولانی و پشتیبانی چندزبانه به سطوح بیسابقهای از دقت رسیدهاند. همچنین، در اکثر معیارهای ارزیابی، عملکرد Qwen2-VL از مدلهای پیشرفتهای مانند GPT-4 و Claude 3.5 Sonnet بهتر بوده است.
این مدل از اکثر زبانها از جمله فارسی پشتیبانی میکند.
🔗 برای آشنایی بیشتر و دریافت این مدلها، به لینکهای زیر مراجعه کنید:
- وبلاگ Qwen2-VL
- گیتهاب Qwen2-VL
- هاگینگفیس
- توییت مربوطه
#ایده_جذاب #مدل_متن_باز
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍8👎1😁1
Forwarded from Recommender system (MehriMah Amiri)
شرکت NVIDIA مدلي به نام NVEagle را عرضه کرده که یک مدل پیشرفته برای ترکیب بینایی و زبان است. این مدل در سه نسخه 7B، 13B و 13B بهینهسازیشده برای چت ارائه شده است. این مدل از روشهای مختلفی برای ادغام خروجیهای انکودرهای تصویر و استفاده از متخصصین مختلف (MoE) بهره میبرد.
در این مدل، برای ادغام تخصصها، خروجیهای انکودرهای تصویر از طریق concatenation به هم متصل میشوند و سپس مرحلهای به نام "pre-alignment" اجرا میشود که در آن متخصصین با انکودر متن ثابت بهینهسازی میشوند. سپس متخصصین و دیکودر فریز شده و تنها لایه پروجکشن آموزش داده میشود، و در نهایت همه اجزا برای بهینهسازی نظارتی باز میشوند.
معماری اصلی مدل شباهت زیادی به مدل LLaVA دارد.
Model repository: link
Try it here: link
در این مدل، برای ادغام تخصصها، خروجیهای انکودرهای تصویر از طریق concatenation به هم متصل میشوند و سپس مرحلهای به نام "pre-alignment" اجرا میشود که در آن متخصصین با انکودر متن ثابت بهینهسازی میشوند. سپس متخصصین و دیکودر فریز شده و تنها لایه پروجکشن آموزش داده میشود، و در نهایت همه اجزا برای بهینهسازی نظارتی باز میشوند.
معماری اصلی مدل شباهت زیادی به مدل LLaVA دارد.
Model repository: link
Try it here: link
👍5❤1
استاد بزرگ اندرو کارپثی لیست سیلاب های یادگیری llm رو درست کرده خیلی منابع عالیی هستش
https://github.com/karpathy/LLM101n
#ایده_جذاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://github.com/karpathy/LLM101n
#ایده_جذاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤9👍3
This media is not supported in your browser
VIEW IN TELEGRAM
خفن های دنیا در کنفرانس #پایتورچ همه در 18تا19 سپتامبر دور هم در سانفرانسیکو کالیفرنیا جمع میشن کسایی ک میتونن برن جای مارو خالی کنن
https://events.linuxfoundation.org/pytorch-conference/
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://events.linuxfoundation.org/pytorch-conference/
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤8👍4