روش Chain-of-Verification (CoVe) چیه؟
📝یه روش چهار مرحلهای که کمک میکنه هوش مصنوعی جوابهای دقیقتر و قابل اعتمادتر بده. تو هر مرحله، هوش مصنوعی کاری میکنه که جواب اولیهاش رو بررسی و بهتر کنه.
1⃣ تولید جواب اولیه
هوش مصنوعی یه پاسخ اولیه میده که شامل اطلاعات اصلی و جزئیات مهمه. این جواب ساختار مشخصی داره تا منظم باشه.
2⃣ ساخت سوالات بررسی
هوش مصنوعی درباره جواب خودش سوالهایی میسازه که نقاط ضعف یا ابهامات رو هدف میگیرن. این سوالات دقیق و هدفمندن و هر کدوم به یه بخش
خاص از جواب اولیه میپردازن.
3⃣ تایید جوابها
هوش مصنوعی جواب سوالاتش رو بررسی میکنه، تناقضها یا کمبودهای اطلاعاتی رو پیدا میکنه و اونها رو با منابع معتبر مقایسه میکنه.
4⃣اصلاح و نهاییسازی
جواب نهایی با اطلاعات تایید شده ساخته میشه، ادعاهای بدون مدرک حذف یا اصلاح میشن و میزان اطمینان هم شفاف اعلام میشه.
📰 @scopeofai | #news
📝یه روش چهار مرحلهای که کمک میکنه هوش مصنوعی جوابهای دقیقتر و قابل اعتمادتر بده. تو هر مرحله، هوش مصنوعی کاری میکنه که جواب اولیهاش رو بررسی و بهتر کنه.
1⃣ تولید جواب اولیه
هوش مصنوعی یه پاسخ اولیه میده که شامل اطلاعات اصلی و جزئیات مهمه. این جواب ساختار مشخصی داره تا منظم باشه.
2⃣ ساخت سوالات بررسی
هوش مصنوعی درباره جواب خودش سوالهایی میسازه که نقاط ضعف یا ابهامات رو هدف میگیرن. این سوالات دقیق و هدفمندن و هر کدوم به یه بخش
خاص از جواب اولیه میپردازن.
3⃣ تایید جوابها
هوش مصنوعی جواب سوالاتش رو بررسی میکنه، تناقضها یا کمبودهای اطلاعاتی رو پیدا میکنه و اونها رو با منابع معتبر مقایسه میکنه.
4⃣اصلاح و نهاییسازی
جواب نهایی با اطلاعات تایید شده ساخته میشه، ادعاهای بدون مدرک حذف یا اصلاح میشن و میزان اطمینان هم شفاف اعلام میشه.
📰 @scopeofai | #news
🔥2💅1
🔵 یه تحقیق از arxiv روی برنامهنویسهای حرفهای نشون داده که وقتی اونا از هوش مصنوعی استفاده میکنن، برعکس انتظار، کارشون کندتر پیش میره. چون باید وقت بذارن تا دستورات درست بنویسن و کدهای هوش مصنوعی رو هم بررسی کنن. در کل حدود ۲۰٪ کارشون بیشتر طول میکشه.
💬 اما جالب اینه که خود برنامهنویسها فکر میکنن با هوش مصنوعی سریعتر شدن. مشکل اینه که به هوش مصنوعی خیلی اعتماد میکنن، در حالی که جوابهاش همیشه درست نیست و تو پروژههای بزرگ زیاد به دردشون نمیخوره.
✔️ ولی مسلما برای پروژههای کوچیکتر، هوش مصنوعی خیلی کمککنندهست.
📰 @scopeofai | #news
💬 اما جالب اینه که خود برنامهنویسها فکر میکنن با هوش مصنوعی سریعتر شدن. مشکل اینه که به هوش مصنوعی خیلی اعتماد میکنن، در حالی که جوابهاش همیشه درست نیست و تو پروژههای بزرگ زیاد به دردشون نمیخوره.
✔️ ولی مسلما برای پروژههای کوچیکتر، هوش مصنوعی خیلی کمککنندهست.
A new arXiv study found that, contrary to expectations, experienced developers working with AI actually finished tasks 19% slower. They spent extra time crafting the right prompts and reviewing AI-generated code, even though most believed they were faster with AI — likely due to overtrusting AI, which isn't always reliable, especially in large projects
📰 @scopeofai | #news
🔥1👏1👌1💅1
👨💻بیل گیتس پیشبینی کرده که برنامهنویسی حداقل تا ۱۰۰ سال آینده شغل انسان باقی میمونه. با وجود پیشرفتهای سریع هوش مصنوعی، گیتس معتقده که کدنویسی نیاز به خلاقیت، قضاوت و تفکر عمیق داره که AI نمیتونه از پسش بر بیاد
📰 @scopeofai | #news
Programming would remain a human job for at least the next 100 years. says Bill Gates. Despite rapid advancements in AI, he believes coding requires creativity, judgment, and deep thinking—qualities that AI cannot replicate.https://www.newsbytesapp.com/news/science/programming-wont-be-automated-for-100-years-says-bill-gates/tldr
📰 @scopeofai | #news
❤1👎1🔥1
🎥 علیبابا داره روی مدل Lumos-1 برای ساخت ویدیو کار میکنه
🔍 مدلی که فقط با استفاده از ۴۸ تا GPU آموزش دیده! این عدد خیلی کمیه چون مدلهای مشابه حداقل به هزاران GPU برای آموزش دیدن نیاز داشتن.
🎯 برای کاهش هزینههای آموزش و تولید ویدیو، این خیلی قدم بزرگیه.
https://quantumzeitgeist.com/lumos-1-generates-video-using-minimal-llm-changes-and-multimodal-rope-encoding/
📰 @scopeofai | #news
🔍 مدلی که فقط با استفاده از ۴۸ تا GPU آموزش دیده! این عدد خیلی کمیه چون مدلهای مشابه حداقل به هزاران GPU برای آموزش دیدن نیاز داشتن.
🎯 برای کاهش هزینههای آموزش و تولید ویدیو، این خیلی قدم بزرگیه.
Alibaba is working on the Lumos-1 model for video generation.
This model was trained using only 48 GPUs! That’s a very small number compared to similar models, which require thousands of GPUs for training.
This is a huge step forward in reducing the costs of training and producing videos.
https://quantumzeitgeist.com/lumos-1-generates-video-using-minimal-llm-changes-and-multimodal-rope-encoding/
📰 @scopeofai | #news
🤯1
🔴 یوتیوب شورتز داره یه قابلیت جدید اضافه میکنه که میتونی عکس رو انتخاب کنی و تبدیلش کنه به یه ویدیوی کوتاه ۶ ثانیهای. این ویدیوها با هوش مصنوعی Veo 2 ساخته میشن. این قابلیت اول واسه آمریکا، کانادا، استرالیا و نیوزیلند میاد، بعدش برای کشورهای دیگه هم فعال میشه.
📰 @scopeofai | #news
YouTube Shorts is rolling out new AI tools! Now you can take a photo from your phone and instantly turn it into a short 6‑second video clip, thanks to their “image-to-video” feature. They’ve also added fun AI effects. like turning doodles into images or making your selfie look like you're swimming underwater. All this is powered by Google's Veo 2 and will be available soon in the US, Canada, Australia, and New Zealand, with more countries on the way
📰 @scopeofai | #news
👕 گوگل یه قابلیت جدید آورده که میتونی باهاش لباسها رو مجازی بپوشی. کافیه عکس خودت رو آپلود کنی و ببینی لباس رو تنت چطوره. این ویژگی تو آمریکا راهاندازی شده و تو سرچ گوگل، گوگل شاپینگ و نتایج تصاویر کار میکنه.
📰 @scopeofai | #news
Google’s got a new AI feature to virtually try on clothes! Just upload your photo to see how
they look on you. It’s live in the US across Google Search, Shopping, and Images.
📰 @scopeofai | #news
آیا هوش مصنوعی واقعاً میتونه جایگزین برنامهنویسها بشه؟
🧑🏻💻یه تیم از MIT میگه ابزارهای هوش مصنوعی خوبن واسه نوشتن تکههای کوچیک کد، ولی …
دنیای واقعی برنامهنویسی شامل کارهایی مثل بازنویسی کد، جابجایی سیستمهای قدیمی، رفع باگهای پیچیده، تستنویسی، مستندسازی، بررسی تغییرات، بهینهسازی عملکرد و صد تا کار دیگهست که خیلی فراتر از نوشتن یه تابع سادهس.
اونا سه تا مشکل بزرگ رو مشخص کردن:
1️⃣ هوش مصنوعیهای فعلی فقط روی کارهای ساده تمرکز کردن و از پیچیدگی واقعی پروژهها غافلان.
2️⃣ ارتباط انسان با هوش مصنوعی خیلی سطحیه؛ مدلها توضیح نمیدن چقدر مطمئنن یا چرا این جواب رو دادن.
3️⃣ هوش مصنوعی هنوز نمیتونه با دیتابیسهای بزرگ و قوانین و ساختار خاص شرکتها کنار بیاد.
🙏 خلاصه اینکه فعلا نگران جایگزین شدن نباشین...
https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716
📰 @scopeofai | #news
🧑🏻💻یه تیم از MIT میگه ابزارهای هوش مصنوعی خوبن واسه نوشتن تکههای کوچیک کد، ولی …
دنیای واقعی برنامهنویسی شامل کارهایی مثل بازنویسی کد، جابجایی سیستمهای قدیمی، رفع باگهای پیچیده، تستنویسی، مستندسازی، بررسی تغییرات، بهینهسازی عملکرد و صد تا کار دیگهست که خیلی فراتر از نوشتن یه تابع سادهس.
اونا سه تا مشکل بزرگ رو مشخص کردن:
1️⃣ هوش مصنوعیهای فعلی فقط روی کارهای ساده تمرکز کردن و از پیچیدگی واقعی پروژهها غافلان.
2️⃣ ارتباط انسان با هوش مصنوعی خیلی سطحیه؛ مدلها توضیح نمیدن چقدر مطمئنن یا چرا این جواب رو دادن.
3️⃣ هوش مصنوعی هنوز نمیتونه با دیتابیسهای بزرگ و قوانین و ساختار خاص شرکتها کنار بیاد.
🙏 خلاصه اینکه فعلا نگران جایگزین شدن نباشین...
https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716
📰 @scopeofai | #news
🔥1💅1
📊 نسبت به پارسال کلیکهایی که از طریق هوش مصنوعی به سایتای تاپ رفتن ۳۵۷٪ بیشتر شده و رسیده به ۱.۱۳ میلیارد. این افزایش بیشتر از سمت چتجیپیتی بوده.
این قضیه کسب و کارها رو نگران کرده. مخصوصا خبرگزاریها عنوان کردن AI Overviews داره ترافیک سایتهاشون رو به صورت خطرناکی پایین میآره.
https://techcrunch.com/2025/07/25/ai-referrals-to-top-websites-were-up-357-year-over-year-in-june-reaching-1-13b/
📰 @scopeofai | #news
این قضیه کسب و کارها رو نگران کرده. مخصوصا خبرگزاریها عنوان کردن AI Overviews داره ترافیک سایتهاشون رو به صورت خطرناکی پایین میآره.
In June 2025, AI-driven clicks to big websites jumped crazy — up 357% from last year, hitting 1.13 billion! Most of this boost comes from ChatGPT
https://techcrunch.com/2025/07/25/ai-referrals-to-top-websites-were-up-357-year-over-year-in-june-reaching-1-13b/
📰 @scopeofai | #news
❤1
⚠️ سم آلتمن گفته اگه از ChatGPT به عنوان تراپیست استفاده میکنید و رازهاتون رو بهش میگید؛ بدونید که چت هاتون محرمانه نیست.
چت کردن با ChatGPT مثل صحبت با پزشک یا وکیل امن نیست و اگر یه دعوا یا شکایت پیش بیاد، میتونن چتهارو ارائه بدن.
https://techcrunch.com/2025/07/25/sam-altman-warns-theres-no-legal-confidentiality-when-using-chatgpt-as-a-therapist/
📰 @scopeofai | #news
چت کردن با ChatGPT مثل صحبت با پزشک یا وکیل امن نیست و اگر یه دعوا یا شکایت پیش بیاد، میتونن چتهارو ارائه بدن.
Using ChatGPT like your therapist doesn’t make your secrets legally private.
He warned that chats with ChatGPT aren’t protected like they are with real professionals such as doctors or lawyers. If you're sharing personal stuff and there’s a lawsuit, your conversations could be made public in court.
https://techcrunch.com/2025/07/25/sam-altman-warns-theres-no-legal-confidentiality-when-using-chatgpt-as-a-therapist/
📰 @scopeofai | #news
👌1
✍🏻 امروز یه مقاله خیلی کوتاه ولی جالب به چشمم خورد.
💻 عنوانش اینه: بررسی خودکار کد با استفاده از مدلهای زبانی بزرگ و منطق سمبولیک
یعنی ترکیب هوش مصنوعی (مثل چتجیپیتی) با ابزارهای منطقی برای بررسی دقیقتر کد برنامهنویسی.
🧶 بریم با هم تحلیلش کنیم...
🔰 @scopeofai | #papers
💻 عنوانش اینه: بررسی خودکار کد با استفاده از مدلهای زبانی بزرگ و منطق سمبولیک
یعنی ترکیب هوش مصنوعی (مثل چتجیپیتی) با ابزارهای منطقی برای بررسی دقیقتر کد برنامهنویسی.
🧶 بریم با هم تحلیلش کنیم...
✍🏻 Today i read a really short essay but an interesting one.
Automated Code Review Using Large Language Models with Symbolic Reasoning
💻 We’re teaching AI how to review code better by combining smart chatbots (like ChatGPT) with logic-based tools that actually understand how the code works.
🧶 Let's review it together...
🔰 @scopeofai | #papers
💅1
چکیده؛ ایده بزرگ چیه؟
🧑💻 بررسی دستی کدها وقتگیره و ممکنه کلی خطا داشته باشه.
مدلهای زبانی مثل GPT میتونن کمک کنن، اما همیشه دقیق نیستن.
🪢 این مقاله یک روش ترکیبی معرفی میکنه که مدلهای زبانی رو با ابزارهای منطقی (که ساختار و رفتار دقیق کد رو بررسی میکنن) ترکیب میکنه تا نتیجهای بهتر و قابلاعتمادتر ارائه بشه.
🔰 @scopeofai | #papers
🧑💻 بررسی دستی کدها وقتگیره و ممکنه کلی خطا داشته باشه.
مدلهای زبانی مثل GPT میتونن کمک کنن، اما همیشه دقیق نیستن.
🪢 این مقاله یک روش ترکیبی معرفی میکنه که مدلهای زبانی رو با ابزارهای منطقی (که ساختار و رفتار دقیق کد رو بررسی میکنن) ترکیب میکنه تا نتیجهای بهتر و قابلاعتمادتر ارائه بشه.
Abstract – What’s the big idea?
🧑💻 Code review (checking if code is good, clean, and bug-free) takes time and energy. People make mistakes.
LLMs (like ChatGPT) can help, but they sometimes give wrong or vague feedback.
This paper mixes AI with logical tools that double-check the code’s behavior (e.g., “will this crash?”, “is this variable used correctly?”). The mix makes the feedback smarter and more reliable.
🔰 @scopeofai | #papers
💅1
مقدمه؛ چرا به همچین چیزی نیاز داریم؟
🐌 بررسی کد جزو کارهای مهم در توسعه نرمافزاره ولی وقت زیادی میگیره.
مدلهای زبانی سریع عمل میکنن اما ممکنه نکات منطقی و دقیق رو متوجه نشن.
هدف مقاله اینه که سرعت و انعطاف مدلهای زبانی با دقت ابزارهای منطقی ترکیب کنه
🔰 @scopeofai | #papers
🐌 بررسی کد جزو کارهای مهم در توسعه نرمافزاره ولی وقت زیادی میگیره.
مدلهای زبانی سریع عمل میکنن اما ممکنه نکات منطقی و دقیق رو متوجه نشن.
هدف مقاله اینه که سرعت و انعطاف مدلهای زبانی با دقت ابزارهای منطقی ترکیب کنه
Introduction – Why do we need this?
🐌 Programmers spend a lot of time reviewing code.
Code reviews can be inconsistent because people have different styles.
AI tools are fast, but they don’t always understand the actual logic of the code.
The authors want to fix this by adding a second brain: a logical checker that looks at how the code works behind the scenes.
🔰 @scopeofai | #papers
💅1
کارهای مرتبط؛ چه چیزایی قبلا انجام شده؟
👩🏫 روشهای قبلی بیشتر به مدلهای زبانی متکی بودن، که بیشتر ظاهر کد رو میفهمن نه منطق دقیقش رو.
ابزارهای منطقی هم وجود دارن، اما خشک و محدودن.
اینجا نویسندهها این دو رو ترکیب کردن تا هم دقت بالا بره و هم انعطاف حفظ بشه.
🔰 @scopeofai | #papers
👩🏫 روشهای قبلی بیشتر به مدلهای زبانی متکی بودن، که بیشتر ظاهر کد رو میفهمن نه منطق دقیقش رو.
ابزارهای منطقی هم وجود دارن، اما خشک و محدودن.
اینجا نویسندهها این دو رو ترکیب کردن تا هم دقت بالا بره و هم انعطاف حفظ بشه.
Related Work – What has been done before?
👩🏫 People have tried using AI alone to review code.
These models are good at style and basic errors.
But they’re bad at deep logic, like checking if code always behaves correctly or crashes in edge cases.
Symbolic reasoning tools (used in compilers or formal methods) are good at logic but not flexible.
So why not combine both?
🔰 @scopeofai | #papers
💅1
روششناسی، این سیستم چطور کار میکنه؟
روش کار سیستمشون اینجوریه:
🔩 یه مدل هوش مصنوعی (مثل CodeT5 یا CodeBERT) کد رو میخونه و پیشنهاد میده.
یه موتور منطقی هم هست که با استفاده از استدلال سمبولیک، کد رو عمیقتر چک میکنه، مثلاً:
🔹آیا متغیرها درست استفاده شدن؟
🔹 ممکنه کد crash کنه؟
🔹 آیا باگ منطقی داره؟
بعد این دو تا رو با هم ترکیب میکنن تا بهینهتر در مورد کد کامنت بدن.
یعنی به جای اینکه فقط بگن «این اشتباهه»، میگن چرا اشتباهه و طوری که قابل فهم باشه.
🔰 @scopeofai | #papers
روش کار سیستمشون اینجوریه:
🔩 یه مدل هوش مصنوعی (مثل CodeT5 یا CodeBERT) کد رو میخونه و پیشنهاد میده.
یه موتور منطقی هم هست که با استفاده از استدلال سمبولیک، کد رو عمیقتر چک میکنه، مثلاً:
🔹آیا متغیرها درست استفاده شدن؟
🔹 ممکنه کد crash کنه؟
🔹 آیا باگ منطقی داره؟
بعد این دو تا رو با هم ترکیب میکنن تا بهینهتر در مورد کد کامنت بدن.
یعنی به جای اینکه فقط بگن «این اشتباهه»، میگن چرا اشتباهه و طوری که قابل فهم باشه.
Methodology – How does their system work?
Here’s what they built, in simple steps:
🔩 An AI model (like CodeT5 or CodeBERT) reads the code and makes suggestions.
A logic engine (symbolic reasoning tool) also checks the code for deep issues, like:
🔹Are variables used right?
🔹Could this crash?
🔹Is there a logic bug?
They combine both to make smarter review comments.
So instead of just saying “this is bad,” the tool says why it’s bad in a way that makes sense
🔰 @scopeofai | #papers
💅1
🔸 آزمایشها
⭐️ از دیتاست CodexGlue استفاده شده که شامل کد و توضیحاته.
سه مدل مختلف بررسی شدن: CodeT5، CodeBERT، GraphCodeBERT.
مقایسه کردن که نتیجه وقتی فقط از هوش مصنوعی استفاده میکنی چه فرقی داره با روش ترکیبی
🔸 نتایج
🧢 روش ترکیبی دقت بیشتری داشته
🧢 توانسته خطاهای منطقی بیشتری را شناسایی کند
🧢 پیشنهادهای کاربردیتر و کماشتباهتری داده
🧢 سرعت بررسی هم خوب بوده و زیاد کند نشده
🔸 بحث
⚠️ مدلهای زبانی در فهم الگوها و ساختارها قوی هستن، ولی ممکنه گاهی اشتباه کنن.
ابزارهای منطقی کمک میکنن این اشتباهات کم بشن.
این دو مکمل هم هستن.
البته چالشهایی هم وجود داره؛ مثلاً اجرای ابزار منطقی روی کدهای خیلی پیچیده یا زبانهای پویا ممکنه سخت باشه.
🔸 نتیجهگیری
✔️ ترکیب هوش مصنوعی و منطق دقیق، روش بهتری برای بررسی کد ارائه میده.
این روش میتونه در ابزارهای واقعی مثل IDEها یا سیستمهای کنترل نسخه (مثلاً گیتهاب) استفاده بشه.
در آینده میشه این روش رو برای زبانهای مختلف یا ابزارهای تعاملی توسعه داد.
خلاصه که برای ریویو کدهاتون فقط از مدل های زبانی بزرگ استفاده نکنید 🙏
🔰 @scopeofai | #papers
⭐️ از دیتاست CodexGlue استفاده شده که شامل کد و توضیحاته.
سه مدل مختلف بررسی شدن: CodeT5، CodeBERT، GraphCodeBERT.
مقایسه کردن که نتیجه وقتی فقط از هوش مصنوعی استفاده میکنی چه فرقی داره با روش ترکیبی
🔸 نتایج
🧢 روش ترکیبی دقت بیشتری داشته
🧢 توانسته خطاهای منطقی بیشتری را شناسایی کند
🧢 پیشنهادهای کاربردیتر و کماشتباهتری داده
🧢 سرعت بررسی هم خوب بوده و زیاد کند نشده
🔸 بحث
⚠️ مدلهای زبانی در فهم الگوها و ساختارها قوی هستن، ولی ممکنه گاهی اشتباه کنن.
ابزارهای منطقی کمک میکنن این اشتباهات کم بشن.
این دو مکمل هم هستن.
البته چالشهایی هم وجود داره؛ مثلاً اجرای ابزار منطقی روی کدهای خیلی پیچیده یا زبانهای پویا ممکنه سخت باشه.
🔸 نتیجهگیری
✔️ ترکیب هوش مصنوعی و منطق دقیق، روش بهتری برای بررسی کد ارائه میده.
این روش میتونه در ابزارهای واقعی مثل IDEها یا سیستمهای کنترل نسخه (مثلاً گیتهاب) استفاده بشه.
در آینده میشه این روش رو برای زبانهای مختلف یا ابزارهای تعاملی توسعه داد.
خلاصه که برای ریویو کدهاتون فقط از مدل های زبانی بزرگ استفاده نکنید 🙏
Experiments
⭐️ They used a public dataset called CodexGlue (has examples of code + comments).
Tried their system with 3 popular code-understanding models:
CodeT5
CodeBERT
GraphCodeBERT
Compared:
Just using the AI alone
Their combo system (AI + logic)
🔸 Results
✅ The combo system gave more accurate and meaningful reviews
✅ It caught logic errors that pure AI missed
✅ It gave better suggestions for fixing problems
✅ It didn’t slow things down much — still fast
✅ Less false alarms ("this is wrong" when it’s not)
🔸 Discussion
🧢 AI is great at understanding natural language and common patterns.
But AI can hallucinate (make stuff up).
The logic checker acts like a strict teacher who says “Hold on, is this really true?”
Together, they catch more bugs and give clearer reviews.
However, the logic checker can be tricky to set up for messy or dynamic code.
🔸 Conclusion
💡 Smart combo: AI + logic checking makes code review better
💡 Helps catch bugs AI alone might miss
💡 Gives developers clearer and more useful feedback
💡 Could be used in real tools (like GitHub Copilot but smarter)
🔰 @scopeofai | #papers
❤1🔥1💅1
بنچمارک MMLU چیه؟
MMLU = Massive Multitask Language Understanding
📊 یه آزمون خیلی بزرگه با ۱۵٬۹۰۰ سوال چندگزینهای در ۵۷ موضوع متنوع مثل ریاضی، تاریخ، حقوق، علوم پزشکی و ...
برای اینکه ببینن مدل چقدر بلده از دانستههاش استفاده کنه و جواب درست بده.
🔫 مدل تو یه حالت Zero-shot (بدون هیچ مثال قبلی) یا Few-shot (با چند مثال خیلی کم) باید سوالات چهارگزینهای رو جواب بده. یعنی فقط متکیه به دانستههایی که قبلن تو مرحلهی pretraining یاد گرفته.
مدلهای پیشرفته امروزی (مثل GPT‑4 و Claude) با کسب حدود ۸۸–۹۰٪ دقت توی این آزمون، تقریباً همرده متخصصان انسانی بودن.
📰 @scopeofai | #news
MMLU = Massive Multitask Language Understanding
📊 یه آزمون خیلی بزرگه با ۱۵٬۹۰۰ سوال چندگزینهای در ۵۷ موضوع متنوع مثل ریاضی، تاریخ، حقوق، علوم پزشکی و ...
برای اینکه ببینن مدل چقدر بلده از دانستههاش استفاده کنه و جواب درست بده.
🔫 مدل تو یه حالت Zero-shot (بدون هیچ مثال قبلی) یا Few-shot (با چند مثال خیلی کم) باید سوالات چهارگزینهای رو جواب بده. یعنی فقط متکیه به دانستههایی که قبلن تو مرحلهی pretraining یاد گرفته.
مدلهای پیشرفته امروزی (مثل GPT‑4 و Claude) با کسب حدود ۸۸–۹۰٪ دقت توی این آزمون، تقریباً همرده متخصصان انسانی بودن.
📊 MMLU is a huge test with 15,900 multiple-choice questions across 57 diverse subjects like math, history, law, and medical sciences.
The goal is to see how well a model can use its knowledge to answer correctly.
The model answers four-choice questions in zero-shot (no prior examples) or few-shot (very few examples) settings, relying only on what it learned during pretraining 🔫.
📰 @scopeofai | #news
🤓1💅1
🧴فقط توی بازه ۵ ساله نمرات اینقدر افزايش داشتن. هم ترسناکه و هم خیلی جالب...
📰 @scopeofai | #news
🧴Only within a 5-year span have the scores increased this much. It’s both scary and fascinating...
📰 @scopeofai | #news
🔥1💅1
🎞 هوش مصنوعی NotebookLM یه ویژگی جدید به اسم «Video Overview» اضافه کرده
🗯 الان میتونی از یادداشتهات، PDFها یا مستندات، ویدیوی خلاصهای با صدا و اسلاید درست کنی و توش عکس، نمودار، نقلقول و عدد بیاری.
میتونی مشخص کنی موضوع چی باشه، با چه لحن و به چه مخاطبی.
☁️ پنل Studio هم آپدیت شده: چهار تا گزینه داره (Audio, Video, Mind Map, Report) و حالا میتونی چندتا خروجی از هر نوع توی همون نوتبوک بسازی، راحت مثل آب خوردن.
https://techcrunch.com/2025/07/29/googles-notebooklm-rolls-out-video-overviews/
📰 @scopeofai | #news
🗯 الان میتونی از یادداشتهات، PDFها یا مستندات، ویدیوی خلاصهای با صدا و اسلاید درست کنی و توش عکس، نمودار، نقلقول و عدد بیاری.
میتونی مشخص کنی موضوع چی باشه، با چه لحن و به چه مخاطبی.
☁️ پنل Studio هم آپدیت شده: چهار تا گزینه داره (Audio, Video, Mind Map, Report) و حالا میتونی چندتا خروجی از هر نوع توی همون نوتبوک بسازی، راحت مثل آب خوردن.
Now you can turn your notes, PDFs, or docs into short narrated video slideshows, with visuals like diagrams, quotes, and numbers pulled from your sources.
☁️ You can customize things like the tone, focus topics, and even the target audience so the video feels tailored to your needs.
They also refreshed the Studio panel: now you get four big buttons for creating Audio Overviews, Video Overviews, Mind Maps, or Reports—all in one notebook.
https://techcrunch.com/2025/07/29/googles-notebooklm-rolls-out-video-overviews/
📰 @scopeofai | #news
💅2
👩🏫 یه قابلیت جدید به ChatGPT اضافه شده به اسم “Study Mode”
توی این حالت به جای اینکه مستقیم جواب سوالت رو بده، ازت سوال میپرسه، راهنماییت میکنه و کمکت میکنه تا مرحلهبهمرحله خودت رو به جواب برسونی.
بسته به سابقهات (اگه مموریت فعال باشه)، درس رو شخصیسازی میکنه و حتی ازت یه آزمون کوچیک هم میگیره
میتونی هر وقت خواستی از طریق Tools → Study Mode فعال/غیرفعالش کنی.
🎓 خبر خوب اینه که الان برای همه در دسترسه و میتونی ازش استفاده کنی.
📰 @scopeofai | #news
توی این حالت به جای اینکه مستقیم جواب سوالت رو بده، ازت سوال میپرسه، راهنماییت میکنه و کمکت میکنه تا مرحلهبهمرحله خودت رو به جواب برسونی.
بسته به سابقهات (اگه مموریت فعال باشه)، درس رو شخصیسازی میکنه و حتی ازت یه آزمون کوچیک هم میگیره
میتونی هر وقت خواستی از طریق Tools → Study Mode فعال/غیرفعالش کنی.
🎓 خبر خوب اینه که الان برای همه در دسترسه و میتونی ازش استفاده کنی.
👩🏫OpenAI just added a new “Study Mode” to ChatGPT – it’s like a built-in tutor that won’t just hand you the answer.
Instead of doing your homework for you, Study Mode asks questions, gives hints, and helps you think through tough problems step by step
It adjusts to your level and goals based on your past chats (if memory is ON), and even throws in quizzes and feedback
🎓 You can flip it on/off anytime via the Tools → Study Mode menu. Available to
Free, Plus, Pro, and Team users now, with Edu users getting it soon
📰 @scopeofai | #news
🔥1💅1
🐠 یه تیم مهندسی که قبلاً توی Google X بودن، رفتن نروژ. یه مسیر فلزی زیر آب ساختن که ماهیهای سالمون ازش رد میشن و با کمک دوربینهای مخصوص و هوش مصنوعی، وزن، تغذیه و حتی علائم بیماری ماهیها رو لحظهبهلحظه بررسی میکنن.
این پروژه که اسمش Tidalئه، تونسته تا الان توی بیش از ۷۰۰ قفس پرورش ماهی در دنیا راه بیفته و کمک کنه غذای کمتری هدر بره، ماهیها سالمتر بمونن و مرگومیر کمتر بشه.
🎣 هوش مصنوعی کمکم داره وارد دنیای زیر آب میشه. این بار خیلی جدی.
https://spectrum.ieee.org/aquaculture
📰 @scopeofai | #news
این پروژه که اسمش Tidalئه، تونسته تا الان توی بیش از ۷۰۰ قفس پرورش ماهی در دنیا راه بیفته و کمک کنه غذای کمتری هدر بره، ماهیها سالمتر بمونن و مرگومیر کمتر بشه.
🎣 هوش مصنوعی کمکم داره وارد دنیای زیر آب میشه. این بار خیلی جدی.
A group of engineers from Google’s Moonshot lab went to Norway and built a fish "racetrack" to collect data on salmon. Their startup, Tidal, uses AI and underwater cameras to track fish weight, health, and feeding in real time.
Their tech helps salmon farms reduce waste, spot diseases early, and grow fish more efficiently. It started as an experiment but now runs in over 700 pens worldwide.
https://spectrum.ieee.org/aquaculture
📰 @scopeofai | #news
🔥1💅1