🚀 شوک ریاضی با GPT-5!
هوش مصنوعی دیگر فقط انشا نمینویسد؛ GPT-5 توانست یک مسئلهی باز در نظریهی احتمال را حل کند! 📊
🔹 ریاضیدانان میدانستند جمع متغیرهای تصادفی در نهایت به توزیع نرمال همگرا میشود.
🔹 اما پرسش کلیدی بیپاسخ مانده بود: سرعت این همگرایی چقدر است؟
🔹 برای اولینبار، GPT-5 با کمک بازخورد متخصصان، یک نرخ کمی دقیق برای این همگرایی ارائه داد — نه فقط برای حالت گاوسی، بلکه حتی برای توزیع پواسون!
البته مدل بیخطا نبود؛ بارها اشتباه کرد ولی با اصلاح مسیر، خودش را تصحیح کرد، برهان نوشت و در نهایت یک متن در سطح مقاله آماده کرد.
📌 نتیجه: GPT-5 مثل یک پژوهشگر جوان عمل کرد، نه صرفاً یک ماشین حساب.
https://arxiv.org/abs/2509.03065v1
@rss_ai_ir
#AI #GPT5 #Math #Probability #Research
هوش مصنوعی دیگر فقط انشا نمینویسد؛ GPT-5 توانست یک مسئلهی باز در نظریهی احتمال را حل کند! 📊
🔹 ریاضیدانان میدانستند جمع متغیرهای تصادفی در نهایت به توزیع نرمال همگرا میشود.
🔹 اما پرسش کلیدی بیپاسخ مانده بود: سرعت این همگرایی چقدر است؟
🔹 برای اولینبار، GPT-5 با کمک بازخورد متخصصان، یک نرخ کمی دقیق برای این همگرایی ارائه داد — نه فقط برای حالت گاوسی، بلکه حتی برای توزیع پواسون!
البته مدل بیخطا نبود؛ بارها اشتباه کرد ولی با اصلاح مسیر، خودش را تصحیح کرد، برهان نوشت و در نهایت یک متن در سطح مقاله آماده کرد.
📌 نتیجه: GPT-5 مثل یک پژوهشگر جوان عمل کرد، نه صرفاً یک ماشین حساب.
https://arxiv.org/abs/2509.03065v1
@rss_ai_ir
#AI #GPT5 #Math #Probability #Research
🎉30👏28🥰23👍22🔥17😁16❤15😱1🙏1
⭐️مجموعه Nous Research کد منبع Nomos 1 را بهصورت متنباز منتشر کرد
با وجود اندازه نسبتاً کوچک ۳۰ میلیارد پارامتر، این مدل موفق شد امتیاز 87 از 120 را در آزمون Putnam کسب کند؛ یکی از معتبرترین و سختترین مسابقات ریاضی جهان.
🔹 چنین امتیازی معادل رتبه دوم در میان ۳۹۸۸ شرکتکننده در Putnam 2024 است.
🔹 مدل Nomos 1 هشت حل کاملاً بینقص ارائه داده است.
🔹 برای مقایسه، Qwen3-30B در همان شرایط تنها 24 از 120 امتیاز گرفت؛ موضوعی که نشان میدهد برتری Nomos بیشتر به کیفیت داده و فرایند آموزش برمیگردد، نه شرایط آزمون.
📌 نکته مهم:
ارزیابی پاسخها بهصورت کور (Blind Review) انجام شده و توسط یک شرکتکننده واقعی Putnam از میان ۲۰۰ نفر برتر صورت گرفته که پاسخهای ناشناس را بررسی کرده است.
⏱ شرایط زمانی نیز کاملاً واقعی بوده:
— برای هر بخش، ۳ ساعت زمان دقیقاً مشابه شرکتکنندگان انسانی.
🧠 ساختار استدلال Nomos:
ابتدا چند «worker» مسائل سختتر را حل میکنند و خودشان راهحلها را ارزیابی میکنند
سپس در مرحله نهایی، سیستم پاسخها را تجمیع کرده و بهترین نتیجه را انتخاب میکند
🔗 لینکها:
▪ HuggingFace: https://huggingface.co/NousResearch/nomos-1
▪ GitHub: https://github.com/NousResearch/nomos
@rss_ai_ir
#AI #LLM #MachineLearning #Math #OpenSource
با وجود اندازه نسبتاً کوچک ۳۰ میلیارد پارامتر، این مدل موفق شد امتیاز 87 از 120 را در آزمون Putnam کسب کند؛ یکی از معتبرترین و سختترین مسابقات ریاضی جهان.
🔹 چنین امتیازی معادل رتبه دوم در میان ۳۹۸۸ شرکتکننده در Putnam 2024 است.
🔹 مدل Nomos 1 هشت حل کاملاً بینقص ارائه داده است.
🔹 برای مقایسه، Qwen3-30B در همان شرایط تنها 24 از 120 امتیاز گرفت؛ موضوعی که نشان میدهد برتری Nomos بیشتر به کیفیت داده و فرایند آموزش برمیگردد، نه شرایط آزمون.
📌 نکته مهم:
ارزیابی پاسخها بهصورت کور (Blind Review) انجام شده و توسط یک شرکتکننده واقعی Putnam از میان ۲۰۰ نفر برتر صورت گرفته که پاسخهای ناشناس را بررسی کرده است.
⏱ شرایط زمانی نیز کاملاً واقعی بوده:
— برای هر بخش، ۳ ساعت زمان دقیقاً مشابه شرکتکنندگان انسانی.
🧠 ساختار استدلال Nomos:
ابتدا چند «worker» مسائل سختتر را حل میکنند و خودشان راهحلها را ارزیابی میکنند
سپس در مرحله نهایی، سیستم پاسخها را تجمیع کرده و بهترین نتیجه را انتخاب میکند
🔗 لینکها:
▪ HuggingFace: https://huggingface.co/NousResearch/nomos-1
▪ GitHub: https://github.com/NousResearch/nomos
@rss_ai_ir
#AI #LLM #MachineLearning #Math #OpenSource
👏14🥰10😁9👍7🎉7❤5🔥2