AI Scope
خفن ترین چیزی که امروز دیدم 💯 این ویدیو تبلیغاتی صفر تا صدش با هوش مصنوعی درست شده! از تک تک آدم ها و تصاویر داخلش گرفته تا موزیکی که میشنوید، همه و همه ساخته شده توسط هوش مصنوعین این البته تبلیغ رسمی KFC نیست و فقط یه تست بود تا بشه فهمید هوش مصنوعی چقدر…
🤯 این پروژه با کمتر از 400 دلار درست شده، پروژه ای که به صورت تکنیکی به بیشتر از 400 هزار دلار بودجه نیاز داشت...
برای ساختنش هزاران عکس غذا تولید شده و از ابزارهایی مثل Runway, Pika, Kling AI, Google DeepMind Veo2, Luma AI,OpenAI’s Sora,Suno استفاده کردن
کل خبر رو از سایت فایننشال اکسپرس بخونید: https://www.financialexpress.com/business/brandwagon-ai-powered-kfc-ad-shows-future-of-food-commercials-created-for-under-400-creative-industry-is-toast-netizens-react-3795399/
📰 @scopeofai | #news
برای ساختنش هزاران عکس غذا تولید شده و از ابزارهایی مثل Runway, Pika, Kling AI, Google DeepMind Veo2, Luma AI,OpenAI’s Sora,Suno استفاده کردن
کل خبر رو از سایت فایننشال اکسپرس بخونید: https://www.financialexpress.com/business/brandwagon-ai-powered-kfc-ad-shows-future-of-food-commercials-created-for-under-400-creative-industry-is-toast-netizens-react-3795399/
📰 @scopeofai | #news
Financialexpress
AI-powered KFC ad shows future of food commercials, created for under $400, ‘creative industry is toast’, netizens react
In a LinkedIn post, Blagojevic detailed his process of using AI tools to craft a high-quality commercial, a project that would traditionally require a budget exceeding $400,000.
👍1👌1
This essay explores whether contemporary Large Language Models (LLMs) can pass the Turing test, a benchmark proposed by Alan Turing to evaluate machine intelligence. The study involved evaluating four systems—GPT-4.5, LLaMa-3.1-405B, GPT-4o, and ELIZA—in randomized, controlled three-party Turing tests with two independent populations: UCSD undergraduate students and Prolific workers. Participants engaged in simultaneous conversations with a human and an AI system before judging which conversational partner they believed was human.
📁 Paper: https://arxiv.org/pdf/2503.23674
@scopeofai
@LLM_learning
📁 Paper: https://arxiv.org/pdf/2503.23674
@scopeofai
@LLM_learning
❤1
AI Scope
LLM Pass the turing test.pdf
این یه مقاله معمولی نیست. اسمش فقط به تنهایی میتونه تن و بدنمون رو بلرزونه:
Large Language Models Pass The Turing Test
تازه بعد 75 ساله که برای اولین بار هوش مصنوعی تونسته رویای آلن تورینگ رو محقق کنه
بریم کامل بررسیش کنیم...
Large Language Models Pass The Turing Test
تازه بعد 75 ساله که برای اولین بار هوش مصنوعی تونسته رویای آلن تورینگ رو محقق کنه
بریم کامل بررسیش کنیم...
۱. چکیده
این تحقیق نشون داد که:
مدل GPT-4.5 تونست موفقیت 73 درصدی داشته باشه و آدما رو قانع کرد که یه انسانه نه یه ربات
مدل LLaMa-3.1 مشابه انسانها عمل کرد و موفقیت 56 درصدی داشت
مدلهای قدیمی مثل ELIZA و GPT-4o فقط 21 تا 23 درصد موفقیت داشتن
• چرا مهمه؟ این اولین باره که یه هوش مصنوعی تونسته تست تورینگ کلاسیک رو با موفقیت پشت سر بذاره.
The study shows GPT-4.5 (with a "humanlike" prompt) fools 73% of people, beating real humans in a Turing Test.
GPT-4.5 (Persona): 73% win rate (higher than humans).
LLaMa-3.1 (Persona): 56% (same as humans).
Baselines (ELIZA, GPT-4o): Failed (21–23%).
🔰 @scopeofai | #papers
این تحقیق نشون داد که:
مدل GPT-4.5 تونست موفقیت 73 درصدی داشته باشه و آدما رو قانع کرد که یه انسانه نه یه ربات
مدل LLaMa-3.1 مشابه انسانها عمل کرد و موفقیت 56 درصدی داشت
مدلهای قدیمی مثل ELIZA و GPT-4o فقط 21 تا 23 درصد موفقیت داشتن
• چرا مهمه؟ این اولین باره که یه هوش مصنوعی تونسته تست تورینگ کلاسیک رو با موفقیت پشت سر بذاره.
The study shows GPT-4.5 (with a "humanlike" prompt) fools 73% of people, beating real humans in a Turing Test.
GPT-4.5 (Persona): 73% win rate (higher than humans).
LLaMa-3.1 (Persona): 56% (same as humans).
Baselines (ELIZA, GPT-4o): Failed (21–23%).
🔰 @scopeofai | #papers
❤1
2- مقدمه
تست تورینگ چیه و چرا هنوز مهمه؟
آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت
منتقدان میگن این تست یا خیلى سادهانگارانست (انسانها زود فریب میخورن) یا خیلى سختگیرانه (ماشینها باید دروغ بگن تا قبول شن).
چرا هنوز مهمه؟
⚪️ این تست نشون میده که آیا هوش مصنوعی میتونه جای انسانها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمونهای محدود دیگه، تست تورینگ انعطافپذیر و تعاملیه
Turing Test Basics:
Proposed in 1950 to judge machine "intelligence" via conversation.
Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).
Modern Relevance:
Tests if AI can replace humans in jobs or social roles.
Unlike static benchmarks, it’s dynamic and interactive
🔰 @scopeofai | #papers
تست تورینگ چیه و چرا هنوز مهمه؟
آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت
منتقدان میگن این تست یا خیلى سادهانگارانست (انسانها زود فریب میخورن) یا خیلى سختگیرانه (ماشینها باید دروغ بگن تا قبول شن).
چرا هنوز مهمه؟
⚪️ این تست نشون میده که آیا هوش مصنوعی میتونه جای انسانها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمونهای محدود دیگه، تست تورینگ انعطافپذیر و تعاملیه
Turing Test Basics:
Proposed in 1950 to judge machine "intelligence" via conversation.
Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).
Modern Relevance:
Tests if AI can replace humans in jobs or social roles.
Unlike static benchmarks, it’s dynamic and interactive
🔰 @scopeofai | #papers
❤1👍1
AI Scope
خودتونو تست کنید یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه کدوم جواب، جواب انسانه؟ A یا B
من خودم گول خوردم.
شرکت کننده B انسانه. A ولی مدل ChatGPT-4.5 هستش :))))
👍1😱1
۳. روش تحقیق
۲۸۴ نفر به مدت ۵ دقیقه هم با انسانها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.
به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا
🔴 بدون پرسونا: فقط گفتن "انسانوار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"
Experiment Setup:
Task: Talk to 1 human + 1 AI, then pick the human.
Prompt Tricks:
No-Persona: Just "act human."
Persona: Fake backstory (young, uses slang, introverted)
🔰 @scopeofai | #papers
۲۸۴ نفر به مدت ۵ دقیقه هم با انسانها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.
به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا
🔴 بدون پرسونا: فقط گفتن "انسانوار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"
Experiment Setup:
Task: Talk to 1 human + 1 AI, then pick the human.
Prompt Tricks:
No-Persona: Just "act human."
Persona: Fake backstory (young, uses slang, introverted)
🔰 @scopeofai | #papers
❤1
۴. نتایج
مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )
مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو
مدلهای ضعیفتر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.
📌 پرسوناسازى عملکرد رو دو برابر کرد.
📌 حتی آدمهای متخصص هم نتونستن GPT-4.5 رو تشخیص بدن
Win Rates:
GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).
LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).
Baselines (ELIZA, GPT-4o): ~22% (failed).
Persona prompts doubled AI’s success (p < 0.001).
Even AI experts couldn’t reliably spot GPT-4.5.
🔰 @scopeofai | #papers
مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )
مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو
مدلهای ضعیفتر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.
📌 پرسوناسازى عملکرد رو دو برابر کرد.
📌 حتی آدمهای متخصص هم نتونستن GPT-4.5 رو تشخیص بدن
Win Rates:
GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).
LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).
Baselines (ELIZA, GPT-4o): ~22% (failed).
Persona prompts doubled AI’s success (p < 0.001).
Even AI experts couldn’t reliably spot GPT-4.5.
🔰 @scopeofai | #papers
👏1
5- بحث و تحلیل
💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی میتونه شبیه انسان رفتار کنه.
شرکتکنندهها بیشتر به حالتهای گفتار (مثل شوخطبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابلاعتمادتر به نظر برسه.
📌هوش مصنوعی میتونه جای مشاغل، دوستیها یا حتی اخبار جعلی رو بگیره.
📌تشخیصش سخته—حتی آدمهای باتجربه هم گول خوردن
Keypoints:
Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.
Humans judged AI on social cues (slang, humor) not logic/math.
Persona prompts made AI seem more relatable.
AI could replace jobs, friendships, or spread fake info.
Hard to detect—even tech-savvy users were fooled
🔰 @scopeofai | #papers
💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی میتونه شبیه انسان رفتار کنه.
شرکتکنندهها بیشتر به حالتهای گفتار (مثل شوخطبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابلاعتمادتر به نظر برسه.
📌هوش مصنوعی میتونه جای مشاغل، دوستیها یا حتی اخبار جعلی رو بگیره.
📌تشخیصش سخته—حتی آدمهای باتجربه هم گول خوردن
Keypoints:
Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.
Humans judged AI on social cues (slang, humor) not logic/math.
Persona prompts made AI seem more relatable.
AI could replace jobs, friendships, or spread fake info.
Hard to detect—even tech-savvy users were fooled
🔰 @scopeofai | #papers
❤1👍1
6- نتیجهگیری
👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسانبودن" هم عوض شه
کارهای بعدی:
تستهای طولانیتر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه
The Turing Test is just the start—humans might redefine "humanity" as AI improves.
Future Work:
Longer chats, expert interrogators, or voice/video tests
🔰 @scopeofai | #papers
👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسانبودن" هم عوض شه
کارهای بعدی:
تستهای طولانیتر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه
The Turing Test is just the start—humans might redefine "humanity" as AI improves.
Future Work:
Longer chats, expert interrogators, or voice/video tests
🔰 @scopeofai | #papers
❤1
⭐️ نکات کلیدی
۱. هوش مصنوعی میتونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیتسازی مهمه: وقتی به هوش مصنوعی یه شخصیت میدن (مثلا "نوجوان خجالتی")، بهتر عمل میکنه.
۳. مهمتر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالشبرانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوستها رو بگیره
AI Can Fake Being Human: GPT-4.5 tricked 73% of people.
Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.
Social > Smart: People cared more about chat style than IQ.
Big Changes Coming: AI might replace customer service, therapy, or even friends.
🔰 @scopeofai | #papers
۱. هوش مصنوعی میتونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیتسازی مهمه: وقتی به هوش مصنوعی یه شخصیت میدن (مثلا "نوجوان خجالتی")، بهتر عمل میکنه.
۳. مهمتر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالشبرانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوستها رو بگیره
AI Can Fake Being Human: GPT-4.5 tricked 73% of people.
Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.
Social > Smart: People cared more about chat style than IQ.
Big Changes Coming: AI might replace customer service, therapy, or even friends.
🔰 @scopeofai | #papers
❤1👍1
رویداد مایکروسافت شروع شد
از این لینک الان لایو تماشا کنید:
https://www.youtube.com/watch?v=v5THCzTNPNk
از این لینک الان لایو تماشا کنید:
https://www.youtube.com/watch?v=v5THCzTNPNk
YouTube
Introducing Your AI Companion | Microsoft Copilot
Join Microsoft Copilot CEO Mustafa Suleyman to discuss the future of AI. Download Microsoft Copilot today, and learn more at https://copilot.microsoft.com/
کوپایلت میتونه با یه پرامپت ساده واستون یه پادکست شخصی بسازه توی کوتاه ترین زمان ممکن!
👍3
با Copilot Vision میتونید دوربینتون رو فعال کنید تا کوپایلت هرچیزی که شما میبینید رو ببینه و شمارو راهنمایی کنه
🔥2👍1
چیزجالبش اینه که نمیخواد هیچی رو توضیح بدید. کوپایلت میفهمه و هر تغییری توی دنیای واقعی ایجاد بشه با دوربین شما میبینه و یاد میگیره
👍2