2- مقدمه
تست تورینگ چیه و چرا هنوز مهمه؟
آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت
منتقدان میگن این تست یا خیلى سادهانگارانست (انسانها زود فریب میخورن) یا خیلى سختگیرانه (ماشینها باید دروغ بگن تا قبول شن).
چرا هنوز مهمه؟
⚪️ این تست نشون میده که آیا هوش مصنوعی میتونه جای انسانها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمونهای محدود دیگه، تست تورینگ انعطافپذیر و تعاملیه
Turing Test Basics:
Proposed in 1950 to judge machine "intelligence" via conversation.
Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).
Modern Relevance:
Tests if AI can replace humans in jobs or social roles.
Unlike static benchmarks, it’s dynamic and interactive
🔰 @scopeofai | #papers
تست تورینگ چیه و چرا هنوز مهمه؟
آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت
منتقدان میگن این تست یا خیلى سادهانگارانست (انسانها زود فریب میخورن) یا خیلى سختگیرانه (ماشینها باید دروغ بگن تا قبول شن).
چرا هنوز مهمه؟
⚪️ این تست نشون میده که آیا هوش مصنوعی میتونه جای انسانها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمونهای محدود دیگه، تست تورینگ انعطافپذیر و تعاملیه
Turing Test Basics:
Proposed in 1950 to judge machine "intelligence" via conversation.
Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).
Modern Relevance:
Tests if AI can replace humans in jobs or social roles.
Unlike static benchmarks, it’s dynamic and interactive
🔰 @scopeofai | #papers
❤1👍1
AI Scope
خودتونو تست کنید یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه کدوم جواب، جواب انسانه؟ A یا B
من خودم گول خوردم.
شرکت کننده B انسانه. A ولی مدل ChatGPT-4.5 هستش :))))
👍1😱1
۳. روش تحقیق
۲۸۴ نفر به مدت ۵ دقیقه هم با انسانها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.
به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا
🔴 بدون پرسونا: فقط گفتن "انسانوار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"
Experiment Setup:
Task: Talk to 1 human + 1 AI, then pick the human.
Prompt Tricks:
No-Persona: Just "act human."
Persona: Fake backstory (young, uses slang, introverted)
🔰 @scopeofai | #papers
۲۸۴ نفر به مدت ۵ دقیقه هم با انسانها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.
به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا
🔴 بدون پرسونا: فقط گفتن "انسانوار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"
Experiment Setup:
Task: Talk to 1 human + 1 AI, then pick the human.
Prompt Tricks:
No-Persona: Just "act human."
Persona: Fake backstory (young, uses slang, introverted)
🔰 @scopeofai | #papers
❤1
۴. نتایج
مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )
مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو
مدلهای ضعیفتر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.
📌 پرسوناسازى عملکرد رو دو برابر کرد.
📌 حتی آدمهای متخصص هم نتونستن GPT-4.5 رو تشخیص بدن
Win Rates:
GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).
LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).
Baselines (ELIZA, GPT-4o): ~22% (failed).
Persona prompts doubled AI’s success (p < 0.001).
Even AI experts couldn’t reliably spot GPT-4.5.
🔰 @scopeofai | #papers
مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )
مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو
مدلهای ضعیفتر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.
📌 پرسوناسازى عملکرد رو دو برابر کرد.
📌 حتی آدمهای متخصص هم نتونستن GPT-4.5 رو تشخیص بدن
Win Rates:
GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).
LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).
Baselines (ELIZA, GPT-4o): ~22% (failed).
Persona prompts doubled AI’s success (p < 0.001).
Even AI experts couldn’t reliably spot GPT-4.5.
🔰 @scopeofai | #papers
👏1
5- بحث و تحلیل
💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی میتونه شبیه انسان رفتار کنه.
شرکتکنندهها بیشتر به حالتهای گفتار (مثل شوخطبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابلاعتمادتر به نظر برسه.
📌هوش مصنوعی میتونه جای مشاغل، دوستیها یا حتی اخبار جعلی رو بگیره.
📌تشخیصش سخته—حتی آدمهای باتجربه هم گول خوردن
Keypoints:
Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.
Humans judged AI on social cues (slang, humor) not logic/math.
Persona prompts made AI seem more relatable.
AI could replace jobs, friendships, or spread fake info.
Hard to detect—even tech-savvy users were fooled
🔰 @scopeofai | #papers
💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی میتونه شبیه انسان رفتار کنه.
شرکتکنندهها بیشتر به حالتهای گفتار (مثل شوخطبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابلاعتمادتر به نظر برسه.
📌هوش مصنوعی میتونه جای مشاغل، دوستیها یا حتی اخبار جعلی رو بگیره.
📌تشخیصش سخته—حتی آدمهای باتجربه هم گول خوردن
Keypoints:
Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.
Humans judged AI on social cues (slang, humor) not logic/math.
Persona prompts made AI seem more relatable.
AI could replace jobs, friendships, or spread fake info.
Hard to detect—even tech-savvy users were fooled
🔰 @scopeofai | #papers
❤1👍1
6- نتیجهگیری
👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسانبودن" هم عوض شه
کارهای بعدی:
تستهای طولانیتر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه
The Turing Test is just the start—humans might redefine "humanity" as AI improves.
Future Work:
Longer chats, expert interrogators, or voice/video tests
🔰 @scopeofai | #papers
👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسانبودن" هم عوض شه
کارهای بعدی:
تستهای طولانیتر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه
The Turing Test is just the start—humans might redefine "humanity" as AI improves.
Future Work:
Longer chats, expert interrogators, or voice/video tests
🔰 @scopeofai | #papers
❤1
⭐️ نکات کلیدی
۱. هوش مصنوعی میتونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیتسازی مهمه: وقتی به هوش مصنوعی یه شخصیت میدن (مثلا "نوجوان خجالتی")، بهتر عمل میکنه.
۳. مهمتر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالشبرانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوستها رو بگیره
AI Can Fake Being Human: GPT-4.5 tricked 73% of people.
Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.
Social > Smart: People cared more about chat style than IQ.
Big Changes Coming: AI might replace customer service, therapy, or even friends.
🔰 @scopeofai | #papers
۱. هوش مصنوعی میتونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیتسازی مهمه: وقتی به هوش مصنوعی یه شخصیت میدن (مثلا "نوجوان خجالتی")، بهتر عمل میکنه.
۳. مهمتر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالشبرانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوستها رو بگیره
AI Can Fake Being Human: GPT-4.5 tricked 73% of people.
Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.
Social > Smart: People cared more about chat style than IQ.
Big Changes Coming: AI might replace customer service, therapy, or even friends.
🔰 @scopeofai | #papers
❤1👍1
رویداد مایکروسافت شروع شد
از این لینک الان لایو تماشا کنید:
https://www.youtube.com/watch?v=v5THCzTNPNk
از این لینک الان لایو تماشا کنید:
https://www.youtube.com/watch?v=v5THCzTNPNk
YouTube
Introducing Your AI Companion | Microsoft Copilot
Join Microsoft Copilot CEO Mustafa Suleyman to discuss the future of AI. Download Microsoft Copilot today, and learn more at https://copilot.microsoft.com/
کوپایلت میتونه با یه پرامپت ساده واستون یه پادکست شخصی بسازه توی کوتاه ترین زمان ممکن!
👍3
با Copilot Vision میتونید دوربینتون رو فعال کنید تا کوپایلت هرچیزی که شما میبینید رو ببینه و شمارو راهنمایی کنه
🔥2👍1
چیزجالبش اینه که نمیخواد هیچی رو توضیح بدید. کوپایلت میفهمه و هر تغییری توی دنیای واقعی ایجاد بشه با دوربین شما میبینه و یاد میگیره
👍2
AI Scope
با Copilot Vision میتونید دوربینتون رو فعال کنید تا کوپایلت هرچیزی که شما میبینید رو ببینه و شمارو راهنمایی کنه
این قابلیت توی ویندوز اینجوریه که دسکتاپ رو باهاش به اشتراک میذارید و میتونه توی هرچیزی کمکتون کنه.
🔥3
تمام قابلیت هایی که توی این رویداد گفته میشن یا الان در دسترسن یا توی هفته های آینده در دسترس قرار میگیرن
متا مدلهای جدید هوش مصنوعیشو معرفی کرد: Llama 4 🦙
سه تا مدل جدید داره:
- Scout
(کوچیک و سبک، حتی رو یه کارت گرافیک معمولی هم اجرا میشه)
- Maverick
(بزرگتر و قویتر، برای کارهای پیچیدهتر)
- Behemoth
(غولشونه. 2 تریلیون پارامتر داره و هنوز کامل نشده ولی قراره خیلی قدرتمند باشه)
💡 این مدلها میتونن متن، عکس و ویدیو رو با هم بفهمن و پردازش کنن.
🚫 ولی یه محدودیت داره: شرکتهایی که بالای ۷۰۰ میلیون کاربر دارن، باید اجازه مخصوص از متا بگیرن تا ازش استفاده کنن.
Meta has unveiled Llama 4, its latest collection of AI models, including Llama 4 Scout, Llama 4 Maverick, and Llama 4 Behemoth. These models are designed to process various data types such as text, images, and videos, enhancing their versatility. Llama 4 Scout is a compact model capable of operating on a single Nvidia H100 GPU, while Llama 4 Maverick is a larger model intended for more complex tasks. Llama 4 Behemoth, still in training, is projected to be the most powerful among them.
📰 @scopeofai | #news
سه تا مدل جدید داره:
- Scout
(کوچیک و سبک، حتی رو یه کارت گرافیک معمولی هم اجرا میشه)
- Maverick
(بزرگتر و قویتر، برای کارهای پیچیدهتر)
- Behemoth
(غولشونه. 2 تریلیون پارامتر داره و هنوز کامل نشده ولی قراره خیلی قدرتمند باشه)
💡 این مدلها میتونن متن، عکس و ویدیو رو با هم بفهمن و پردازش کنن.
🚫 ولی یه محدودیت داره: شرکتهایی که بالای ۷۰۰ میلیون کاربر دارن، باید اجازه مخصوص از متا بگیرن تا ازش استفاده کنن.
Meta has unveiled Llama 4, its latest collection of AI models, including Llama 4 Scout, Llama 4 Maverick, and Llama 4 Behemoth. These models are designed to process various data types such as text, images, and videos, enhancing their versatility. Llama 4 Scout is a compact model capable of operating on a single Nvidia H100 GPU, while Llama 4 Maverick is a larger model intended for more complex tasks. Llama 4 Behemoth, still in training, is projected to be the most powerful among them.
📰 @scopeofai | #news
🤩2
🔮 برگ برنده جدید میدجرنی
مبدجرنی یه نسخه جدید از هوش مصنوعی خودش رو معرفی کرده به اسم V7.
این نسخه خیلی سریعتر و با کیفیتتر از مدل های قبلیه.
یه قابلیت خیلی خفن داره به اسم "حالت پیشنویس" (Draft Mode) که میتونه تا ۱۰ برابر سریعتر با نصف هزینه برات عکس بسازه
میدجرنی با این حرکت نشون داد که هنوزم یکی از قویترینها تو زمینه تولید تصویر با هوش مصنوعیه.
Midjourney has unveiled its latest AI image generation model, Version 7 (V7), which significantly enhances the speed and quality of image creation. A standout feature of V7 is the 'Draft Mode,' enabling image generation up to ten times faster than previous versions. This advancement is poised to revolutionize fields such as digital art, design, and content creation by providing rapid and efficient image generation capabilities. The introduction of V7 reflects Midjourney's commitment to continuous innovation in AI-driven image synthesis
https://www.artificialintelligence-news.com/news/midjourney-v7-faster-ai-image-generation/
📰 @scopeofai | #news
مبدجرنی یه نسخه جدید از هوش مصنوعی خودش رو معرفی کرده به اسم V7.
این نسخه خیلی سریعتر و با کیفیتتر از مدل های قبلیه.
یه قابلیت خیلی خفن داره به اسم "حالت پیشنویس" (Draft Mode) که میتونه تا ۱۰ برابر سریعتر با نصف هزینه برات عکس بسازه
میدجرنی با این حرکت نشون داد که هنوزم یکی از قویترینها تو زمینه تولید تصویر با هوش مصنوعیه.
Midjourney has unveiled its latest AI image generation model, Version 7 (V7), which significantly enhances the speed and quality of image creation. A standout feature of V7 is the 'Draft Mode,' enabling image generation up to ten times faster than previous versions. This advancement is poised to revolutionize fields such as digital art, design, and content creation by providing rapid and efficient image generation capabilities. The introduction of V7 reflects Midjourney's commitment to continuous innovation in AI-driven image synthesis
https://www.artificialintelligence-news.com/news/midjourney-v7-faster-ai-image-generation/
📰 @scopeofai | #news
👏2