AI Scope
113 subscribers
172 photos
21 videos
16 files
108 links
Download Telegram
2- مقدمه

تست تورینگ چیه و چرا هنوز مهمه؟


آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت

منتقدان می‌گن این تست یا خیلى ساده‌انگارانست (انسان‌ها زود فریب می‌خورن) یا خیلى سختگیرانه (ماشین‌ها باید دروغ بگن تا قبول شن).

چرا هنوز مهمه؟

⚪️ این تست نشون می‌ده که آیا هوش مصنوعی می‌تونه جای انسان‌ها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمون‌های محدود دیگه، تست تورینگ انعطاف‌پذیر و تعاملیه


Turing Test Basics:

Proposed in 1950 to judge machine "intelligence" via conversation.

Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).

Modern Relevance:

Tests if AI can replace humans in jobs or social roles.

Unlike static benchmarks, it’s dynamic and interactive

🔰 @scopeofai | #papers
1👍1
خودتونو تست کنید

یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه

کدوم جواب، جواب انسانه
؟ A یا B
1🤔1🤓1
AI Scope
خودتونو تست کنید یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه کدوم جواب، جواب انسانه؟ A یا B
من خودم گول خوردم.

شرکت کننده B انسانه. A ولی مدل ChatGPT-4.5 هستش :))))
👍1😱1
۳. روش تحقیق

۲۸۴ نفر به مدت ۵ دقیقه هم با انسان‌ها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.


به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا

🔴 بدون پرسونا: فقط گفتن "انسان‌وار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"

Experiment Setup:

Task: Talk to 1 human + 1 AI, then pick the human.

Prompt Tricks:

No-Persona: Just "act human."

Persona: Fake backstory (young, uses slang, introverted)

🔰 @scopeofai | #papers
1
۴. نتایج


مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )

مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو

مدل‌های ضعیف‌تر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.


📌 پرسوناسازى عملکرد رو دو برابر کرد.

📌 حتی آدم‌های متخصص هم نتونستن GPT-4.5 رو تشخیص بدن


Win Rates:

GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).

LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).

Baselines (ELIZA, GPT-4o): ~22% (failed).

Persona prompts doubled AI’s success (p < 0.001).

Even AI experts couldn’t reliably spot GPT-4.5.

🔰 @scopeofai | #papers
👏1
5- بحث و تحلیل

💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی می‌تونه شبیه انسان رفتار کنه.

شرکت‌کننده‌ها بیشتر به حالت‌های گفتار (مثل شوخ‌طبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابل‌اعتمادتر به نظر برسه.

📌هوش مصنوعی می‌تونه جای مشاغل، دوستی‌ها یا حتی اخبار جعلی رو بگیره.

📌تشخیصش سخته—حتی آدم‌های باتجربه هم گول خوردن

Keypoints:

Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.

Humans judged AI on social cues (slang, humor) not logic/math.

Persona prompts made AI seem more relatable.

AI could replace jobs, friendships, or spread fake info.

Hard to detect—even tech-savvy users were fooled

🔰 @scopeofai | #papers
1👍1
6- نتیجه‌گیری

👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسان‌بودن" هم عوض شه


کارهای بعدی:

تست‌های طولانی‌تر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه

The Turing Test is just the start—humans might redefine "humanity" as AI improves.

Future Work:

Longer chats, expert interrogators, or voice/video tests

🔰 @scopeofai | #papers
1
⭐️ نکات کلیدی

۱. هوش مصنوعی می‌تونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیت‌سازی مهمه: وقتی به هوش مصنوعی یه شخصیت می‌دن (مثلا "نوجوان خجالتی")، بهتر عمل می‌کنه.
۳. مهم‌تر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالش‌برانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوست‌ها رو بگیره

AI Can Fake Being Human: GPT-4.5 tricked 73% of people.

Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.

Social > Smart: People cared more about chat style than IQ.

Big Changes Coming: AI might replace customer service, therapy, or even friends.

🔰 @scopeofai | #papers
1👍1
یکی داره داد میزنه میگه شرم بر شما!!!!
😐2
وسط لایو
خب جمعش کردن خداروشکر🤲
کوپایلت میتونه با یه پرامپت ساده واستون یه پادکست شخصی بسازه توی کوتاه ترین زمان ممکن!
👍3
با Copilot Vision میتونید دوربینتون رو فعال کنید تا کوپایلت هرچیزی که شما میبینید رو ببینه و شمارو راهنمایی کنه
🔥2👍1
چیزجالبش اینه که نمیخواد هیچی رو توضیح بدید. کوپایلت میفهمه و هر تغییری توی دنیای واقعی ایجاد بشه با دوربین شما میبینه و یاد میگیره
👍2
DeepResearch کوپایلت هم معرفی شد
AI Scope
با Copilot Vision میتونید دوربینتون رو فعال کنید تا کوپایلت هرچیزی که شما میبینید رو ببینه و شمارو راهنمایی کنه
این قابلیت توی ویندوز اینجوریه که دسکتاپ رو باهاش به اشتراک میذارید و میتونه توی هرچیزی کمکتون کنه.
🔥3
تمام قابلیت هایی که توی این رویداد گفته میشن یا الان در دسترسن یا توی هفته های آینده در دسترس قرار میگیرن
متا مدل‌های جدید هوش مصنوعیشو معرفی کرد: Llama 4 🦙

سه تا مدل جدید داره:

- Scout
(کوچیک و سبک، حتی رو یه کارت گرافیک معمولی هم اجرا میشه)
- Maverick
(بزرگ‌تر و قوی‌تر، برای کارهای پیچیده‌تر)
- Behemoth
(غولشونه. 2 تریلیون پارامتر داره و هنوز کامل نشده ولی قراره خیلی قدرتمند باشه)

💡 این مدل‌ها می‌تونن متن، عکس و ویدیو رو با هم بفهمن و پردازش کنن.
🚫 ولی یه محدودیت داره: شرکت‌هایی که بالای ۷۰۰ میلیون کاربر دارن، باید اجازه مخصوص از متا بگیرن تا ازش استفاده کنن.

​Meta has unveiled Llama 4, its latest collection of AI models, including Llama 4 Scout, Llama 4 Maverick, and Llama 4 Behemoth. These models are designed to process various data types such as text, images, and videos, enhancing their versatility. Llama 4 Scout is a compact model capable of operating on a single Nvidia H100 GPU, while Llama 4 Maverick is a larger model intended for more complex tasks. Llama 4 Behemoth, still in training, is projected to be the most powerful among them.

📰 @scopeofai | #news
🤩2
🔮 برگ برنده جدید میدجرنی

مبدجرنی یه نسخه جدید از هوش مصنوعی خودش رو معرفی کرده به اسم V7.
این نسخه خیلی سریع‌تر و با کیفیت‌تر از مدل های قبلیه.
یه قابلیت خیلی خفن داره به اسم "حالت پیش‌نویس" (Draft Mode) که می‌تونه تا ۱۰ برابر سریع‌تر با نصف هزینه برات عکس بسازه
میدجرنی با این حرکت نشون داد که هنوزم یکی از قوی‌ترین‌ها تو زمینه تولید تصویر با هوش مصنوعیه.

Midjourney has unveiled its latest AI image generation model, Version 7 (V7), which significantly enhances the speed and quality of image creation. A standout feature of V7 is the 'Draft Mode,' enabling image generation up to ten times faster than previous versions. This advancement is poised to revolutionize fields such as digital art, design, and content creation by providing rapid and efficient image generation capabilities. The introduction of V7 reflects Midjourney's commitment to continuous innovation in AI-driven image synthesis

https://www.artificialintelligence-news.com/news/midjourney-v7-faster-ai-image-generation/

📰 @scopeofai | #news
👏2