AI Scope
120 subscribers
178 photos
21 videos
17 files
108 links
Download Telegram
AI Scope
خفن ترین چیزی که امروز دیدم 💯 این ویدیو تبلیغاتی صفر تا صدش با هوش مصنوعی درست شده! از تک تک آدم ها و تصاویر داخلش گرفته تا موزیکی که میشنوید، همه و همه ساخته شده توسط هوش مصنوعین این البته تبلیغ رسمی KFC نیست و فقط یه تست بود تا بشه فهمید هوش مصنوعی چقدر…
🤯 این پروژه با کمتر از 400 دلار درست شده، پروژه ای که به صورت تکنیکی به بیشتر از 400 هزار دلار بودجه نیاز داشت...

برای ساختنش هزاران عکس غذا تولید شده و از ابزارهایی مثل Runway, Pika, Kling AI, Google DeepMind Veo2, Luma AI,OpenAI’s Sora,Suno استفاده کردن

کل خبر رو از سایت فایننشال اکسپرس بخونید: https://www.financialexpress.com/business/brandwagon-ai-powered-kfc-ad-shows-future-of-food-commercials-created-for-under-400-creative-industry-is-toast-netizens-react-3795399/

📰 @scopeofai | #news
👍1👌1
This essay explores whether contemporary Large Language Models (LLMs) can pass the Turing test, a benchmark proposed by Alan Turing to evaluate machine intelligence. The study involved evaluating four systems—GPT-4.5, LLaMa-3.1-405B, GPT-4o, and ELIZA—in randomized, controlled three-party Turing tests with two independent populations: UCSD undergraduate students and Prolific workers. Participants engaged in simultaneous conversations with a human and an AI system before judging which conversational partner they believed was human.

📁 Paper: https://arxiv.org/pdf/2503.23674


@scopeofai
@LLM_learning
1
AI Scope
LLM Pass the turing test.pdf
این یه مقاله معمولی نیست. اسمش فقط به تنهایی میتونه تن و بدنمون رو بلرزونه:

Large Language Models Pass The Turing Test

تازه بعد 75 ساله که برای اولین بار هوش مصنوعی تونسته رویای آلن تورینگ رو محقق کنه

بریم کامل بررسیش کنیم...
۱. چکیده

این تحقیق نشون داد که:

مدل GPT-4.5 تونست موفقیت 73 درصدی داشته باشه و آدما رو قانع کرد که یه انسانه نه یه ربات
مدل LLaMa-3.1 مشابه انسان‌ها عمل کرد و موفقیت 56 درصدی داشت
مدل‌های قدیمی مثل ELIZA و GPT-4o فقط 21 تا 23 درصد موفقیت داشتن

چرا مهمه؟ این اولین باره که یه هوش مصنوعی تونسته تست تورینگ کلاسیک رو با موفقیت پشت سر بذاره.



The study shows GPT-4.5 (with a "humanlike" prompt) fools 73% of people, beating real humans in a Turing Test.


GPT-4.5 (Persona): 73% win rate (higher than humans).

LLaMa-3.1 (Persona): 56% (same as humans).

Baselines (ELIZA, GPT-4o): Failed (21–23%).


🔰 @scopeofai | #papers
1
2- مقدمه

تست تورینگ چیه و چرا هنوز مهمه؟


آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت

منتقدان می‌گن این تست یا خیلى ساده‌انگارانست (انسان‌ها زود فریب می‌خورن) یا خیلى سختگیرانه (ماشین‌ها باید دروغ بگن تا قبول شن).

چرا هنوز مهمه؟

⚪️ این تست نشون می‌ده که آیا هوش مصنوعی می‌تونه جای انسان‌ها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمون‌های محدود دیگه، تست تورینگ انعطاف‌پذیر و تعاملیه


Turing Test Basics:

Proposed in 1950 to judge machine "intelligence" via conversation.

Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).

Modern Relevance:

Tests if AI can replace humans in jobs or social roles.

Unlike static benchmarks, it’s dynamic and interactive

🔰 @scopeofai | #papers
1👍1
خودتونو تست کنید

یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه

کدوم جواب، جواب انسانه
؟ A یا B
1🤔1🤓1
AI Scope
خودتونو تست کنید یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه کدوم جواب، جواب انسانه؟ A یا B
من خودم گول خوردم.

شرکت کننده B انسانه. A ولی مدل ChatGPT-4.5 هستش :))))
👍1😱1
۳. روش تحقیق

۲۸۴ نفر به مدت ۵ دقیقه هم با انسان‌ها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.


به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا

🔴 بدون پرسونا: فقط گفتن "انسان‌وار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"

Experiment Setup:

Task: Talk to 1 human + 1 AI, then pick the human.

Prompt Tricks:

No-Persona: Just "act human."

Persona: Fake backstory (young, uses slang, introverted)

🔰 @scopeofai | #papers
1
۴. نتایج


مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )

مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو

مدل‌های ضعیف‌تر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.


📌 پرسوناسازى عملکرد رو دو برابر کرد.

📌 حتی آدم‌های متخصص هم نتونستن GPT-4.5 رو تشخیص بدن


Win Rates:

GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).

LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).

Baselines (ELIZA, GPT-4o): ~22% (failed).

Persona prompts doubled AI’s success (p < 0.001).

Even AI experts couldn’t reliably spot GPT-4.5.

🔰 @scopeofai | #papers
👏1
5- بحث و تحلیل

💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی می‌تونه شبیه انسان رفتار کنه.

شرکت‌کننده‌ها بیشتر به حالت‌های گفتار (مثل شوخ‌طبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابل‌اعتمادتر به نظر برسه.

📌هوش مصنوعی می‌تونه جای مشاغل، دوستی‌ها یا حتی اخبار جعلی رو بگیره.

📌تشخیصش سخته—حتی آدم‌های باتجربه هم گول خوردن

Keypoints:

Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.

Humans judged AI on social cues (slang, humor) not logic/math.

Persona prompts made AI seem more relatable.

AI could replace jobs, friendships, or spread fake info.

Hard to detect—even tech-savvy users were fooled

🔰 @scopeofai | #papers
1👍1
6- نتیجه‌گیری

👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسان‌بودن" هم عوض شه


کارهای بعدی:

تست‌های طولانی‌تر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه

The Turing Test is just the start—humans might redefine "humanity" as AI improves.

Future Work:

Longer chats, expert interrogators, or voice/video tests

🔰 @scopeofai | #papers
1
⭐️ نکات کلیدی

۱. هوش مصنوعی می‌تونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیت‌سازی مهمه: وقتی به هوش مصنوعی یه شخصیت می‌دن (مثلا "نوجوان خجالتی")، بهتر عمل می‌کنه.
۳. مهم‌تر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالش‌برانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوست‌ها رو بگیره

AI Can Fake Being Human: GPT-4.5 tricked 73% of people.

Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.

Social > Smart: People cared more about chat style than IQ.

Big Changes Coming: AI might replace customer service, therapy, or even friends.

🔰 @scopeofai | #papers
1👍1
یکی داره داد میزنه میگه شرم بر شما!!!!
😐2
وسط لایو
خب جمعش کردن خداروشکر🤲
کوپایلت میتونه با یه پرامپت ساده واستون یه پادکست شخصی بسازه توی کوتاه ترین زمان ممکن!
👍3
با Copilot Vision میتونید دوربینتون رو فعال کنید تا کوپایلت هرچیزی که شما میبینید رو ببینه و شمارو راهنمایی کنه
🔥2👍1
چیزجالبش اینه که نمیخواد هیچی رو توضیح بدید. کوپایلت میفهمه و هر تغییری توی دنیای واقعی ایجاد بشه با دوربین شما میبینه و یاد میگیره
👍2
DeepResearch کوپایلت هم معرفی شد