AI Scope
122 subscribers
178 photos
21 videos
17 files
108 links
Download Telegram
AI Scope
💡 گوگل باهوش ترین مدل خودش رو معرفی کرد گوگل جدیدترین و باهوش‌ترین مدل خودش به نام Gemini 2.5 Pro رو معرفی کرد. مدلی که توی خیلی از موضوعات مثل کدزنی، ریاضیات و حل مسئله از رقیب های خودش مثل OpenAI o3-mini و Claude 3.7 sonnetجلو زده فعلا رایگان نمیشه…
گوگل طی یه حرکت باورنکردنی، جدیدترین مدل خودش رو رایگان کرد

حالا میتونید بدون پرداخت هیچ هزینه ای به باهوش ترین مدل گوگل دسترسی داشته باشید که توی کد زدن بهترینه

Google has made an astonishing move by offering its latest AI model for free. You can now access Google's most advanced model, which excels in coding, without paying any fees

📰 @scopeofai | #news
🔥21
شرکت هوش مصنوعی Anthropic که به خاطر استفاده از متن ترانه‌های دارای کپی‌رایت توی آموزش مدل‌های خودش تحت پیگرد قانونی قرار گرفته بود، تونست توی دادگاه آمریکا پیروز بشه.
دادگاه درخواست شرکت‌های موسیقی برای ممنوعیت استفاده Anthropic از این آثار توی آموزش مدل‌های آینده رو رد کرد. با این حال، پرونده همچنان ادامه داره


Anthropic, an AI company accused of using copyrighted song lyrics to train its models, scored a win in a U.S. court. The court denied record labels' request for an injunction to stop Anthropic from using these works in future training. However, the case is ongoing, and music companies remain confident about proving their claims in later stages.

📰 @scopeofai | #news
🔥31
با پی دی افت صحبت کن!

📈 سایت ChatPDF یکی از بهترین و سریع ترین سایت ها برای آنالیز فایل های پی دی افه

با استفاده از این سایت میتونید با هوش مصنوعی در مورد فایلتون چت کنید و هر سوالی که میخوایید ازش بپرسید. اون هم طبق اطلاعات موجود توی فایل شما جوابتون رو میده

تنها عیبش اینه که فقط دو تا فایل در روز میتونید رایگان آپلود کنید

ChatPDF is one of the best and fastest platforms for analyzing PDF files.
It allows users to interact with their documents using artificial intelligence.
By uploading a PDF file, users can ask any question about its content, and the platform provides accurate answers based on the data within the file.
Additionally, ChatPDF can summarize lengthy documents, making it an efficient tool for students, researchers, and professionals

https://www.chatpdf.com/

🧰 @scopeofai | #tools
👍41
سم آلتمن رسما با این توییت اعلام کرد که به زودی اشتراک چت جی پی تی پلاس برای تمامی دانشجو های آمریکایی و کانادایی به صورت رایگان فعال میشه

ما هیچ ما فقط نگاه جدی

📰 @scopeofai | #news
👍21
💣 میخواییم یه مقاله خیلی جالب که تازه 4 روز پیش سابمیت شده رو کامل تحلیل کنیم. حتما امروز کانال رو چک کنید
🔥52🤔1
Media is too big
VIEW IN TELEGRAM
خفن ترین چیزی که امروز دیدم

💯 این ویدیو تبلیغاتی صفر تا صدش با هوش مصنوعی درست شده!

از تک تک آدم ها و تصاویر داخلش گرفته تا موزیکی که میشنوید، همه و همه ساخته شده توسط هوش مصنوعین

این البته تبلیغ رسمی KFC نیست و فقط یه تست بود تا بشه فهمید هوش مصنوعی چقدر میتونه به استانداردهای کمپین تبلیغاتی نزدیک بشه

The most impressive thing I saw today was a promotional video entirely created using artificial intelligence. From the people and images featured to the music playing, every element was AI-generated.

However, this video wasn't an official KFC advertisement but rather a test to explore how closely AI could replicate the standards of a professional advertising campaign.

@scopeofai
🤯3👏1
AI Scope
خفن ترین چیزی که امروز دیدم 💯 این ویدیو تبلیغاتی صفر تا صدش با هوش مصنوعی درست شده! از تک تک آدم ها و تصاویر داخلش گرفته تا موزیکی که میشنوید، همه و همه ساخته شده توسط هوش مصنوعین این البته تبلیغ رسمی KFC نیست و فقط یه تست بود تا بشه فهمید هوش مصنوعی چقدر…
🤯 این پروژه با کمتر از 400 دلار درست شده، پروژه ای که به صورت تکنیکی به بیشتر از 400 هزار دلار بودجه نیاز داشت...

برای ساختنش هزاران عکس غذا تولید شده و از ابزارهایی مثل Runway, Pika, Kling AI, Google DeepMind Veo2, Luma AI,OpenAI’s Sora,Suno استفاده کردن

کل خبر رو از سایت فایننشال اکسپرس بخونید: https://www.financialexpress.com/business/brandwagon-ai-powered-kfc-ad-shows-future-of-food-commercials-created-for-under-400-creative-industry-is-toast-netizens-react-3795399/

📰 @scopeofai | #news
👍1👌1
This essay explores whether contemporary Large Language Models (LLMs) can pass the Turing test, a benchmark proposed by Alan Turing to evaluate machine intelligence. The study involved evaluating four systems—GPT-4.5, LLaMa-3.1-405B, GPT-4o, and ELIZA—in randomized, controlled three-party Turing tests with two independent populations: UCSD undergraduate students and Prolific workers. Participants engaged in simultaneous conversations with a human and an AI system before judging which conversational partner they believed was human.

📁 Paper: https://arxiv.org/pdf/2503.23674


@scopeofai
@LLM_learning
1
AI Scope
LLM Pass the turing test.pdf
این یه مقاله معمولی نیست. اسمش فقط به تنهایی میتونه تن و بدنمون رو بلرزونه:

Large Language Models Pass The Turing Test

تازه بعد 75 ساله که برای اولین بار هوش مصنوعی تونسته رویای آلن تورینگ رو محقق کنه

بریم کامل بررسیش کنیم...
۱. چکیده

این تحقیق نشون داد که:

مدل GPT-4.5 تونست موفقیت 73 درصدی داشته باشه و آدما رو قانع کرد که یه انسانه نه یه ربات
مدل LLaMa-3.1 مشابه انسان‌ها عمل کرد و موفقیت 56 درصدی داشت
مدل‌های قدیمی مثل ELIZA و GPT-4o فقط 21 تا 23 درصد موفقیت داشتن

چرا مهمه؟ این اولین باره که یه هوش مصنوعی تونسته تست تورینگ کلاسیک رو با موفقیت پشت سر بذاره.



The study shows GPT-4.5 (with a "humanlike" prompt) fools 73% of people, beating real humans in a Turing Test.


GPT-4.5 (Persona): 73% win rate (higher than humans).

LLaMa-3.1 (Persona): 56% (same as humans).

Baselines (ELIZA, GPT-4o): Failed (21–23%).


🔰 @scopeofai | #papers
1
2- مقدمه

تست تورینگ چیه و چرا هنوز مهمه؟


آلن تورینگ تو سال ۱۹۵۰ پیشنهاد داد که اگه یه ماشین بتونه توی گفتگوی های متنی شبیه انسان عمل کنه به طوری که یه آدم نتونه بفهمه طرف مقابلش آدمه یا ماشینه، میشه ماشین رو "هوشمند" در نظر گرفت

منتقدان می‌گن این تست یا خیلى ساده‌انگارانست (انسان‌ها زود فریب می‌خورن) یا خیلى سختگیرانه (ماشین‌ها باید دروغ بگن تا قبول شن).

چرا هنوز مهمه؟

⚪️ این تست نشون می‌ده که آیا هوش مصنوعی می‌تونه جای انسان‌ها رو توی کارها یا روابط اجتماعی بگیره یا نه.
⚫️ برخلاف آزمون‌های محدود دیگه، تست تورینگ انعطاف‌پذیر و تعاملیه


Turing Test Basics:

Proposed in 1950 to judge machine "intelligence" via conversation.

Critics say it’s flawed (humans are easy to trick, or it’s unfair to AI).

Modern Relevance:

Tests if AI can replace humans in jobs or social roles.

Unlike static benchmarks, it’s dynamic and interactive

🔰 @scopeofai | #papers
1👍1
خودتونو تست کنید

یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه

کدوم جواب، جواب انسانه
؟ A یا B
1🤔1🤓1
AI Scope
خودتونو تست کنید یکی از جواب ها جواب انسانه و اون یکی جواب هوش مصنوعیه کدوم جواب، جواب انسانه؟ A یا B
من خودم گول خوردم.

شرکت کننده B انسانه. A ولی مدل ChatGPT-4.5 هستش :))))
👍1😱1
۳. روش تحقیق

۲۸۴ نفر به مدت ۵ دقیقه هم با انسان‌ها و هم با هوش مصنوعی چت کردن و بعد حدس زدن کدومشون واقعیه.


به مدل های پیشرفته ای مثل GPT-4.5 و LLaMa-3.1 دو جور دستور دادن، یکی بدون پرسونا ( شخصیت ) و یکی با پرسونا

🔴 بدون پرسونا: فقط گفتن "انسان‌وار رفتار کن"
🟢 با پرسونا: یه شخصیت ساختگی براش ساختن. مثلا بهش گفتن "نقش یه آدم جوونِ خجالتی که از اصطلاحات اینترنتی استفاده میکنه رو بازی کن"

Experiment Setup:

Task: Talk to 1 human + 1 AI, then pick the human.

Prompt Tricks:

No-Persona: Just "act human."

Persona: Fake backstory (young, uses slang, introverted)

🔰 @scopeofai | #papers
1
۴. نتایج


مدل GPT-4.5 پرسونادار 73 درصد موفقیت داشت. 76 درصد کاربرهای عمومی رو متقاعد کرد و 69 درصد از دانشجوهارو ( بهتر از انسان ها عمل کرد )

مدل LLaMa پرسونادار 56 درصد موفقیت داشت. 65 درصد از کاربران عمومی رو متقاعد کرد و 45 درصد از دانشجو هارو

مدل‌های ضعیف‌تر مثل ELIZA و GPT-4o فقط ۲۲٪ موفقیت داشتن.


📌 پرسوناسازى عملکرد رو دو برابر کرد.

📌 حتی آدم‌های متخصص هم نتونستن GPT-4.5 رو تشخیص بدن


Win Rates:

GPT-4.5 (Persona): 73% (Prolific: 76%, Students: 69%).

LLaMa (Persona): 56% (Prolific: 65%, Students: 45%).

Baselines (ELIZA, GPT-4o): ~22% (failed).

Persona prompts doubled AI’s success (p < 0.001).

Even AI experts couldn’t reliably spot GPT-4.5.

🔰 @scopeofai | #papers
👏1
5- بحث و تحلیل

💡 عبور از تست تورینگ لزوما به معنی "هوشمند" بودن نیست، فقط یعنی هوش مصنوعی می‌تونه شبیه انسان رفتار کنه.

شرکت‌کننده‌ها بیشتر به حالت‌های گفتار (مثل شوخ‌طبعی یا اصطلاحات) توجه کردن تا منطق و ریاضی.
همچنین پرسوناسازى باعث شد هوش مصنوعی قابل‌اعتمادتر به نظر برسه.

📌هوش مصنوعی می‌تونه جای مشاغل، دوستی‌ها یا حتی اخبار جعلی رو بگیره.

📌تشخیصش سخته—حتی آدم‌های باتجربه هم گول خوردن

Keypoints:

Passing the Turing Test doesn’t mean AI is "smart"—just humanlike.

Humans judged AI on social cues (slang, humor) not logic/math.

Persona prompts made AI seem more relatable.

AI could replace jobs, friendships, or spread fake info.

Hard to detect—even tech-savvy users were fooled

🔰 @scopeofai | #papers
1👍1
6- نتیجه‌گیری

👊🏻 این تازه اول راهه—با پیشرفت هوش مصنوعی، شاید تعریف "انسان‌بودن" هم عوض شه


کارهای بعدی:

تست‌های طولانی‌تر، یا استفاده از متخصصان به جای افراد عادی.
شاید تست های صوتی و تصویری گرفته بشه

The Turing Test is just the start—humans might redefine "humanity" as AI improves.

Future Work:

Longer chats, expert interrogators, or voice/video tests

🔰 @scopeofai | #papers
1
⭐️ نکات کلیدی

۱. هوش مصنوعی می‌تونه آدمو فریب بده: مدل GPT-4.5 تونست ۷۳٪ مردم رو گول بزنه.
۲. شخصیت‌سازی مهمه: وقتی به هوش مصنوعی یه شخصیت می‌دن (مثلا "نوجوان خجالتی")، بهتر عمل می‌کنه.
۳. مهم‌تر از هوش، رفتار انسانه: مردم بیشتر به طبیعی حرف زدن توجه کردن تا بهره هوشی
۴. آینده چالش‌برانگیزه: شاید هوش مصنوعی جای پشتیبانى مشتری، روانشناس یا حتی دوست‌ها رو بگیره

AI Can Fake Being Human: GPT-4.5 tricked 73% of people.

Role-Playing Helps: Giving AI a "personality" (e.g., "shy teen") boosted scores.

Social > Smart: People cared more about chat style than IQ.

Big Changes Coming: AI might replace customer service, therapy, or even friends.

🔰 @scopeofai | #papers
1👍1