Geek Alerts
21.6K subscribers
2.89K photos
421 videos
10 files
2.38K links
گیک آلرتس، جایی برای گیک‌ها
نوشته‌ها از هوش‌ مصنوعی، فناوری‌های روز، مقالات علمی، رویدادها، تغییرات و دگرگونی‌های جهانی و ... است.
وب‌سایت: https://geekalerts.org
اکس: https://x.com/Geek_Alerts
ارتباط: [email protected]
Download Telegram
گوگل مجموعه‌ای از مدل‌های زبانی جدید به اسم T5Gemma رو معرفی کرده که از نوع رمزگذار-رمزگشاست. یعنی دو بخش داره: یکی جمله ورودی رو می‌فهمه (رمزگذار)، یکی با گرفتن اون مقدار جواب می‌ده (رمزگشا). فرقش با مدل‌هایی مثل سری GPT اینه که اونا فقط بخش جواب‌دهی یا رمزگشایی دارن.

کاری که گوگل کرده اینه که اومده مدل‌های قبلی رو، که فقط رمزگشا بودن رو با تکنیک انطباق پذیری آموزش داده و تبدیلشون کرده به مدل‌هایی که هم رمزگذار دارن هم رمزگشا. توی این معماری، اول کل جمله‌ی ورودی خوب پردازش می‌شه، بعد مدل شروع می‌کنه به تولید خروجی. این باعث می‌شه مدل بهتر بفهمه و جواب دقیق‌تری بده.

مقدار پارامتر رمزگذاررمزگشا تو مدل‌های T5 در بعضی موارد تغییر می‌کنه و ترکیبی از ۹ میلیارد و ۲ میلیارد پارامتره. این مدل‌ها روی HuggingFace قابل دانلودن. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
40👍15🔥8
شرکت چینی Moonshot AI مدل agent محور Kimi K2 رو به‌صورت متن‌باز منتشر کرده. این شرکت ادعا کرده که این مدل برای agentic tasks بهینه شده، یعنی خودش شروع به پیدا کردن ابزار می‌کنه و با اون‌ها کاری که می‌خواید رو انجام می‌ده.

مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلن‌های مربوط به یک کنسرت رو می‌ریزه و گزارش نهایی رو ایمیل می‌کنه. یا با Ipython داده‌های آماری رو بصری‌سازی می‌کنه و صفحه وب‌های تعاملی می‌سازه. یا شبیه‌سازی‌های محیطی مثل ماینکرفت یا کهکشان رو اجرا می‌کنه. قابلیت اضافه کردن به ترمینال رو هم داره.

راهنمای استفاده ازش روی گیت‌هاب قرار داره، و از HuggingFace می‌شه مدل‌ها رو دانلود کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
53👍19🔥5
چرا گوگل ۲.۴ میلیارد دلار برای استخدام تیم ویندسرف پرداخت کرد؟

ما نوعی قرارداد داریم به اسم اکوی‌هایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعداد‌های کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژی‌هاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.

روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیان‌گذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپ‌مایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژی‌هاشون هم میشه (ادیتور و وایب‌کدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.

یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذاب‌تر بوده. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍21😁6🤯43
Geek Alerts
قرار هست OpenAI یه مدل Open-Weight معرفی کنه، یعنی این مدل دیگه فقط روی سرورهای خودشون نیست و میشه دانلودش کرد، افراد، شرکت‌ها و دولت‌ها میتونن روی سرورهای خودشون این مدل رو اجرا کنن، مثل وقتی مدل R1 از دیپ‌سیک اومد و مایکروسافت اونو به سرورهای آژور خودش اضافه…
مدل وزن‌باز OpenAI که قرار بود این هفته بیاد تاخیر خورد، سم‌آلتمن میگه تست‌های ایمنی اضافی لازم داشت چون وقتی وزن‌ها در دسترس همه قرار بگیرن دیگه نمیشه کاری کرد.

این ایمنی که میگن منظور جواب‌هایی هست که مدل میده، مثلا روزهای گذشته جواب‌های تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنی‌های بیشتر رو اضافه کردن. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4711😁9👎2😡2
گراک ویژگی Companions رو اضافه کرده که میشه کاراکتر انتخاب کرد و با کاراکتر در کنار مدل Grok 4 صحبت کنید. یه سری کاستوم‌ها هم میشه مثل تغییر لحن و مدل جواب دادن. ویژگیش فعلا فقط برای مشترکین سوپر گراک هست و توی نسخه IOS میشه بهش دسترسی داشت. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19👍9🔥3👎1😡1
اداره غذا و داروی آمریکا (FDA) یک رنگ خوراکی جدید (آبی) که از میوه گاردنیا به‌دست میاد رو تایید کرده، امسال تمرکزشون روی حذف رنگ‌های خوراکی مصنوعی هست، این رنگ جدید می‌تونه تو آب‌نبات، نوشیدنی‌های ورزشی و چای استفاده بشه. آمریکا می‌خواد تولیدکننده‌ها سریع‌تر از رنگ‌های نفتی فاصله بگیرن و این‌هارو از صنایع غذایی خودش حذف کنه. این چهارمین افزودنی رنگ طبیعیه که امسال تایید شده.

اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا مواد‌های غذایی بی‌رنگ‌تر میشن. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11130👏13👎2😁2😍2
شرکت MistralAI مدل‌های Voxtral رو که با ورودی صدا(صدا به متن) کار می‌کنن، به‌صورت متن‌باز عرضه کرده. این مدل‌ها با ۳ و ۲۴ میلیارد پارامتر برای انجام وظایفی مثل جواب دادن به سوالات درباره محتوای صوتی یا رونویسی از روی صدا تا ۳۰ دقیقه و درک محتوای صوتی تا ۴۰ دقیقه با محدودیت ۳۲ هزار توکنی می‌تونن به‌کار گرفته بشن.

تو نتایج بنچمارک، Voxtral به‌طور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متن‌باز تا الان، بهتر عمل می‌کنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبان‌های انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی می‌کنه.

به این دو مدل می‌شه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
35👍13🔥4
گوگل قابلیت‌های جدیدی که مبتنی بر هوش‌مصنوعی‌ هستن رو به موتور جستجوی خودش اضافه می‌کنه. با اضافه کردن تب AIMode، می‌شه از مدل‌های جمنای 2.5 پرو و فلش برای گرفتن پاسخ استفاده کرد که ورژن پرو برای کارهای پیچیده‌تر مناسب‌تره.

حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیده‌تر مثل پروژه‌های کاری یا تکالیف دانشگاهی اضافه کرده که می‌تونه منابع مختلف رو همزمان جست‌وجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.

قابلیت بعدی تماس گرفتن هوش‌مصنوعی گوگل با کسب‌و‌کارهای محلی برای جمع‌آوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستوران‌های اطرف من» و اجازه دادن به هوش‌مصنوعی برای بررسی قیمت‌ها، با رستوران‌ها تماس می‌گیره، و با پرس‌وجو یک نسخه سازماندهی‌شده از چیزهایی که لازم دارید رو برای شما تهیه می‌کنه.

این قابلیت‌ها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی می‌شه. [L]

🤓 hadi @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
47👍11🔥7😡3😁1😍1
اوپن‌ای‌آی، ChatGPT agent رو به‌عنوان ایجنتی برای وظایف کلی‌تر منتشر کرده. این ایجنت می‌تونه با کلندر کار کنه، اسلایدهای قابل ویرایش برای ارائه بسازه و کدها رو اجرا کنه. این ابزار قابلیت‌های کلیک روی وبسایت اوپراتور رو با دیپ‌سرچ ترکیب می‌کنه و می‌تونه گزارش‌های کامل‌تری رو تولید کنه.

ترکیب ایجنت با کانکتورهای چت جی‌پی‌تی، اجازه می‌ده از اطلاعات اپ‌هایی مثل جیمیل یا گیت‌هاب استفاده کنه و از اون‌ها برای جواب بهتر دادن به پرامپ استفاده کنه. دسترسی به ترمینال هم برای اون ممکنه و از API می‌تونه برای متصل شدن به اپلیکیشن‌های دیگه هم استفاده کنه.

تو بنچمارک Humanity’s Last Exam که هزاران سوال‌ تو موضوعات مختلفه، ۴۱٪ رو کسب کرده که دو برابر مدل‌های o3 و o4-mini بوده. نتایج بنچمارک FrontierMath، که سخت‌ترین بنچمارک ریاضیه، نشون می‌ده با داشتن ابزاری مثل ترمینال برای اجرای کد، نسبت به مدل o4-mini که ۶.۳٪ رو کسب کرده، ایجنت امتیاز ۲۷.۴٪ رو کسب کرده.

این قابلیت برای مشترکین پرو، پلاس و تیم اوپن‌ای‌آی فعال شده، و می‌شه با فعال کردن agent mode تو چت جی‌پی‌تی ازش استفاده کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4913🔥3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
نتفلیکس برای اولین بار از صحنه‌ای که با ابزار هوش‌مصنوعی ساخته شده تو سریال آرژانتینی El Atonata استفاده کرده.

مدیرعامل این کمپانی گفته برای ساختن صحنه فروریختن یک ساختمان از هوش‌مصنوعی استفاده کردن و نتیجه ۱۰ برابر سریع‌تر آماده شده. البته هزینه کلی هم ارزون‌تر از روش‌های معمول VFX بوده. قراره از این به بعد با ترکیب این دو تکنیک با هم، جلوه‌های ویژهٔ پرهزینه مثل جوان‌سازی رو که فقط مختص پروژه‌هایی با بودجه زیادن، رو به بقیه پروژه‌ها هم برسونن.

ویدیوی بالا روند ساخت جلوه‌های ویژه بصری این سریال رو نشون می‌ده. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57🔥137👏4👎3😡1
بعد از برگزاری IMO 2025 (معتبرترین المپیاد ریاضی دانش‌آموزی جهان)، سایت matharena که روی المپیادهای ریاضی از مدل‌های مختلف بنچمارک می‌گیره و داورهای انسانی اون رو بررسی می‌کنن، المپیاد امسال رو روی مدل‌ها امتحان کردن.

هر مدل اجازه داره ۴ بار سوال رو حل کنه. نتیجه این بوده که به کمترین درصد برای رسیدن به مدال برنز هم دست نیافتن و البته درسته هیچ کدوم از مدل‌ها سوال‌ها رو به طور کامل حل نکردن و یا کلا نتونستن حل کنن اما شده که بعضی از سوالات رو تا درصد خیلی خوبی حل کرده باشن. مدل Gemini 2.5 Pro با دقت ۳۱ درصدی و هزینه ۴۳۰ دلاری توی صدر جدول هست و تونسته سوال ۳ و ۵ رو بیشتر از ۵۰درصد راه‌حل رو بره. در مقام بعدی o3 (high) هست که دقت ۱۶ درصدی و هزینه ۲۲۰ دلاری و باقی مدل‌ها رو می‌بینید مثل Grok 4 که با وجود هزینه ۵۰۰ دلاری فقط ۱۱ درصد دقت داشته و هیچ سوالی رو به ۵۰ درصد نرسونده.

اغلب این تفاوت با بنچمارک‌هایی که خود شرکت‌ها منتشر می‌کنن به دلیل آموزش‌ندیدن مدل روی این سوالاته. سوالات المپیادها هرسال سبک جدیدی می‌گیرن و مدام تغییر می‌کنن و مدل‌ها برای چنین سوالاتی آموزش ندیدن، اما با وجود ضعف هم اونقدرها بد عمل نکردن. می‌تونید توی سایتشون سوالات و اجراها و جواب‌های مدل‌ها رو ببینید. [L]

در این مسابقات که در استرالیا هم برگزار شد، تیم ایران تونست ۲ طلا، ۳ نقره و ۱ برنز به‌دست بیاره و مقام ۱۲م رو کسب کنه.

🤓 hadi @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9929😁8🙏4🔥3👏3
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل ویژگی‌های آزمایشی ماه‌های گذشته‌رو برای تمام کاربران Gemini منتشر کرد، اول از این ویژگی میتونیم شروع کنیم که امکان تبدیل تصاویر رو به ویدیوهایی ۸ ثانیه‌ای به کمک Veo3 داخل Gemini میده. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍10
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Veo3 که میتونید باهاش ویدیوهای ۸ ثانیه‌ای بسازید حالا در بیش از ۱۵۰ کشور در دسترس هست، برای استفاده از این مدل نیاز به اشتراک‌های پرو یا اولترا دارید، به نظر میرسه گوگل الان اجازه میده تعداد ویدیوهای بیشتری باهاش بسازید. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
28👍11🔥2