Geek Alerts – Telegram

Geek Alerts

21.6K subscribers

2.89K photos

421 videos

10 files

2.38K links

گیک آلرتس، جایی برای گیک‌ها
نوشته‌ها از هوش‌ مصنوعی، فناوری‌های روز، مقالات علمی، رویدادها، تغییرات و دگرگونی‌های جهانی و ... است.
وب‌سایت: https://geekalerts.org
اکس: https://x.com/Geek_Alerts
ارتباط: [email protected]

Download Telegram

About

Blog

Apps

Platform

21.6K subscribers

شرکت چینی Moonshot AI مدل agent محور Kimi K2 رو به‌صورت متن‌باز منتشر کرده. این شرکت ادعا کرده که این مدل برای agentic tasks بهینه شده، یعنی خودش شروع به پیدا کردن ابزار می‌کنه و با اون‌ها کاری که می‌خواید رو انجام می‌ده.

مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلن‌های مربوط به یک کنسرت رو می‌ریزه و گزارش نهایی رو ایمیل می‌کنه. یا با Ipython داده‌های آماری رو بصری‌سازی می‌کنه و صفحه وب‌های تعاملی می‌سازه. یا شبیه‌سازی‌های محیطی مثل ماینکرفت یا کهکشان رو اجرا می‌کنه. قابلیت اضافه کردن به ترمینال رو هم داره.

راهنمای استفاده ازش روی گیت‌هاب قرار داره، و از HuggingFace می‌شه مدل‌ها رو دانلود کرد. [L]

🤓 abolfazl @geekalerts

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤53👍19🔥5

10.9K views18:58

چرا گوگل ۲.۴ میلیارد دلار برای استخدام تیم ویندسرف پرداخت کرد؟

ما نوعی قرارداد داریم به اسم اکوی‌هایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعداد‌های کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژی‌هاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.

روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیان‌گذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپ‌مایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژی‌هاشون هم میشه (ادیتور و وایب‌کدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.

یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذاب‌تر بوده. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥40👍21😁6🤯4❤3

9.65K views14:51

قرار هست OpenAI یه مدل Open-Weight معرفی کنه، یعنی این مدل دیگه فقط روی سرورهای خودشون نیست و میشه دانلودش کرد، افراد، شرکت‌ها و دولت‌ها میتونن روی سرورهای خودشون این مدل رو اجرا کنن، مثل وقتی مدل R1 از دیپ‌سیک اومد و مایکروسافت اونو به سرورهای آژور خودش اضافه…

مدل وزن‌باز OpenAI که قرار بود این هفته بیاد تاخیر خورد، سم‌آلتمن میگه تست‌های ایمنی اضافی لازم داشت چون وقتی وزن‌ها در دسترس همه قرار بگیرن دیگه نمیشه کاری کرد.

این ایمنی که میگن منظور جواب‌هایی هست که مدل میده، مثلا روزهای گذشته جواب‌های تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنی‌های بیشتر رو اضافه کردن. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

👍47❤11😁9👎2😡2

9.84K views16:18

گراک ویژگی Companions رو اضافه کرده که میشه کاراکتر انتخاب کرد و با کاراکتر در کنار مدل Grok 4 صحبت کنید. یه سری کاستوم‌ها هم میشه مثل تغییر لحن و مدل جواب دادن. ویژگیش فعلا فقط برای مشترکین سوپر گراک هست و توی نسخه IOS میشه بهش دسترسی داشت. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁19👍9🔥3👎1😡1

10.5K viewsedited 16:53

اداره غذا و داروی آمریکا (FDA) یک رنگ خوراکی جدید (آبی) که از میوه گاردنیا به‌دست میاد رو تایید کرده، امسال تمرکزشون روی حذف رنگ‌های خوراکی مصنوعی هست، این رنگ جدید می‌تونه تو آب‌نبات، نوشیدنی‌های ورزشی و چای استفاده بشه. آمریکا می‌خواد تولیدکننده‌ها سریع‌تر از رنگ‌های نفتی فاصله بگیرن و این‌هارو از صنایع غذایی خودش حذف کنه. این چهارمین افزودنی رنگ طبیعیه که امسال تایید شده.

اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا مواد‌های غذایی بی‌رنگ‌تر میشن. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

👍111❤30👏13👎2😁2😍2

8.58K viewsedited 08:18

شرکت MistralAI مدل‌های Voxtral رو که با ورودی صدا(صدا به متن) کار می‌کنن، به‌صورت متن‌باز عرضه کرده. این مدل‌ها با ۳ و ۲۴ میلیارد پارامتر برای انجام وظایفی مثل جواب دادن به سوالات درباره محتوای صوتی یا رونویسی از روی صدا تا ۳۰ دقیقه و درک محتوای صوتی تا ۴۰ دقیقه با محدودیت ۳۲ هزار توکنی می‌تونن به‌کار گرفته بشن.

تو نتایج بنچمارک، Voxtral به‌طور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متن‌باز تا الان، بهتر عمل می‌کنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبان‌های انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی می‌کنه.

به این دو مدل می‌شه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]

🤓 abolfazl @geekalerts

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤35👍13🔥4

8.26K views08:01

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

گوگل قابلیت‌های جدیدی که مبتنی بر هوش‌مصنوعی‌ هستن رو به موتور جستجوی خودش اضافه می‌کنه. با اضافه کردن تب AIMode، می‌شه از مدل‌های جمنای 2.5 پرو و فلش برای گرفتن پاسخ استفاده کرد که ورژن پرو برای کارهای پیچیده‌تر مناسب‌تره.

حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیده‌تر مثل پروژه‌های کاری یا تکالیف دانشگاهی اضافه کرده که می‌تونه منابع مختلف رو همزمان جست‌وجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.

قابلیت بعدی تماس گرفتن هوش‌مصنوعی گوگل با کسب‌و‌کارهای محلی برای جمع‌آوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستوران‌های اطرف من» و اجازه دادن به هوش‌مصنوعی برای بررسی قیمت‌ها، با رستوران‌ها تماس می‌گیره، و با پرس‌وجو یک نسخه سازماندهی‌شده از چیزهایی که لازم دارید رو برای شما تهیه می‌کنه.

این قابلیت‌ها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی می‌شه. [L]

🤓 hadi @geekalerts

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤47👍11🔥7😡3😁1😍1

7.62K views16:12

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

اوپن‌ای‌آی، ChatGPT agent رو به‌عنوان ایجنتی برای وظایف کلی‌تر منتشر کرده. این ایجنت می‌تونه با کلندر کار کنه، اسلایدهای قابل ویرایش برای ارائه بسازه و کدها رو اجرا کنه. این ابزار قابلیت‌های کلیک روی وبسایت اوپراتور رو با دیپ‌سرچ ترکیب می‌کنه و می‌تونه گزارش‌های کامل‌تری رو تولید کنه.

ترکیب ایجنت با کانکتورهای چت جی‌پی‌تی، اجازه می‌ده از اطلاعات اپ‌هایی مثل جیمیل یا گیت‌هاب استفاده کنه و از اون‌ها برای جواب بهتر دادن به پرامپ استفاده کنه. دسترسی به ترمینال هم برای اون ممکنه و از API می‌تونه برای متصل شدن به اپلیکیشن‌های دیگه هم استفاده کنه.

تو بنچمارک Humanity’s Last Exam که هزاران سوال‌ تو موضوعات مختلفه، ۴۱٪ رو کسب کرده که دو برابر مدل‌های o3 و o4-mini بوده. نتایج بنچمارک FrontierMath، که سخت‌ترین بنچمارک ریاضیه، نشون می‌ده با داشتن ابزاری مثل ترمینال برای اجرای کد، نسبت به مدل o4-mini که ۶.۳٪ رو کسب کرده، ایجنت امتیاز ۲۷.۴٪ رو کسب کرده.

این قابلیت برای مشترکین پرو، پلاس و تیم اوپن‌ای‌آی فعال شده، و می‌شه با فعال کردن agent mode تو چت جی‌پی‌تی ازش استفاده کرد. [L]

🤓 abolfazl @geekalerts

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍49❤13🔥3🤯1

8.41K views07:03

This media is not supported in your browser

VIEW IN TELEGRAM

نتفلیکس برای اولین بار از صحنه‌ای که با ابزار هوش‌مصنوعی ساخته شده تو سریال آرژانتینی El Atonata استفاده کرده.

مدیرعامل این کمپانی گفته برای ساختن صحنه فروریختن یک ساختمان از هوش‌مصنوعی استفاده کردن و نتیجه ۱۰ برابر سریع‌تر آماده شده. البته هزینه کلی هم ارزون‌تر از روش‌های معمول VFX بوده. قراره از این به بعد با ترکیب این دو تکنیک با هم، جلوه‌های ویژهٔ پرهزینه مثل جوان‌سازی رو که فقط مختص پروژه‌هایی با بودجه زیادن، رو به بقیه پروژه‌ها هم برسونن.

ویدیوی بالا روند ساخت جلوه‌های ویژه بصری این سریال رو نشون می‌ده. [L]

🤓 abolfazl @geekalerts

Please open Telegram to view this post

VIEW IN TELEGRAM

👍57🔥13❤7👏4👎3😡1

6.99K viewsedited 14:37

بعد از برگزاری IMO 2025 (معتبرترین المپیاد ریاضی دانش‌آموزی جهان)، سایت matharena که روی المپیادهای ریاضی از مدل‌های مختلف بنچمارک می‌گیره و داورهای انسانی اون رو بررسی می‌کنن، المپیاد امسال رو روی مدل‌ها امتحان کردن.

هر مدل اجازه داره ۴ بار سوال رو حل کنه. نتیجه این بوده که به کمترین درصد برای رسیدن به مدال برنز هم دست نیافتن و البته درسته هیچ کدوم از مدل‌ها سوال‌ها رو به طور کامل حل نکردن و یا کلا نتونستن حل کنن اما شده که بعضی از سوالات رو تا درصد خیلی خوبی حل کرده باشن. مدل Gemini 2.5 Pro با دقت ۳۱ درصدی و هزینه ۴۳۰ دلاری توی صدر جدول هست و تونسته سوال ۳ و ۵ رو بیشتر از ۵۰درصد راه‌حل رو بره. در مقام بعدی o3 (high) هست که دقت ۱۶ درصدی و هزینه ۲۲۰ دلاری و باقی مدل‌ها رو می‌بینید مثل Grok 4 که با وجود هزینه ۵۰۰ دلاری فقط ۱۱ درصد دقت داشته و هیچ سوالی رو به ۵۰ درصد نرسونده.

اغلب این تفاوت با بنچمارک‌هایی که خود شرکت‌ها منتشر می‌کنن به دلیل آموزش‌ندیدن مدل روی این سوالاته. سوالات المپیادها هرسال سبک جدیدی می‌گیرن و مدام تغییر می‌کنن و مدل‌ها برای چنین سوالاتی آموزش ندیدن، اما با وجود ضعف هم اونقدرها بد عمل نکردن. می‌تونید توی سایتشون سوالات و اجراها و جواب‌های مدل‌ها رو ببینید. [L]

در این مسابقات که در استرالیا هم برگزار شد، تیم ایران تونست ۲ طلا، ۳ نقره و ۱ برنز به‌دست بیاره و مقام ۱۲م رو کسب کنه.

🤓 hadi @geekalerts

Please open Telegram to view this post

VIEW IN TELEGRAM

👍99❤29😁8🙏4🔥3👏3

9.16K viewsedited 15:32

This media is not supported in your browser

VIEW IN TELEGRAM

گوگل ویژگی‌های آزمایشی ماه‌های گذشته‌رو برای تمام کاربران Gemini منتشر کرد، اول از این ویژگی میتونیم شروع کنیم که امکان تبدیل تصاویر رو به ویدیوهایی ۸ ثانیه‌ای به کمک Veo3 داخل Gemini میده. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

❤23👍10

6.29K views05:35

This media is not supported in your browser

VIEW IN TELEGRAM

مدل Veo3 که میتونید باهاش ویدیوهای ۸ ثانیه‌ای بسازید حالا در بیش از ۱۵۰ کشور در دسترس هست، برای استفاده از این مدل نیاز به اشتراک‌های پرو یا اولترا دارید، به نظر میرسه گوگل الان اجازه میده تعداد ویدیوهای بیشتری باهاش بسازید. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

❤28👍11🔥2

5.86K views05:35

This media is not supported in your browser

VIEW IN TELEGRAM

میتونید از Gemini برای برنامه‌ریزی و انجام برخی از تسک‌هاتون استفاده کنید، مثلا بهش بگید هر روز وقتی بیدار شدید خلاصه ایمیل‌هاتون رو براتون بفرسته، یا مثلا هر وقت یه رویدادی تو شهرتون بود بهتون اطلاع بده. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

👍35❤8🔥4

6.06K views05:35

This media is not supported in your browser

VIEW IN TELEGRAM

جمنای الان با اکثر برنامه‌های گوگل مثل نقشه گوگل، تسکس، تقویم و برنامه یادداشت برداری keep میتونه کار کنه، یعنی از گوگل مثلا بپرسید چه تسک‌هایی امروز دارم یا ازش بخواید تسک براتون اضافه کنه، همین امکان توی برنامه‌های دیگه هم هست. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

❤35👍22🔥1👏1

7.26K views05:35

This media is not supported in your browser

VIEW IN TELEGRAM

ویژگی Gemini live که باهاش میتونید با جمنای صحبت کنید حالا امکان فعال کردن زیرنویس رو اضافه کرده که وقتی باهاش صحبت میکند یه کپشن پایین جمنای میاد و به صورت زنده صحبت‌هارو به صورت متن هم نمایش میده، اسمش کپشن لایو هست و میتونید فعال یا غیرفعالش کنید. [L]

🤓

Please open Telegram to view this post

VIEW IN TELEGRAM

❤38👍18

7.34K viewsedited 05:35