شرکت چینی Moonshot AI مدل agent محور Kimi K2 رو بهصورت متنباز منتشر کرده. این شرکت ادعا کرده که این مدل برای agentic tasks بهینه شده، یعنی خودش شروع به پیدا کردن ابزار میکنه و با اونها کاری که میخواید رو انجام میده.
مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلنهای مربوط به یک کنسرت رو میریزه و گزارش نهایی رو ایمیل میکنه. یا با Ipython دادههای آماری رو بصریسازی میکنه و صفحه وبهای تعاملی میسازه. یا شبیهسازیهای محیطی مثل ماینکرفت یا کهکشان رو اجرا میکنه. قابلیت اضافه کردن به ترمینال رو هم داره.
راهنمای استفاده ازش روی گیتهاب قرار داره، و از HuggingFace میشه مدلها رو دانلود کرد. [L]
🤓 abolfazl @geekalerts
مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلنهای مربوط به یک کنسرت رو میریزه و گزارش نهایی رو ایمیل میکنه. یا با Ipython دادههای آماری رو بصریسازی میکنه و صفحه وبهای تعاملی میسازه. یا شبیهسازیهای محیطی مثل ماینکرفت یا کهکشان رو اجرا میکنه. قابلیت اضافه کردن به ترمینال رو هم داره.
راهنمای استفاده ازش روی گیتهاب قرار داره، و از HuggingFace میشه مدلها رو دانلود کرد. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53👍19🔥5
چرا گوگل ۲.۴ میلیارد دلار برای استخدام تیم ویندسرف پرداخت کرد؟
ما نوعی قرارداد داریم به اسم اکویهایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعدادهای کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژیهاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.
روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیانگذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپمایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژیهاشون هم میشه (ادیتور و وایبکدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.
یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذابتر بوده. [L]
🤓 @geekalerts
ما نوعی قرارداد داریم به اسم اکویهایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعدادهای کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژیهاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.
روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیانگذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپمایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژیهاشون هم میشه (ادیتور و وایبکدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.
یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذابتر بوده. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍21😁6🤯4❤3
Geek Alerts
قرار هست OpenAI یه مدل Open-Weight معرفی کنه، یعنی این مدل دیگه فقط روی سرورهای خودشون نیست و میشه دانلودش کرد، افراد، شرکتها و دولتها میتونن روی سرورهای خودشون این مدل رو اجرا کنن، مثل وقتی مدل R1 از دیپسیک اومد و مایکروسافت اونو به سرورهای آژور خودش اضافه…
مدل وزنباز OpenAI که قرار بود این هفته بیاد تاخیر خورد، سمآلتمن میگه تستهای ایمنی اضافی لازم داشت چون وقتی وزنها در دسترس همه قرار بگیرن دیگه نمیشه کاری کرد.
این ایمنی که میگن منظور جوابهایی هست که مدل میده، مثلا روزهای گذشته جوابهای تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنیهای بیشتر رو اضافه کردن. [L]
🤓 @geekalerts
این ایمنی که میگن منظور جوابهایی هست که مدل میده، مثلا روزهای گذشته جوابهای تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنیهای بیشتر رو اضافه کردن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47❤11😁9👎2😡2
گراک ویژگی Companions رو اضافه کرده که میشه کاراکتر انتخاب کرد و با کاراکتر در کنار مدل Grok 4 صحبت کنید. یه سری کاستومها هم میشه مثل تغییر لحن و مدل جواب دادن. ویژگیش فعلا فقط برای مشترکین سوپر گراک هست و توی نسخه IOS میشه بهش دسترسی داشت. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19👍9🔥3👎1😡1
اداره غذا و داروی آمریکا (FDA) یک رنگ خوراکی جدید (آبی) که از میوه گاردنیا بهدست میاد رو تایید کرده، امسال تمرکزشون روی حذف رنگهای خوراکی مصنوعی هست، این رنگ جدید میتونه تو آبنبات، نوشیدنیهای ورزشی و چای استفاده بشه. آمریکا میخواد تولیدکنندهها سریعتر از رنگهای نفتی فاصله بگیرن و اینهارو از صنایع غذایی خودش حذف کنه. این چهارمین افزودنی رنگ طبیعیه که امسال تایید شده.
اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا موادهای غذایی بیرنگتر میشن. [L]
🤓 @geekalerts
اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا موادهای غذایی بیرنگتر میشن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍111❤30👏13👎2😁2😍2
شرکت MistralAI مدلهای Voxtral رو که با ورودی صدا(صدا به متن) کار میکنن، بهصورت متنباز عرضه کرده. این مدلها با ۳ و ۲۴ میلیارد پارامتر برای انجام وظایفی مثل جواب دادن به سوالات درباره محتوای صوتی یا رونویسی از روی صدا تا ۳۰ دقیقه و درک محتوای صوتی تا ۴۰ دقیقه با محدودیت ۳۲ هزار توکنی میتونن بهکار گرفته بشن.
تو نتایج بنچمارک، Voxtral بهطور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متنباز تا الان، بهتر عمل میکنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبانهای انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی میکنه.
به این دو مدل میشه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]
🤓 abolfazl @geekalerts
تو نتایج بنچمارک، Voxtral بهطور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متنباز تا الان، بهتر عمل میکنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبانهای انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی میکنه.
به این دو مدل میشه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35👍13🔥4
گوگل قابلیتهای جدیدی که مبتنی بر هوشمصنوعی هستن رو به موتور جستجوی خودش اضافه میکنه. با اضافه کردن تب AIMode، میشه از مدلهای جمنای 2.5 پرو و فلش برای گرفتن پاسخ استفاده کرد که ورژن پرو برای کارهای پیچیدهتر مناسبتره.
حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیدهتر مثل پروژههای کاری یا تکالیف دانشگاهی اضافه کرده که میتونه منابع مختلف رو همزمان جستوجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.
قابلیت بعدی تماس گرفتن هوشمصنوعی گوگل با کسبوکارهای محلی برای جمعآوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستورانهای اطرف من» و اجازه دادن به هوشمصنوعی برای بررسی قیمتها، با رستورانها تماس میگیره، و با پرسوجو یک نسخه سازماندهیشده از چیزهایی که لازم دارید رو برای شما تهیه میکنه.
این قابلیتها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی میشه. [L]
🤓 hadi @geekalerts
حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیدهتر مثل پروژههای کاری یا تکالیف دانشگاهی اضافه کرده که میتونه منابع مختلف رو همزمان جستوجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.
قابلیت بعدی تماس گرفتن هوشمصنوعی گوگل با کسبوکارهای محلی برای جمعآوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستورانهای اطرف من» و اجازه دادن به هوشمصنوعی برای بررسی قیمتها، با رستورانها تماس میگیره، و با پرسوجو یک نسخه سازماندهیشده از چیزهایی که لازم دارید رو برای شما تهیه میکنه.
این قابلیتها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی میشه. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47👍11🔥7😡3😁1😍1
اوپنایآی، ChatGPT agent رو بهعنوان ایجنتی برای وظایف کلیتر منتشر کرده. این ایجنت میتونه با کلندر کار کنه، اسلایدهای قابل ویرایش برای ارائه بسازه و کدها رو اجرا کنه. این ابزار قابلیتهای کلیک روی وبسایت اوپراتور رو با دیپسرچ ترکیب میکنه و میتونه گزارشهای کاملتری رو تولید کنه.
ترکیب ایجنت با کانکتورهای چت جیپیتی، اجازه میده از اطلاعات اپهایی مثل جیمیل یا گیتهاب استفاده کنه و از اونها برای جواب بهتر دادن به پرامپ استفاده کنه. دسترسی به ترمینال هم برای اون ممکنه و از API میتونه برای متصل شدن به اپلیکیشنهای دیگه هم استفاده کنه.
تو بنچمارک Humanity’s Last Exam که هزاران سوال تو موضوعات مختلفه، ۴۱٪ رو کسب کرده که دو برابر مدلهای o3 و o4-mini بوده. نتایج بنچمارک FrontierMath، که سختترین بنچمارک ریاضیه، نشون میده با داشتن ابزاری مثل ترمینال برای اجرای کد، نسبت به مدل o4-mini که ۶.۳٪ رو کسب کرده، ایجنت امتیاز ۲۷.۴٪ رو کسب کرده.
این قابلیت برای مشترکین پرو، پلاس و تیم اوپنایآی فعال شده، و میشه با فعال کردن agent mode تو چت جیپیتی ازش استفاده کرد. [L]
🤓 abolfazl @geekalerts
ترکیب ایجنت با کانکتورهای چت جیپیتی، اجازه میده از اطلاعات اپهایی مثل جیمیل یا گیتهاب استفاده کنه و از اونها برای جواب بهتر دادن به پرامپ استفاده کنه. دسترسی به ترمینال هم برای اون ممکنه و از API میتونه برای متصل شدن به اپلیکیشنهای دیگه هم استفاده کنه.
تو بنچمارک Humanity’s Last Exam که هزاران سوال تو موضوعات مختلفه، ۴۱٪ رو کسب کرده که دو برابر مدلهای o3 و o4-mini بوده. نتایج بنچمارک FrontierMath، که سختترین بنچمارک ریاضیه، نشون میده با داشتن ابزاری مثل ترمینال برای اجرای کد، نسبت به مدل o4-mini که ۶.۳٪ رو کسب کرده، ایجنت امتیاز ۲۷.۴٪ رو کسب کرده.
این قابلیت برای مشترکین پرو، پلاس و تیم اوپنایآی فعال شده، و میشه با فعال کردن agent mode تو چت جیپیتی ازش استفاده کرد. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49❤13🔥3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
نتفلیکس برای اولین بار از صحنهای که با ابزار هوشمصنوعی ساخته شده تو سریال آرژانتینی El Atonata استفاده کرده.
مدیرعامل این کمپانی گفته برای ساختن صحنه فروریختن یک ساختمان از هوشمصنوعی استفاده کردن و نتیجه ۱۰ برابر سریعتر آماده شده. البته هزینه کلی هم ارزونتر از روشهای معمول VFX بوده. قراره از این به بعد با ترکیب این دو تکنیک با هم، جلوههای ویژهٔ پرهزینه مثل جوانسازی رو که فقط مختص پروژههایی با بودجه زیادن، رو به بقیه پروژهها هم برسونن.
ویدیوی بالا روند ساخت جلوههای ویژه بصری این سریال رو نشون میده. [L]
🤓 abolfazl @geekalerts
مدیرعامل این کمپانی گفته برای ساختن صحنه فروریختن یک ساختمان از هوشمصنوعی استفاده کردن و نتیجه ۱۰ برابر سریعتر آماده شده. البته هزینه کلی هم ارزونتر از روشهای معمول VFX بوده. قراره از این به بعد با ترکیب این دو تکنیک با هم، جلوههای ویژهٔ پرهزینه مثل جوانسازی رو که فقط مختص پروژههایی با بودجه زیادن، رو به بقیه پروژهها هم برسونن.
ویدیوی بالا روند ساخت جلوههای ویژه بصری این سریال رو نشون میده. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57🔥13❤7👏4👎3😡1
بعد از برگزاری IMO 2025 (معتبرترین المپیاد ریاضی دانشآموزی جهان)، سایت matharena که روی المپیادهای ریاضی از مدلهای مختلف بنچمارک میگیره و داورهای انسانی اون رو بررسی میکنن، المپیاد امسال رو روی مدلها امتحان کردن.
هر مدل اجازه داره ۴ بار سوال رو حل کنه. نتیجه این بوده که به کمترین درصد برای رسیدن به مدال برنز هم دست نیافتن و البته درسته هیچ کدوم از مدلها سوالها رو به طور کامل حل نکردن و یا کلا نتونستن حل کنن اما شده که بعضی از سوالات رو تا درصد خیلی خوبی حل کرده باشن. مدل Gemini 2.5 Pro با دقت ۳۱ درصدی و هزینه ۴۳۰ دلاری توی صدر جدول هست و تونسته سوال ۳ و ۵ رو بیشتر از ۵۰درصد راهحل رو بره. در مقام بعدی o3 (high) هست که دقت ۱۶ درصدی و هزینه ۲۲۰ دلاری و باقی مدلها رو میبینید مثل Grok 4 که با وجود هزینه ۵۰۰ دلاری فقط ۱۱ درصد دقت داشته و هیچ سوالی رو به ۵۰ درصد نرسونده.
اغلب این تفاوت با بنچمارکهایی که خود شرکتها منتشر میکنن به دلیل آموزشندیدن مدل روی این سوالاته. سوالات المپیادها هرسال سبک جدیدی میگیرن و مدام تغییر میکنن و مدلها برای چنین سوالاتی آموزش ندیدن، اما با وجود ضعف هم اونقدرها بد عمل نکردن. میتونید توی سایتشون سوالات و اجراها و جوابهای مدلها رو ببینید. [L]
در این مسابقات که در استرالیا هم برگزار شد، تیم ایران تونست ۲ طلا، ۳ نقره و ۱ برنز بهدست بیاره و مقام ۱۲م رو کسب کنه.
🤓 hadi @geekalerts
هر مدل اجازه داره ۴ بار سوال رو حل کنه. نتیجه این بوده که به کمترین درصد برای رسیدن به مدال برنز هم دست نیافتن و البته درسته هیچ کدوم از مدلها سوالها رو به طور کامل حل نکردن و یا کلا نتونستن حل کنن اما شده که بعضی از سوالات رو تا درصد خیلی خوبی حل کرده باشن. مدل Gemini 2.5 Pro با دقت ۳۱ درصدی و هزینه ۴۳۰ دلاری توی صدر جدول هست و تونسته سوال ۳ و ۵ رو بیشتر از ۵۰درصد راهحل رو بره. در مقام بعدی o3 (high) هست که دقت ۱۶ درصدی و هزینه ۲۲۰ دلاری و باقی مدلها رو میبینید مثل Grok 4 که با وجود هزینه ۵۰۰ دلاری فقط ۱۱ درصد دقت داشته و هیچ سوالی رو به ۵۰ درصد نرسونده.
اغلب این تفاوت با بنچمارکهایی که خود شرکتها منتشر میکنن به دلیل آموزشندیدن مدل روی این سوالاته. سوالات المپیادها هرسال سبک جدیدی میگیرن و مدام تغییر میکنن و مدلها برای چنین سوالاتی آموزش ندیدن، اما با وجود ضعف هم اونقدرها بد عمل نکردن. میتونید توی سایتشون سوالات و اجراها و جوابهای مدلها رو ببینید. [L]
در این مسابقات که در استرالیا هم برگزار شد، تیم ایران تونست ۲ طلا، ۳ نقره و ۱ برنز بهدست بیاره و مقام ۱۲م رو کسب کنه.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍99❤29😁8🙏4🔥3👏3
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل ویژگیهای آزمایشی ماههای گذشتهرو برای تمام کاربران Gemini منتشر کرد، اول از این ویژگی میتونیم شروع کنیم که امکان تبدیل تصاویر رو به ویدیوهایی ۸ ثانیهای به کمک Veo3 داخل Gemini میده. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23👍10
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Veo3 که میتونید باهاش ویدیوهای ۸ ثانیهای بسازید حالا در بیش از ۱۵۰ کشور در دسترس هست، برای استفاده از این مدل نیاز به اشتراکهای پرو یا اولترا دارید، به نظر میرسه گوگل الان اجازه میده تعداد ویدیوهای بیشتری باهاش بسازید. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
❤28👍11🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
میتونید از Gemini برای برنامهریزی و انجام برخی از تسکهاتون استفاده کنید، مثلا بهش بگید هر روز وقتی بیدار شدید خلاصه ایمیلهاتون رو براتون بفرسته، یا مثلا هر وقت یه رویدادی تو شهرتون بود بهتون اطلاع بده. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35❤8🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
جمنای الان با اکثر برنامههای گوگل مثل نقشه گوگل، تسکس، تقویم و برنامه یادداشت برداری keep میتونه کار کنه، یعنی از گوگل مثلا بپرسید چه تسکهایی امروز دارم یا ازش بخواید تسک براتون اضافه کنه، همین امکان توی برنامههای دیگه هم هست. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35👍22🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
ویژگی Gemini live که باهاش میتونید با جمنای صحبت کنید حالا امکان فعال کردن زیرنویس رو اضافه کرده که وقتی باهاش صحبت میکند یه کپشن پایین جمنای میاد و به صورت زنده صحبتهارو به صورت متن هم نمایش میده، اسمش کپشن لایو هست و میتونید فعال یا غیرفعالش کنید. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
❤38👍18