امروز xAI در رویدادی از Grok 4 و Grok 4 Heavy رونمایی کرد.
از پلن SuperGrok Heavy هم با قیمت ۳۰۰ دلار رونمایی کردن که دسترسی به این مدل رو فراهم میکنه. هر دو مدل در بنچمارکها تونستن پیشرفت و فاصله قابلتوجهی(با tool calling) نسبت به باقی مدلهای همردهشون مثل Gemini 2.5 Pro و o3 کسب کنن و الان بهترین مدل در ردهبندیهاست.
همچنین گراک در بنچمارک معروف ARC-AGI که سختترین بنچمارک موجود برای مدلهاست، با گرفتن ۱۵٪ رتبه اول رو با اختلاف کسب کرده. گفتن که مدل یک سیستم مولتیایجنت داره که با ایجنتهای مختلف تعامل میکنه، همزمان اجراشون میکنه، پاسخها رو مقایسه میکنه و خروجی رو نشون میده. گفتن مدل ویدیوییشون رو دارن آموزش میدن و هفتههای آینده مدل Grok 4 Code رو هم عرضه میکنن. [L]
🤓 hadi @geekalerts
از پلن SuperGrok Heavy هم با قیمت ۳۰۰ دلار رونمایی کردن که دسترسی به این مدل رو فراهم میکنه. هر دو مدل در بنچمارکها تونستن پیشرفت و فاصله قابلتوجهی(با tool calling) نسبت به باقی مدلهای همردهشون مثل Gemini 2.5 Pro و o3 کسب کنن و الان بهترین مدل در ردهبندیهاست.
همچنین گراک در بنچمارک معروف ARC-AGI که سختترین بنچمارک موجود برای مدلهاست، با گرفتن ۱۵٪ رتبه اول رو با اختلاف کسب کرده. گفتن که مدل یک سیستم مولتیایجنت داره که با ایجنتهای مختلف تعامل میکنه، همزمان اجراشون میکنه، پاسخها رو مقایسه میکنه و خروجی رو نشون میده. گفتن مدل ویدیوییشون رو دارن آموزش میدن و هفتههای آینده مدل Grok 4 Code رو هم عرضه میکنن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62❤15👍12👎4
اشتراکهای توییتر اکس تغییر کردن، الان فقط پلن پریمیومپلاس که ۳۸ دلار هست گراک رو ارائه میده که در واقع همون اشتراک ۸ دلاری پریمیوم هست به همراه اشتراک ۳۰ دلاری سوپر گراک.
سوپر گراک در کنار دسترسی به Grok 4 از Context Memory با ۱۲۸ هزار توکن هم پشتیبانی میکنه، ویژگی ویژن هم فقط توی این پلن در دسترس هست. یه اشتراک جدید و ۳۰۰ دلاری به اسم SuperGrok Heavy هم معرفی کردن که در کنار دسترسی به مدل جدید Heavy خدماتی مثل پشتیبانی اختصاصی رو داره. [L]
🤓 @geekalerts
سوپر گراک در کنار دسترسی به Grok 4 از Context Memory با ۱۲۸ هزار توکن هم پشتیبانی میکنه، ویژگی ویژن هم فقط توی این پلن در دسترس هست. یه اشتراک جدید و ۳۰۰ دلاری به اسم SuperGrok Heavy هم معرفی کردن که در کنار دسترسی به مدل جدید Heavy خدماتی مثل پشتیبانی اختصاصی رو داره. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31😁12❤8👎3🔥2😢1
Geek Alerts
امروز xAI در رویدادی از Grok 4 و Grok 4 Heavy رونمایی کرد. از پلن SuperGrok Heavy هم با قیمت ۳۰۰ دلار رونمایی کردن که دسترسی به این مدل رو فراهم میکنه. هر دو مدل در بنچمارکها تونستن پیشرفت و فاصله قابلتوجهی(با tool calling) نسبت به باقی مدلهای همردهشون…
چیزهایی که از Grok 4 میدانیم
مدل Grok 4 نزدیکترین مدل به AGI با ۱۰۰ برابر قدرت پردازشی بیشتر از گراک ۲ آموزش دیده، نصف تاخیر (Latency) گراک ۳ رو داره. احتمالا زیاد گراک ۳ هم برای دانلود در دسترس قرار بگیره.
بنچمارک ARC-AGI یکی از معیارهای اصلی برای سنجش AGI هست، برای ماهها هیچ مدلی نتونسته بود از مرز ۱۰ درصد عبور کنه. گراک ۴ در کمتر از ۱۲ ساعت به امتیاز ۱۵.۸ درصد رسید که رکورد جدیدی هست.
تو آزمونها مثلا HLE با ۲۵۰۰ سوال تو سطح دکترا گراک ۴ تونسته به امتیاز ۲۵.۴ درصد برسه، انسانها میانگین ۵ درصد نمره میارن. مدلهای دیگه مثلا Gemini 2.5 Pro امتیاز ۲۱.۶ داشته یا o3-high تونسته ۲۱ بگیره. مدل سطح بالاش یعنی گراک Heavy امتیاز عجیب بالای ۵۰ گرفت.
نسخه هوی (Heavy) در واقع اسم بوستر فالکون رو گذاشتن روش :) و یه مدل مولتیایجنت هست. ایلان ماسک میگه وقتی شما یک سوال پیچیده از گراک ۴ هوی میپرسید، این مدل به جای اینکه فقط با یک پردازش به جواب برسه، چندین ایجنت رو به صورت همزمان برای حل اون مسئله به کار میگیره. ماسک این فرایند رو به یک «گروه مطالعه» تشبیه کرد که در اون، اعضا با هم همفکری میکنن تا به بهترین نتیجه برسن.
خب API گراک ۴ از یک پنجره زمینه ۲۵۶ هزار توکنی پشتیبانی میکنه که برای پردازش اسناد حجم بالا واقعا خوبه، هزینه هم ورودی: ۳ دلار برای هر یک میلیون توکن و خروجی: ۱۵ دلار برای هر یک میلیون توکن. [L]
🤓 @geekalerts
مدل Grok 4 نزدیکترین مدل به AGI با ۱۰۰ برابر قدرت پردازشی بیشتر از گراک ۲ آموزش دیده، نصف تاخیر (Latency) گراک ۳ رو داره. احتمالا زیاد گراک ۳ هم برای دانلود در دسترس قرار بگیره.
بنچمارک ARC-AGI یکی از معیارهای اصلی برای سنجش AGI هست، برای ماهها هیچ مدلی نتونسته بود از مرز ۱۰ درصد عبور کنه. گراک ۴ در کمتر از ۱۲ ساعت به امتیاز ۱۵.۸ درصد رسید که رکورد جدیدی هست.
تو آزمونها مثلا HLE با ۲۵۰۰ سوال تو سطح دکترا گراک ۴ تونسته به امتیاز ۲۵.۴ درصد برسه، انسانها میانگین ۵ درصد نمره میارن. مدلهای دیگه مثلا Gemini 2.5 Pro امتیاز ۲۱.۶ داشته یا o3-high تونسته ۲۱ بگیره. مدل سطح بالاش یعنی گراک Heavy امتیاز عجیب بالای ۵۰ گرفت.
ایلان ماسک میگه بیشتر دانشجوهای دکترا در آزمونهایی که گراک ۴ قبول میشه، رد میشن.
نسخه هوی (Heavy) در واقع اسم بوستر فالکون رو گذاشتن روش :) و یه مدل مولتیایجنت هست. ایلان ماسک میگه وقتی شما یک سوال پیچیده از گراک ۴ هوی میپرسید، این مدل به جای اینکه فقط با یک پردازش به جواب برسه، چندین ایجنت رو به صورت همزمان برای حل اون مسئله به کار میگیره. ماسک این فرایند رو به یک «گروه مطالعه» تشبیه کرد که در اون، اعضا با هم همفکری میکنن تا به بهترین نتیجه برسن.
خب API گراک ۴ از یک پنجره زمینه ۲۵۶ هزار توکنی پشتیبانی میکنه که برای پردازش اسناد حجم بالا واقعا خوبه، هزینه هم ورودی: ۳ دلار برای هر یک میلیون توکن و خروجی: ۱۵ دلار برای هر یک میلیون توکن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
❤56🔥23👍12👏5
جیمیل یه بخش اضافه کرده و کسایی که زیاد بهتون ایمیل میفرستن رو اونجا لیست میکنه، بعد میتونید خیلی راحت درخواست کنید اونهایی که نمیخواید دیگه براتون ایمیل ارسال نکنن. یه راه خوبه برای اینکه یک بار برای همیشه صندوق ایمیل خودتون رو خلوت کنید.
اسم ویژگیش manage subscriptions هست و وقتی براتون اضافه بشه از پایین منو میتونید پیداش کنید، فعلا برای بخشی از کاربرها فعال شده اما میشه منتظر بود که تو زمان کوتاهی برای همه در دسترس قرار بگیره. [L]
🤓 @geekalerts
اسم ویژگیش manage subscriptions هست و وقتی براتون اضافه بشه از پایین منو میتونید پیداش کنید، فعلا برای بخشی از کاربرها فعال شده اما میشه منتظر بود که تو زمان کوتاهی برای همه در دسترس قرار بگیره. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍89❤20🔥4😁4
امروز، ۱۰م جولای، سالروز تولد نیکولا تسلا است.
نیکولا تسلا، مخترع، مهندس برق، مهندس مکانیک، فیزیکدان و آیندهپژوه صربتبار آمریکایی بود که بیشتر ما اون رو به خاطر نقش مهمش در طراحی سیستم نوین برقرسانی بر اساس جریان متناوب میشناسیم. تا قبل از تسلا، سیستمهای برقرسانی بر پایه جریان ثابت (DC) بودن که در فواصل بالا با تلفات زیاد انرژی همراه میشد.
تسلا اما با اختراع ابزارهایی نظیر ترانسفورماتورها و موتورهای القایی، تونست جریان متناوب (AC) رو رواج بده و حالا ما انتقال برق رو در ولتاژهای بالا با تلفات انرژی خیلی کم در فواصل طولانی داریم. تسلا در سال ۱۸۵۶ در امپراتوری اتریش (کرواسی امروزی) به دنیا اومد و در ۷م ژانویه ۱۹۴۳ در نیویورک از دنیا رفت. [L]
🤓 hadi @geekalerts
نیکولا تسلا، مخترع، مهندس برق، مهندس مکانیک، فیزیکدان و آیندهپژوه صربتبار آمریکایی بود که بیشتر ما اون رو به خاطر نقش مهمش در طراحی سیستم نوین برقرسانی بر اساس جریان متناوب میشناسیم. تا قبل از تسلا، سیستمهای برقرسانی بر پایه جریان ثابت (DC) بودن که در فواصل بالا با تلفات زیاد انرژی همراه میشد.
تسلا اما با اختراع ابزارهایی نظیر ترانسفورماتورها و موتورهای القایی، تونست جریان متناوب (AC) رو رواج بده و حالا ما انتقال برق رو در ولتاژهای بالا با تلفات انرژی خیلی کم در فواصل طولانی داریم. تسلا در سال ۱۸۵۶ در امپراتوری اتریش (کرواسی امروزی) به دنیا اومد و در ۷م ژانویه ۱۹۴۳ در نیویورک از دنیا رفت. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥90❤43👍10😍3👎2🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
امکان تبدیل عکس به ویدیو داخل Gemini اضافه شده، با مدل Veo 3 کار میکنه و اجازه میده عکس رو به کلیپهای هشت ثانیهای با کیفیت 720p تبدیل کنید.
فعلا تو نسخه وب هست، روزهای آینده به نسخه موبایلی هم میاد و فقط برای کاربران پولی جمنای در دسترس هست. ظاهرا روزانه میشه ۳ ویدیو باهاش ساخت. به نظر میرسه توی بعضی از مناطق هنوز فعال نیست و اگر مشکل دسترسی داشتید با آیپی آمریکا متصل بشید. [L]
🔗 https://gemini.google.com
🤓 @geekalerts
فعلا تو نسخه وب هست، روزهای آینده به نسخه موبایلی هم میاد و فقط برای کاربران پولی جمنای در دسترس هست. ظاهرا روزانه میشه ۳ ویدیو باهاش ساخت. به نظر میرسه توی بعضی از مناطق هنوز فعال نیست و اگر مشکل دسترسی داشتید با آیپی آمریکا متصل بشید. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥36❤9👍9
تلگرام مترجم خودش رو ارتقا داده و حالا این مترجم با GPT-4 کار میکنه، برای کاربران پریمیوم هست که میتونن باهاش چتها یا پستهای کانالهارو خودکار به زبان دلخواه ترجمه کنن. [L]
دولت آمریکا یه بار دیگه از توسعهدهندگان نرمافزار خواسته تا از زبانهای برنامهنویسی (memory safe) مثل راست (Rust) استفاده کنن. مخالفان این توصیهها میگن روشهایی برای حل این مشکلات حتی در زبان C هم وجود داره. [L]
آیبیام گفته ۹۴ درصد کارهای روتین خودش رو الان با AI داره انجام میده، مایکروسافت هم گفته ۵۰۰ میلیون دلار سر استفاده از AI تو مراکز تماسش صرفهجویی کرده. گوگل هم گفته ۵۰ درصد کدهاشونو داره هوشمصنوعی میزنه. [L]
انویدیا به عنوان اولین شرکت در جهان، به ارزش بازار ۴ تریلیون دلار رسید و از اپل و مایکروسافت جلو زد. [L]
اپل پشتیبانی از فایرفاکس رو به iCloud Passwords در ویندوز اضافه کرد. قبلا فقط برای کروم و اج در دسترس بود. [L]
اپل داره روی سیستمی کار میکنه که به مکها اجازه بده مثل آیفون، وقتی هنوز تو جعبه هستن، به آخرین نسخه macOS آپدیت بشن. اینجوری مشتریها دستگاه رو با نرمافزار بهروز تحویل میگیرن. [L]
پرپلکسیتی از مرورگر وب هوش مصنوعی خودش به اسم Comet رونمایی کرد. این مرورگر که بر پایه کرومیوم ساخته شده، با دستیار AI داخلیاش میتونه محتوا رو خلاصه کنه و کارهایی مثل رزرو هتل رو انجام بده. البته فعلا فقط برای مشترکین Perplexity Max با هزینه ماهانه ۲۰۰ دلار در دسترسه. [L]
توییتر اکس میخواد اجازه بده باتهای AI هم بتونن کامیونیتی نوتس ارسال کنن، میگن کل این ویژگی که آدمها نوت میفرستن خوبه ولی باتها میتونن با ارسال سریع نوت کمک بیشتری بکنن. [L]
گوگل قابلیت تحلیل ویدئو رو به جمنای اضافه کرده، یعنی یک ویدیو یوتیوب بهش میدید و بعد در کنار اینکه متن دیالوگهای ویدیو رو میتونه بهتون بده حتی امکان تحلیل تصاویر و محتوای داخل ویدیو رو هم داره. [L]
ویندوز ۱۱ نسخه ۲۵H2 که قرار هست آخر امسال فعال بشه ویژگی پاک کردن برنامههای پیشفرض ویندوز مثل دوربین، ضبط صدا و نوتپد رو داره. [L]
کمیسیون ارتباطات فدرال آمریکا (FCC) الان میتونه باند ۶ گیگاهرتز که برای شبکههای وای فای استفاده میشه رو به اپراتورهای موبایل بفروشه، یعنی شرکتهای موبایلی میتونن دکلهای وایفای تاسیس کنن. بعضیها اعتقاد دارن این کار سرعت وایفای رو کم میکنه. [L]
🤓 @geekalerts
دولت آمریکا یه بار دیگه از توسعهدهندگان نرمافزار خواسته تا از زبانهای برنامهنویسی (memory safe) مثل راست (Rust) استفاده کنن. مخالفان این توصیهها میگن روشهایی برای حل این مشکلات حتی در زبان C هم وجود داره. [L]
آیبیام گفته ۹۴ درصد کارهای روتین خودش رو الان با AI داره انجام میده، مایکروسافت هم گفته ۵۰۰ میلیون دلار سر استفاده از AI تو مراکز تماسش صرفهجویی کرده. گوگل هم گفته ۵۰ درصد کدهاشونو داره هوشمصنوعی میزنه. [L]
انویدیا به عنوان اولین شرکت در جهان، به ارزش بازار ۴ تریلیون دلار رسید و از اپل و مایکروسافت جلو زد. [L]
اپل پشتیبانی از فایرفاکس رو به iCloud Passwords در ویندوز اضافه کرد. قبلا فقط برای کروم و اج در دسترس بود. [L]
اپل داره روی سیستمی کار میکنه که به مکها اجازه بده مثل آیفون، وقتی هنوز تو جعبه هستن، به آخرین نسخه macOS آپدیت بشن. اینجوری مشتریها دستگاه رو با نرمافزار بهروز تحویل میگیرن. [L]
پرپلکسیتی از مرورگر وب هوش مصنوعی خودش به اسم Comet رونمایی کرد. این مرورگر که بر پایه کرومیوم ساخته شده، با دستیار AI داخلیاش میتونه محتوا رو خلاصه کنه و کارهایی مثل رزرو هتل رو انجام بده. البته فعلا فقط برای مشترکین Perplexity Max با هزینه ماهانه ۲۰۰ دلار در دسترسه. [L]
توییتر اکس میخواد اجازه بده باتهای AI هم بتونن کامیونیتی نوتس ارسال کنن، میگن کل این ویژگی که آدمها نوت میفرستن خوبه ولی باتها میتونن با ارسال سریع نوت کمک بیشتری بکنن. [L]
گوگل قابلیت تحلیل ویدئو رو به جمنای اضافه کرده، یعنی یک ویدیو یوتیوب بهش میدید و بعد در کنار اینکه متن دیالوگهای ویدیو رو میتونه بهتون بده حتی امکان تحلیل تصاویر و محتوای داخل ویدیو رو هم داره. [L]
ویندوز ۱۱ نسخه ۲۵H2 که قرار هست آخر امسال فعال بشه ویژگی پاک کردن برنامههای پیشفرض ویندوز مثل دوربین، ضبط صدا و نوتپد رو داره. [L]
کمیسیون ارتباطات فدرال آمریکا (FCC) الان میتونه باند ۶ گیگاهرتز که برای شبکههای وای فای استفاده میشه رو به اپراتورهای موبایل بفروشه، یعنی شرکتهای موبایلی میتونن دکلهای وایفای تاسیس کنن. بعضیها اعتقاد دارن این کار سرعت وایفای رو کم میکنه. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
❤33👍10🔥6🙏3🤯1
پلیر جدید یوتیوب رو میبینید، هنوز مشخص نیست توی فاز آزمایشی باقی میمونه یا برای همه منتشر میشه، یوتیوب تغییرات زیادی این ماه داشته. [L]
از ۱۵ جولای محتوای تولید شده با هوشمصنوعی که کیفیت پایینی دارن و به شکل انبوه ساخته میشن رو دیگه بهشون درآمدی پرداخت نمیکنن. به این محتواها «AI slop» میگن. [L]
و اینکه دارن بخش «ترندینگ» رو حذف میکنن و به جای اون روی توصیههای شخصیسازی شده برای هر فرد تمرکز میکنن. [L]
🤓 @geekalerts
از ۱۵ جولای محتوای تولید شده با هوشمصنوعی که کیفیت پایینی دارن و به شکل انبوه ساخته میشن رو دیگه بهشون درآمدی پرداخت نمیکنن. به این محتواها «AI slop» میگن. [L]
و اینکه دارن بخش «ترندینگ» رو حذف میکنن و به جای اون روی توصیههای شخصیسازی شده برای هر فرد تمرکز میکنن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53👍19🔥10😍4👎3
گوگل مجموعهای از مدلهای هوشمصنوعی برای استفادههای پزشکی رو بهصورت منبعباز منتشر کرده. مدل ۴ میلیارد پارامتری MedGamma میتونه متن و تصویر رو پردازش کنه و نسخه ۲۷ میلیارد پارامتری اون فقط در قالب متن و چند وجهیه. این مدلها میتونن در زمینههای رادیولوژی، چشمپزشکی و آسیبشناسی بافتی و پوستی، تشخیص پیشنهاد بدن.
مدل 4B تو بنچمارک MedQA (آزمونهای پزشکی) به دقت ۶۴.۴ و مدل 27B به دقت ۸۷.۷ رسیده. تو بنچمارک MIMIC-CXR (تصاویر اشعه ایکس و گزارشها) هم مدل 4B امتیاز F1 ماکرو ۸۸.۹ رو بهدست آورده که در مقایسه با مدل Gemma 3 حدود ۸ امتیاز پیشرفت داشته.
این مدلها از HuggingFace قابل دانلود و استفاده هستن که میشه از این راهنما برای شروع کار و بهینهسازیشون استفاده کرد. [L]
🤓 abolfazl @geekalerts
مدل 4B تو بنچمارک MedQA (آزمونهای پزشکی) به دقت ۶۴.۴ و مدل 27B به دقت ۸۷.۷ رسیده. تو بنچمارک MIMIC-CXR (تصاویر اشعه ایکس و گزارشها) هم مدل 4B امتیاز F1 ماکرو ۸۸.۹ رو بهدست آورده که در مقایسه با مدل Gemma 3 حدود ۸ امتیاز پیشرفت داشته.
این مدلها از HuggingFace قابل دانلود و استفاده هستن که میشه از این راهنما برای شروع کار و بهینهسازیشون استفاده کرد. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍68❤17🙏6🔥4👎1😁1
خدمات وب آمازون (AWS) با همکاری آنتروپیک، بازارچه ایجنتهای هوشمصنوعی خودشون رو هفته دیگه راهاندازی میکنن. این بازارچه به استارتآپها کمک میکنه ایجنتها رو مستقیما به مشتری بفروشن و مشتریهای سازمانی بتونن بر اساس نیازشون ایجنت مدنظرشون رو پیدا کنن و اون رو بخرن. [L]
🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37❤7🔥3
گوگل مجموعهای از مدلهای زبانی جدید به اسم T5Gemma رو معرفی کرده که از نوع رمزگذار-رمزگشاست. یعنی دو بخش داره: یکی جمله ورودی رو میفهمه (رمزگذار)، یکی با گرفتن اون مقدار جواب میده (رمزگشا). فرقش با مدلهایی مثل سری GPT اینه که اونا فقط بخش جوابدهی یا رمزگشایی دارن.
کاری که گوگل کرده اینه که اومده مدلهای قبلی رو، که فقط رمزگشا بودن رو با تکنیک انطباق پذیری آموزش داده و تبدیلشون کرده به مدلهایی که هم رمزگذار دارن هم رمزگشا. توی این معماری، اول کل جملهی ورودی خوب پردازش میشه، بعد مدل شروع میکنه به تولید خروجی. این باعث میشه مدل بهتر بفهمه و جواب دقیقتری بده.
مقدار پارامتر رمزگذاررمزگشا تو مدلهای T5 در بعضی موارد تغییر میکنه و ترکیبی از ۹ میلیارد و ۲ میلیارد پارامتره. این مدلها روی HuggingFace قابل دانلودن. [L]
🤓 abolfazl @geekalerts
کاری که گوگل کرده اینه که اومده مدلهای قبلی رو، که فقط رمزگشا بودن رو با تکنیک انطباق پذیری آموزش داده و تبدیلشون کرده به مدلهایی که هم رمزگذار دارن هم رمزگشا. توی این معماری، اول کل جملهی ورودی خوب پردازش میشه، بعد مدل شروع میکنه به تولید خروجی. این باعث میشه مدل بهتر بفهمه و جواب دقیقتری بده.
مقدار پارامتر رمزگذاررمزگشا تو مدلهای T5 در بعضی موارد تغییر میکنه و ترکیبی از ۹ میلیارد و ۲ میلیارد پارامتره. این مدلها روی HuggingFace قابل دانلودن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40👍15🔥8
شرکت چینی Moonshot AI مدل agent محور Kimi K2 رو بهصورت متنباز منتشر کرده. این شرکت ادعا کرده که این مدل برای agentic tasks بهینه شده، یعنی خودش شروع به پیدا کردن ابزار میکنه و با اونها کاری که میخواید رو انجام میده.
مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلنهای مربوط به یک کنسرت رو میریزه و گزارش نهایی رو ایمیل میکنه. یا با Ipython دادههای آماری رو بصریسازی میکنه و صفحه وبهای تعاملی میسازه. یا شبیهسازیهای محیطی مثل ماینکرفت یا کهکشان رو اجرا میکنه. قابلیت اضافه کردن به ترمینال رو هم داره.
راهنمای استفاده ازش روی گیتهاب قرار داره، و از HuggingFace میشه مدلها رو دانلود کرد. [L]
🤓 abolfazl @geekalerts
مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلنهای مربوط به یک کنسرت رو میریزه و گزارش نهایی رو ایمیل میکنه. یا با Ipython دادههای آماری رو بصریسازی میکنه و صفحه وبهای تعاملی میسازه. یا شبیهسازیهای محیطی مثل ماینکرفت یا کهکشان رو اجرا میکنه. قابلیت اضافه کردن به ترمینال رو هم داره.
راهنمای استفاده ازش روی گیتهاب قرار داره، و از HuggingFace میشه مدلها رو دانلود کرد. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤53👍19🔥5
چرا گوگل ۲.۴ میلیارد دلار برای استخدام تیم ویندسرف پرداخت کرد؟
ما نوعی قرارداد داریم به اسم اکویهایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعدادهای کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژیهاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.
روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیانگذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپمایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژیهاشون هم میشه (ادیتور و وایبکدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.
یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذابتر بوده. [L]
🤓 @geekalerts
ما نوعی قرارداد داریم به اسم اکویهایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعدادهای کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژیهاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.
روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیانگذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپمایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژیهاشون هم میشه (ادیتور و وایبکدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.
یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذابتر بوده. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍21😁6🤯4❤3
Geek Alerts
قرار هست OpenAI یه مدل Open-Weight معرفی کنه، یعنی این مدل دیگه فقط روی سرورهای خودشون نیست و میشه دانلودش کرد، افراد، شرکتها و دولتها میتونن روی سرورهای خودشون این مدل رو اجرا کنن، مثل وقتی مدل R1 از دیپسیک اومد و مایکروسافت اونو به سرورهای آژور خودش اضافه…
مدل وزنباز OpenAI که قرار بود این هفته بیاد تاخیر خورد، سمآلتمن میگه تستهای ایمنی اضافی لازم داشت چون وقتی وزنها در دسترس همه قرار بگیرن دیگه نمیشه کاری کرد.
این ایمنی که میگن منظور جوابهایی هست که مدل میده، مثلا روزهای گذشته جوابهای تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنیهای بیشتر رو اضافه کردن. [L]
🤓 @geekalerts
این ایمنی که میگن منظور جوابهایی هست که مدل میده، مثلا روزهای گذشته جوابهای تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنیهای بیشتر رو اضافه کردن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47❤11😁9👎2😡2
گراک ویژگی Companions رو اضافه کرده که میشه کاراکتر انتخاب کرد و با کاراکتر در کنار مدل Grok 4 صحبت کنید. یه سری کاستومها هم میشه مثل تغییر لحن و مدل جواب دادن. ویژگیش فعلا فقط برای مشترکین سوپر گراک هست و توی نسخه IOS میشه بهش دسترسی داشت. [L]
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19👍9🔥3👎1😡1
اداره غذا و داروی آمریکا (FDA) یک رنگ خوراکی جدید (آبی) که از میوه گاردنیا بهدست میاد رو تایید کرده، امسال تمرکزشون روی حذف رنگهای خوراکی مصنوعی هست، این رنگ جدید میتونه تو آبنبات، نوشیدنیهای ورزشی و چای استفاده بشه. آمریکا میخواد تولیدکنندهها سریعتر از رنگهای نفتی فاصله بگیرن و اینهارو از صنایع غذایی خودش حذف کنه. این چهارمین افزودنی رنگ طبیعیه که امسال تایید شده.
اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا موادهای غذایی بیرنگتر میشن. [L]
🤓 @geekalerts
اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا موادهای غذایی بیرنگتر میشن. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112❤31👏13👎2😁2😍2
شرکت MistralAI مدلهای Voxtral رو که با ورودی صدا(صدا به متن) کار میکنن، بهصورت متنباز عرضه کرده. این مدلها با ۳ و ۲۴ میلیارد پارامتر برای انجام وظایفی مثل جواب دادن به سوالات درباره محتوای صوتی یا رونویسی از روی صدا تا ۳۰ دقیقه و درک محتوای صوتی تا ۴۰ دقیقه با محدودیت ۳۲ هزار توکنی میتونن بهکار گرفته بشن.
تو نتایج بنچمارک، Voxtral بهطور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متنباز تا الان، بهتر عمل میکنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبانهای انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی میکنه.
به این دو مدل میشه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]
🤓 abolfazl @geekalerts
تو نتایج بنچمارک، Voxtral بهطور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متنباز تا الان، بهتر عمل میکنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبانهای انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی میکنه.
به این دو مدل میشه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35👍13🔥4
گوگل قابلیتهای جدیدی که مبتنی بر هوشمصنوعی هستن رو به موتور جستجوی خودش اضافه میکنه. با اضافه کردن تب AIMode، میشه از مدلهای جمنای 2.5 پرو و فلش برای گرفتن پاسخ استفاده کرد که ورژن پرو برای کارهای پیچیدهتر مناسبتره.
حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیدهتر مثل پروژههای کاری یا تکالیف دانشگاهی اضافه کرده که میتونه منابع مختلف رو همزمان جستوجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.
قابلیت بعدی تماس گرفتن هوشمصنوعی گوگل با کسبوکارهای محلی برای جمعآوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستورانهای اطرف من» و اجازه دادن به هوشمصنوعی برای بررسی قیمتها، با رستورانها تماس میگیره، و با پرسوجو یک نسخه سازماندهیشده از چیزهایی که لازم دارید رو برای شما تهیه میکنه.
این قابلیتها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی میشه. [L]
🤓 hadi @geekalerts
حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیدهتر مثل پروژههای کاری یا تکالیف دانشگاهی اضافه کرده که میتونه منابع مختلف رو همزمان جستوجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.
قابلیت بعدی تماس گرفتن هوشمصنوعی گوگل با کسبوکارهای محلی برای جمعآوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستورانهای اطرف من» و اجازه دادن به هوشمصنوعی برای بررسی قیمتها، با رستورانها تماس میگیره، و با پرسوجو یک نسخه سازماندهیشده از چیزهایی که لازم دارید رو برای شما تهیه میکنه.
این قابلیتها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی میشه. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47👍11🔥7😡3😁1😍1