قابلیت «پاسخهای هوشمند» جیمیل به کمک Gemini دیگه فقط از همون ایمیلی که بازه اطلاعات نمیگیره، بلکه میتونه از کل ایمیلهای تو اینباکس و حتی فایلهای گوگل درایوتون اطلاعات رو استخراج کنه تا جوابهای کاملتر و مرتبطتری پیشنهاد بده. این پاسخها میتونن لحن و سبک شما رو هم تشخیص بدن، مثلا اگه به مدیرتون ایمیل میزنید، رسمیتر جواب میده و اگه به دوستتون، خودمونیتر.
این پاسخها اول به زبان انگلیسی تو ماه جولای به صورت آلفا داخل Google Labs میان و انتظار میره تو سهماهه سوم امسال عمومی بشن. این نسخه پولی خواهد بود و جزو پلنهای Workspace و Google One AI Premium ارائه میشه، ولی شاید در آینده برای کاربرای رایگان هم فعال بشه.
جمنای قراره تو مدیریت اینباکس جیمیل هم کمک کنه، مثلا با قابلیت «پاکسازی اینباکس» میتونید ازش بخواید ایمیلهای نخونده از یه فرستنده خاص رو حذف کنه. یا وقتی میخواید جلسه بذارید، جمنای زمانهای خالی تقویمتون رو برای پیشنهاد دادن نشون میده. چیزای دیگه مثل ترجمه همزمان مکالمه تو گوگل میت، آواتارهای هوش مصنوعی تو Google Vids، و اینکه جمنای موقع کمک به نوشتن تو گوگل داکس بتونه از اسناد لینکشده هم اطلاعات بگیره.
#GoogleIO
🔗 theverge
🤓 @geekalerts
این پاسخها اول به زبان انگلیسی تو ماه جولای به صورت آلفا داخل Google Labs میان و انتظار میره تو سهماهه سوم امسال عمومی بشن. این نسخه پولی خواهد بود و جزو پلنهای Workspace و Google One AI Premium ارائه میشه، ولی شاید در آینده برای کاربرای رایگان هم فعال بشه.
جمنای قراره تو مدیریت اینباکس جیمیل هم کمک کنه، مثلا با قابلیت «پاکسازی اینباکس» میتونید ازش بخواید ایمیلهای نخونده از یه فرستنده خاص رو حذف کنه. یا وقتی میخواید جلسه بذارید، جمنای زمانهای خالی تقویمتون رو برای پیشنهاد دادن نشون میده. چیزای دیگه مثل ترجمه همزمان مکالمه تو گوگل میت، آواتارهای هوش مصنوعی تو Google Vids، و اینکه جمنای موقع کمک به نوشتن تو گوگل داکس بتونه از اسناد لینکشده هم اطلاعات بگیره.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤5😁2😍2🔥1
گوگل یه تکنولوژی جدید به اسم گوگل بیم (Google Beam) معرفی کرده که با هوش مصنوعی، تماسهای تصویری رو به تجربهای سهبعدی و واقعی تبدیل میکنه، از مجموعه ۶ دوربین برای تصویربرداری از زوایای مختلف استفاده میکنه. هوش مصنوعی این تصاویر رو در لحظه ترکیب و یک مدل سهبعدی زنده از فرد میسازه.
ردیابی حرکات سر با دقت میلیمتری و ویدیو با سرعت ۶۰ فریم بر ثانیه ارائه میشه. نکته مهمش اینه که برای دیدن این تصویر سهبعدی، نیازی به عینک یا تجهیزات خاصی نیست، چون از نمایشگر مخصوص میدان نوری (light field display) استفاده میکنه.
هدفش اینه که حس و حالی شبیه سیستمهای ارتباطی هولوگرافیک ایجاد کنه، اما در اندازه واقعی و کاملاً طبیعی. اچپی جزئیات بیشتری از این پلتفرم رو تو نمایشگاه InfoComm در ماه ژوئن ارائه میده. گوگل با شرکتهای دیگری مثل زوم هم همکاری میکند. اولین دستگاههای بیم اواخر سال ۲۰۲۵ برای کاربران در دسترس قرار میگیره.
#GoogleIO
🔗 cnet
🤓 @geekalerts
ردیابی حرکات سر با دقت میلیمتری و ویدیو با سرعت ۶۰ فریم بر ثانیه ارائه میشه. نکته مهمش اینه که برای دیدن این تصویر سهبعدی، نیازی به عینک یا تجهیزات خاصی نیست، چون از نمایشگر مخصوص میدان نوری (light field display) استفاده میکنه.
هدفش اینه که حس و حالی شبیه سیستمهای ارتباطی هولوگرافیک ایجاد کنه، اما در اندازه واقعی و کاملاً طبیعی. اچپی جزئیات بیشتری از این پلتفرم رو تو نمایشگاه InfoComm در ماه ژوئن ارائه میده. گوگل با شرکتهای دیگری مثل زوم هم همکاری میکند. اولین دستگاههای بیم اواخر سال ۲۰۲۵ برای کاربران در دسترس قرار میگیره.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥8❤4😍3😁2🤯1
گوگل میت داره ترجمه همزمان مکالمه رو میگیره، یعنی مثلا شما فارسی حرف میزنید ولی طرف مقابل به زبون خودش (مثلا انگلیسی) میشنوه، این فرایند در لحظه انجام میشه. برای ترجمه هم از Gemini استفاده میکنه و حتی سعی میکنه لحن و حالت بیانتون رو هم مثل خودتون انجام بده.
گوگل یه دمو هم نشون داده که یه نفر انگلیسی صحبت میکنه و همکارش اسپانیایی. به محض اینکه قابلیت ترجمه Gemini فعال میشه، گوگل میت صحبتهای هر کدوم رو با همون حس و حال و لحن خودش، برای اون یکی به زبان خودش دوبله میکنه.
فعلا این قابلیت میتونه بین انگلیسی و اسپانیایی ترجمه کنه، ولی گوگل گفته به زودی (در هفتههای آینده) زبانهای ایتالیایی، آلمانی و پرتغالی هم بهش اضافه میشن. این ویژگی همین الان داره برای مشترکین فعال میشه و اواخر امسال هم برای کسبوکارها و شرکتها میاد.
#GoogleIO
🔗 theverge
🤓 @geekalerts
گوگل یه دمو هم نشون داده که یه نفر انگلیسی صحبت میکنه و همکارش اسپانیایی. به محض اینکه قابلیت ترجمه Gemini فعال میشه، گوگل میت صحبتهای هر کدوم رو با همون حس و حال و لحن خودش، برای اون یکی به زبان خودش دوبله میکنه.
فعلا این قابلیت میتونه بین انگلیسی و اسپانیایی ترجمه کنه، ولی گوگل گفته به زودی (در هفتههای آینده) زبانهای ایتالیایی، آلمانی و پرتغالی هم بهش اضافه میشن. این ویژگی همین الان داره برای مشترکین فعال میشه و اواخر امسال هم برای کسبوکارها و شرکتها میاد.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
👍77🤯23❤10
شرکت Xreal داره روی یه عینک واقعیت توسعهیافته (XR) مبتنی بر اندروید کار میکنه که اسم رمز پروژه هم آئورا هست. این عینک با همکاری ایکسریل، گوگل و کوالکام ساخته میشه.
پروژه آئورا که یه دستگاه XR با قابلیت دیدن محیط اطراف (OST) هست، قراره با استفاده از چیپست کوالکام، تخصص ایکسریل در سیستمهای بصری و اندروید XR گوگل، ایکسریل رو به رقباش نزدیکتر کنه و یه دستگاه محاسبات فضایی کاملتر از قبل ارائه بده. از روی تصاویر میشه دید که دوربین داخلی داره، به نظر میرسه از همون تکنولوژی نمایشگر دوچشمی عینکهای دیگه ایکسریل بهره میبره.
با اینکه جزئیات زیادی از آئورا مثل قیمت و تاریخ عرضه هنوز اعلام نشده ولی میتونه بازار این تکنولوژی رو تغییر بده، توی نمایشگاه AWE در ژوئن هم اطلاعات بیشتری ازش میاد.
#GoogleIO
🔗 techradar
🤓 @geekalerts
پروژه آئورا که یه دستگاه XR با قابلیت دیدن محیط اطراف (OST) هست، قراره با استفاده از چیپست کوالکام، تخصص ایکسریل در سیستمهای بصری و اندروید XR گوگل، ایکسریل رو به رقباش نزدیکتر کنه و یه دستگاه محاسبات فضایی کاملتر از قبل ارائه بده. از روی تصاویر میشه دید که دوربین داخلی داره، به نظر میرسه از همون تکنولوژی نمایشگر دوچشمی عینکهای دیگه ایکسریل بهره میبره.
با اینکه جزئیات زیادی از آئورا مثل قیمت و تاریخ عرضه هنوز اعلام نشده ولی میتونه بازار این تکنولوژی رو تغییر بده، توی نمایشگاه AWE در ژوئن هم اطلاعات بیشتری ازش میاد.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤2
گوگل میخواد به Gemini ویژگی Agent Mode اضافه کنه. با این قابلیت، شما میتونید یه کاری رو به Gemini بسپارید اون به نمایندگی از شما میره و انجامش میده. پیچای تو یه مثال میگه، مثلا دو نفر دنبال آپارتمان تو تگزاس میگردن. این ایجنت میتونه از سایتهایی مثل Zillow آگهی پیدا کنه و در صورت نیاز از پروژه مارینر برای تنظیم فیلترهای خاص استفاده کنه. یه نسخه آزمایشی ازش هم بهزودی برای مشترکان فعال میشه.
همزمان پروژه مارینر که یه جور دستیار هوش مصنوعیه و میتونه به جای شما تو وب جستجو کنه، حالا تا ۱۰ تا کار رو همزمان مدیریت میکنه. یه قابلیت جدید هم بهش اضافه شده به اسم یاد بده و تکرار کن (Teach and Repeat). یعنی شما یه بار یه کاری رو بهش نشون میدی، و اون یاد میگیره که چطور کارهای مشابه رو در آینده انجام بده. پیچای گفته پروژه مارینر تابستون امسال به طور گستردهتری در دسترس قرار میگیره.
#GoogleIO
🔗 theverge
🤓 @geekalerts
همزمان پروژه مارینر که یه جور دستیار هوش مصنوعیه و میتونه به جای شما تو وب جستجو کنه، حالا تا ۱۰ تا کار رو همزمان مدیریت میکنه. یه قابلیت جدید هم بهش اضافه شده به اسم یاد بده و تکرار کن (Teach and Repeat). یعنی شما یه بار یه کاری رو بهش نشون میدی، و اون یاد میگیره که چطور کارهای مشابه رو در آینده انجام بده. پیچای گفته پروژه مارینر تابستون امسال به طور گستردهتری در دسترس قرار میگیره.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
👍46🤯9❤2👎2🔥2
جمنای لایو (Gemini Live) برای همه کاربران اندروید و iOS رایگان شد، همون ویژگی هست که با دوربین گوشیتون محیط اطراف رو به جمنای نشون میدید و بعد ازش سوال میکنید. نقطه قوتش اینه که میتونه با چیزایی که روی صفحه گوشیتون هم هست تعامل داشته باشه.
گوگل گفته در هفتههای آینده، جمنای لایو بیشتر با زندگی روزمره ترکیب میشه. مثلا میتونه رویداد به تقویم گوگل اضافه کنه، به گوگل مپس دسترسی داشته باشه و با بقیه بخشهای اکوسیستم گوگل تعامل کنه.
#GoogleIO
🔗 theverge
🤓 @geekalerts
گوگل گفته در هفتههای آینده، جمنای لایو بیشتر با زندگی روزمره ترکیب میشه. مثلا میتونه رویداد به تقویم گوگل اضافه کنه، به گوگل مپس دسترسی داشته باشه و با بقیه بخشهای اکوسیستم گوگل تعامل کنه.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45😍8❤3
گوگل یه پلن اشتراک به اسم Google AI Ultra معرفی کرده که هزینش سالی ۳۰۰۰ دلار هست. این پلن مثل یه بلیط VIP برای هوش مصنوعی گوگل هست و برای کاربرای حرفهای مثل محققها، توسعهدهندهها و تولیدکنندههای محتوا طراحی شده که به حداکثر عملکرد و جدیدترین ویژگیها نیاز دارن.
در کنار بالاترین سقف استفاده از ابزارهای گوگل، سرعت دسترسی سریعتر، مشترکانش اولین گروهی هستن که ویژگیهای جدید رو دریافت میکنن، دسترسی زودهنگام به مدل Veo 3 و همچنین مدل جدید Deep Think 2.5 Pro رو داره. چیزهای دیگه مثل ۳۰ ترابایت فضای ذخیره سازی و اشتراک یوتیوب پریمیوم رو هم داره، کاربرای جدید هم برای ۳ ماهه اول ۵۰ درصد تخفیف میگیرن.
پلن قبلی یعنی AI Premium هم اسمش به Google AI Pro تغییر کرده و یه سری مزایای اضافه هم پیدا میکنه. مثل دسترسی زودهنگام به Flow با Veo 2 و Gemini در کروم.
#GoogleIO
🔗 androidauthority
🤓 @geekalerts
در کنار بالاترین سقف استفاده از ابزارهای گوگل، سرعت دسترسی سریعتر، مشترکانش اولین گروهی هستن که ویژگیهای جدید رو دریافت میکنن، دسترسی زودهنگام به مدل Veo 3 و همچنین مدل جدید Deep Think 2.5 Pro رو داره. چیزهای دیگه مثل ۳۰ ترابایت فضای ذخیره سازی و اشتراک یوتیوب پریمیوم رو هم داره، کاربرای جدید هم برای ۳ ماهه اول ۵۰ درصد تخفیف میگیرن.
پلن قبلی یعنی AI Premium هم اسمش به Google AI Pro تغییر کرده و یه سری مزایای اضافه هم پیدا میکنه. مثل دسترسی زودهنگام به Flow با Veo 2 و Gemini در کروم.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
😢24👍15🔥7❤1👎1😁1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
مدل تولید ویدیو Veo 3 گوگل به شکل رسمی معرفی شد
جدیدترین مدل گوگل برای ساخت ویدیو، یعنی Veo 3 میتونه همزمان با ساخت ویدیو، براش موسیقی متن، افکتهای صوتی و حتی دیالوگ هم تولید کنه، میتونید به Veo 3 یه دستور بدید که شخصیتها و محیط رو توصیف کنه و حتی دیالوگها رو با توضیحی درباره اینکه چطور باید به نظر برسن، پیشنهاد بدید.
برای کاهش خطر دیپفیک دیپمایند از تکنولوژی واترمارکینگ اختصاصی خودش به اسم SynthID استفاده میکنه تا نشانگرهای نامرئی رو تو فریمهایی که Veo 3 تولید میکنه، جاسازی کنه.
#GoogleIO
🔗 techcrunch
🤓 @geekalerts
جدیدترین مدل گوگل برای ساخت ویدیو، یعنی Veo 3 میتونه همزمان با ساخت ویدیو، براش موسیقی متن، افکتهای صوتی و حتی دیالوگ هم تولید کنه، میتونید به Veo 3 یه دستور بدید که شخصیتها و محیط رو توصیف کنه و حتی دیالوگها رو با توضیحی درباره اینکه چطور باید به نظر برسن، پیشنهاد بدید.
برای کاهش خطر دیپفیک دیپمایند از تکنولوژی واترمارکینگ اختصاصی خودش به اسم SynthID استفاده میکنه تا نشانگرهای نامرئی رو تو فریمهایی که Veo 3 تولید میکنه، جاسازی کنه.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯34👍9🔥2
مدل جدید تولید عکس گوگل Imagen 4 معرفی شد
ایمجن ۴ عکسهایی با جزئیات خیلی دقیقتر، نورپردازی غنیتر و ایرادات کمتر تولید میکنه.این مدل تو نمایش بافتهای خیلی ریز مثل پشم و موی حیوانات، پارچه و قطرات آب پیشرفت کرده. یه پیشرفت اساسی هم روی نوشتن متن داخل عکسها داره. تا رزولوشن 2K هم پشتیبانی میکنه.
از همین الان توی اپ خود جمنای و پلتفرم Vertex AI در دسترس هست، مثل قبل، عکسهایی که با ایمجن ۴ ساخته میشن، واترمارک SynthID دارن. گوگل گفته که قراره یه نسخه fast از ایمجن ۴ هم به زودی عرضه کنه که تا ۱۰ برابر سریعتر از ایمجن ۳ عکس میسازه.
#GoogleIO
🔗 androidauthority
🤓 @geekalerts
ایمجن ۴ عکسهایی با جزئیات خیلی دقیقتر، نورپردازی غنیتر و ایرادات کمتر تولید میکنه.این مدل تو نمایش بافتهای خیلی ریز مثل پشم و موی حیوانات، پارچه و قطرات آب پیشرفت کرده. یه پیشرفت اساسی هم روی نوشتن متن داخل عکسها داره. تا رزولوشن 2K هم پشتیبانی میکنه.
از همین الان توی اپ خود جمنای و پلتفرم Vertex AI در دسترس هست، مثل قبل، عکسهایی که با ایمجن ۴ ساخته میشن، واترمارک SynthID دارن. گوگل گفته که قراره یه نسخه fast از ایمجن ۴ هم به زودی عرضه کنه که تا ۱۰ برابر سریعتر از ایمجن ۳ عکس میسازه.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯28👍16😍6🔥1
گوگل نسل جدید موتور جستجوی خود را در دسترس قرار داد
گوگل AI Mode رو از این هفته برای همه کاربران تو آمریکا فعال میکنه. این قابلیت اجازه میده سوالای پیچیده و چند قسمتی بپرسید. یه سری قابلیت جدید هم براش معرفی کرده مثل جستجوی عمیق (Deep Search)، وقتی یه سوال پیچیده میپرسید، AI Mode اون رو به چند موضوع فرعی تقسیم میکنه تا جواب بده.
میتونه دهها یا حتی صدها سوال کوچیکتر مطرح کنه تا جواب شما رو بده و لینک منابع رو هم در اختیارتون میذاره. گوگل میگه اینجوری میتونید تو چند دقیقه یه گزارش کامل و مستند بگیرید.
جستجوی زنده (Search Live) که اواخر تابستون میاد میتونید بر اساس چیزی که دوربین گوشیتون در لحظه میبینه سوال بپرسید. این از گوگل لنز پیشرفتهتره چون میتونید با ویدیو و صدا مکالمه تعاملی داشته باشید.
نتایج جستجو هم بر اساس جستجوهای قبلی شما و با وصل کردن بقیه سرویسهای گوگل شخصیسازی میشه. مثلا اگه جیمیلتون وصل باشه، از روی ایمیل رزرو هتل میفهمه کی و کجا سفر میرید و رویدادهای اون شهر رو تو همون تاریخ بهتون پیشنهاد میده. گوگل گفته هر وقت بخواید میتونید این اتصال رو قطع یا وصل کنید.
#GoogleIO
🔗 techcrunch
🤓 @geekalerts
گوگل AI Mode رو از این هفته برای همه کاربران تو آمریکا فعال میکنه. این قابلیت اجازه میده سوالای پیچیده و چند قسمتی بپرسید. یه سری قابلیت جدید هم براش معرفی کرده مثل جستجوی عمیق (Deep Search)، وقتی یه سوال پیچیده میپرسید، AI Mode اون رو به چند موضوع فرعی تقسیم میکنه تا جواب بده.
میتونه دهها یا حتی صدها سوال کوچیکتر مطرح کنه تا جواب شما رو بده و لینک منابع رو هم در اختیارتون میذاره. گوگل میگه اینجوری میتونید تو چند دقیقه یه گزارش کامل و مستند بگیرید.
جستجوی زنده (Search Live) که اواخر تابستون میاد میتونید بر اساس چیزی که دوربین گوشیتون در لحظه میبینه سوال بپرسید. این از گوگل لنز پیشرفتهتره چون میتونید با ویدیو و صدا مکالمه تعاملی داشته باشید.
نتایج جستجو هم بر اساس جستجوهای قبلی شما و با وصل کردن بقیه سرویسهای گوگل شخصیسازی میشه. مثلا اگه جیمیلتون وصل باشه، از روی ایمیل رزرو هتل میفهمه کی و کجا سفر میرید و رویدادهای اون شهر رو تو همون تاریخ بهتون پیشنهاد میده. گوگل گفته هر وقت بخواید میتونید این اتصال رو قطع یا وصل کنید.
#GoogleIO
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39❤3😍3🔥1
هوشمصنوعی طراح رابط کاربری Stitch توسط گوگل معرفی شد
گوگل استیچ (Stitch) رو معرفی کرد و کارش اینه که به توسعهدهندهها کمک کنه تا ایدههای اولیهشون برای طراحی رابط کاربری رو خیلی سریع به طرحهای کاربردی و آماده برای استفاده تو اپلیکیشن تبدیل کنن.
این ابزار که با Gemini 2.5 Pro کار میکنه و به صورت آزمایشی تو Google Labs در دسترسه، میتونه با گرفتن دستورات متنی و تصاویر تو چند دقیقه طرحهای رابط کاربری پیچیده و کد فرانتاند آماده تحویل بده. راستی میشه به فیگما هم خروجی گرفت.
#GoogleIO
https://stitch.withgoogle.com/
🔗 techcrunch
🤓 @geekalerts
گوگل استیچ (Stitch) رو معرفی کرد و کارش اینه که به توسعهدهندهها کمک کنه تا ایدههای اولیهشون برای طراحی رابط کاربری رو خیلی سریع به طرحهای کاربردی و آماده برای استفاده تو اپلیکیشن تبدیل کنن.
این ابزار که با Gemini 2.5 Pro کار میکنه و به صورت آزمایشی تو Google Labs در دسترسه، میتونه با گرفتن دستورات متنی و تصاویر تو چند دقیقه طرحهای رابط کاربری پیچیده و کد فرانتاند آماده تحویل بده. راستی میشه به فیگما هم خروجی گرفت.
#GoogleIO
https://stitch.withgoogle.com/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47👍28❤8
شرکت Anthropic نسل جدید مدلهای Claude 4 را معرفی کرد
دو مدل جدید معرفی کردن به نامهای Claude Sonnet 4 و 4 Claude Opus. این مدلها توی بخشهای مختلف پیشرفتهای قابلتوجهی کسب کردند و از بهترین مدلهای همرده خودشون هستن. در دو بنچمارک جدید Agentic Coding و Agentic terminal coding هم بهترین عملکرد رو دارن در مقایسه با مدلهای مشابه. حالا 4 Opus به عنوان بهترین مدل کدنویسی میتونه تسکهای پیچیده و طولانی رو به صورت پایدار انجام بده. قابلیتهای جدیدی هم با این مدلها معرفی شدن. مثلاً هر دو مدل حالا میتونن در طول فرآیند فکر کردن طولانیتر، از ابزارهایی مثل جستجوی وب استفاده کنن و بین فکر کردن و استفاده از ابزار جابجا بشن. همچنین میتونن به صورت موازی از ابزارها استفاده کنن. سرویس Claude Code هم که برای همکاری توسعهدهندهها با این مدلها ساخته شده بود، حالا به صورت عمومی در دسترس قرار گرفته و با ابزارهایی در VS Code و JetBrains ادغام شده. مدل سبکتر یعنی Sonnet برای همه به صورت رایگان در دسترس همه است و مدل Opus برای اشتراکیها.
https://www.anthropic.com/news/claude-4
🤓 hadi @geekalerts
دو مدل جدید معرفی کردن به نامهای Claude Sonnet 4 و 4 Claude Opus. این مدلها توی بخشهای مختلف پیشرفتهای قابلتوجهی کسب کردند و از بهترین مدلهای همرده خودشون هستن. در دو بنچمارک جدید Agentic Coding و Agentic terminal coding هم بهترین عملکرد رو دارن در مقایسه با مدلهای مشابه. حالا 4 Opus به عنوان بهترین مدل کدنویسی میتونه تسکهای پیچیده و طولانی رو به صورت پایدار انجام بده. قابلیتهای جدیدی هم با این مدلها معرفی شدن. مثلاً هر دو مدل حالا میتونن در طول فرآیند فکر کردن طولانیتر، از ابزارهایی مثل جستجوی وب استفاده کنن و بین فکر کردن و استفاده از ابزار جابجا بشن. همچنین میتونن به صورت موازی از ابزارها استفاده کنن. سرویس Claude Code هم که برای همکاری توسعهدهندهها با این مدلها ساخته شده بود، حالا به صورت عمومی در دسترس قرار گرفته و با ابزارهایی در VS Code و JetBrains ادغام شده. مدل سبکتر یعنی Sonnet برای همه به صورت رایگان در دسترس همه است و مدل Opus برای اشتراکیها.
https://www.anthropic.com/news/claude-4
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍44🔥14❤6👏1
Geek Alerts
مدل تولید ویدیو Veo 3 گوگل به شکل رسمی معرفی شد جدیدترین مدل گوگل برای ساخت ویدیو، یعنی Veo 3 میتونه همزمان با ساخت ویدیو، براش موسیقی متن، افکتهای صوتی و حتی دیالوگ هم تولید کنه، میتونید به Veo 3 یه دستور بدید که شخصیتها و محیط رو توصیف کنه و حتی دیالوگها…
This media is not supported in your browser
VIEW IN TELEGRAM
ویدیویی که میبینید رو کاملا با مدل Veo 3 ساختن، هم صدا و هم تصویر. گوگل با عرضه این مدل تونست ترند جدیدی رو شروع کنه، هرچند که دسترسی بهش گرونه.
x
hadi @geekalerts
x
hadi @geekalerts
🤯167👍23😁8❤3
Geek Alerts
شرکت Anthropic نسل جدید مدلهای Claude 4 را معرفی کرد دو مدل جدید معرفی کردن به نامهای Claude Sonnet 4 و 4 Claude Opus. این مدلها توی بخشهای مختلف پیشرفتهای قابلتوجهی کسب کردند و از بهترین مدلهای همرده خودشون هستن. در دو بنچمارک جدید Agentic Coding…
توی سناریوهای تستی، Opus 4 تا ۲۴ ساعت پشت سرهم تونست Pokemon بازی کنه یا تسکهای بازسازی کد (refactoring) در Claude Code تونستن هفت ساعت بدون وقفه اجرا بشن که یه پیشرفت مهم نسبت به مدل قبلی هست. [L]
توی تست SWE-bench Verified از مدل Gemini 2.5 Pro گوگل و مدلهای o3 و GPT-4.1 امتیاز بهتری گرفت اما در ارزیابی چند حالته MMMU یا GPQA Diamond (شامل مجموعه ای از سوالات در سطح دکترای فیزیک، شیمی و زیست شناسی) از مدلهای استدلالی پیشرفته مثل O3 پایینتر هست. [L]
در بحث دستورپذیری، به نظر میرسه این مدل بیشتر میتونه هر دستوری رو انجام بده که به عبارتی میشه گفت قوانین کمتری داره و این میتونه برای افرادی که کار تخصصی انجام میدن مفید و برای استفاده عموم جامعه در مواردی خوب نباشه و از این جهت قوانین امنیتی زیادی رو روش اعمال کردن، مثلا توی یه تست مدل سعی کرده باجگیری انجام بده. [L]
abolfazl @geekalerts
توی تست SWE-bench Verified از مدل Gemini 2.5 Pro گوگل و مدلهای o3 و GPT-4.1 امتیاز بهتری گرفت اما در ارزیابی چند حالته MMMU یا GPQA Diamond (شامل مجموعه ای از سوالات در سطح دکترای فیزیک، شیمی و زیست شناسی) از مدلهای استدلالی پیشرفته مثل O3 پایینتر هست. [L]
در بحث دستورپذیری، به نظر میرسه این مدل بیشتر میتونه هر دستوری رو انجام بده که به عبارتی میشه گفت قوانین کمتری داره و این میتونه برای افرادی که کار تخصصی انجام میدن مفید و برای استفاده عموم جامعه در مواردی خوب نباشه و از این جهت قوانین امنیتی زیادی رو روش اعمال کردن، مثلا توی یه تست مدل سعی کرده باجگیری انجام بده. [L]
abolfazl @geekalerts
👍32🔥9❤6😁3🤯2
خبر خوب، گوگل چند ماه اشتراک هوش مصنوعی رایگان به دانشجوها میده و میتونید شانستون رو امتحان کنید، برای بیشتر اکانتها فعال میشه.
اگر نشد با ایپی آمریکا تست کنید. این پلن که اسمش «Google AI Pro» هست به شما دسترسی استفاده از مدلهای «Deep Search with 2.5 Pro» و «Veo 2» (تبدیل پرامپت به ویدیو) رو میده و فضای ذخیره سازی «Google One» شمارو به 2TB ارتقا میده.
همچنین میتونید از «NotebookLm» (تبدیل اسناد به پادکست) با دسترسی بیشتر استفاده کنید.
پ.ن. اعتبارش تا پایان سال تحصیلی ۲۰۲۶ یعنی ۱۳ ماه هست، ولی از ماه آگوست یعنی ۳ ماه دیگه باید مدارک تحصیلی ارائه بدید تا اشتراک ادامه داشته باشه.
https://one.google.com/join/ai-student
🤓 @geekalerts
اگر نشد با ایپی آمریکا تست کنید. این پلن که اسمش «Google AI Pro» هست به شما دسترسی استفاده از مدلهای «Deep Search with 2.5 Pro» و «Veo 2» (تبدیل پرامپت به ویدیو) رو میده و فضای ذخیره سازی «Google One» شمارو به 2TB ارتقا میده.
همچنین میتونید از «NotebookLm» (تبدیل اسناد به پادکست) با دسترسی بیشتر استفاده کنید.
پ.ن. اعتبارش تا پایان سال تحصیلی ۲۰۲۶ یعنی ۱۳ ماه هست، ولی از ماه آگوست یعنی ۳ ماه دیگه باید مدارک تحصیلی ارائه بدید تا اشتراک ادامه داشته باشه.
https://one.google.com/join/ai-student
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍122❤28👎14🔥4😍3😁1
یکی از ویژگیهایی که به مرورگر کروم اومد این دیدن تب مرورگر توسط Gemini هست، اینجوری که یه چت گوشه صفحه باز میشه و میتونید در مورد اون تب از Gemini سوال کنید، مثلا بگید به فارسی ترجمه کن این صفحهرو یا خلاصش کن و هر سوال دیگهای که دارید.
این نسخه اولیه Gemini (Live) هست که بعدا قراره کارهای بیشتری مثل پر کردن فرم تو سایتها یا انجام دادن یه فرایند رو براتون جلو ببره، فعلا فقط برای مشترکان AI Pro ساکن آمریکا اومده ولی میشه انتظار داشت در آینده یه نسخه رایگان هم داشته باشه.
🔗 9to5google
🤓 @geekalerts
این نسخه اولیه Gemini (Live) هست که بعدا قراره کارهای بیشتری مثل پر کردن فرم تو سایتها یا انجام دادن یه فرایند رو براتون جلو ببره، فعلا فقط برای مشترکان AI Pro ساکن آمریکا اومده ولی میشه انتظار داشت در آینده یه نسخه رایگان هم داشته باشه.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤48👍41🤯5👏1
گوگل SynthID Detector رو معرفی کرد، تا الان با SynthID حدود ۱۰ میلیارد عکس و ویدیو رو واترمارک مخفی زدن، تکنولوژیش جوری هست که واترمارک روی عکس دیده نمیشه ولی همین ابزار دتکتور جدیدی که ساختن به راحتی میتونه تشخیص بده که این عکس با هوشمصنوعی ساخته شده یا نه، تمام عکسهایی و ویدیوهایی که با مدلهای گوگل میسازید این واترمارک رو دارن. فعلا چون آزمایشی هست دسترسیش رو به بخشی از خبرنگارها و محققها دادن.
🔗 deepmind
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍25🤯4❤3
اپل میخواد تو کنفرانس WWDC ۲۰۲۵ سیستمعاملهای iOS ۱۹ iPadOS ۱۹، macOS ۱۶ رو با تمرکز بر Apple Intelligence و بازطراحی اساسی معرفی کنه، شایعه شده که اپل در حال آزمایش یک ابزار کدنویسی با همکاری Anthropic هست که ممکنه توی این رویداد معرفی بشه.
خود رویداد هم از ۹ تا ۱۳ ژوئن هست، میشه یکشنبه ۲۰ خرداد، ساعت ۲۰:۳۰ شب که ما به صورت کامل پوشش میدیم.
🔗 macrumors
🤓 @geekalerts
خود رویداد هم از ۹ تا ۱۳ ژوئن هست، میشه یکشنبه ۲۰ خرداد، ساعت ۲۰:۳۰ شب که ما به صورت کامل پوشش میدیم.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥37👍24❤13😁3👎2