Geek Alerts
22.2K subscribers
2.89K photos
449 videos
11 files
2.41K links
گیک آلرتس، جایی برای گیک‌ها
نوشته‌ها از هوش‌ مصنوعی، فناوری‌های روز، مقالات علمی، رویدادها، تغییرات و دگرگونی‌های جهانی و ... است.
وب‌سایت: https://geekalerts.org
اکس: https://x.com/Geek_Alerts
ارتباط: [email protected]
Download Telegram
قابلیت «پاسخ‌های هوشمند» جیمیل به کمک Gemini دیگه فقط از همون ایمیلی که بازه اطلاعات نمی‌گیره، بلکه می‌تونه از کل ایمیل‌های تو اینباکس و حتی فایل‌های گوگل درایوتون اطلاعات رو استخراج کنه تا جواب‌های کامل‌تر و مرتبط‌تری پیشنهاد بده. این پاسخ‌ها می‌تونن لحن و سبک شما رو هم تشخیص بدن، مثلا اگه به مدیرتون ایمیل می‌زنید، رسمی‌تر جواب میده و اگه به دوستتون، خودمونی‌تر.

این پاسخ‌ها اول به زبان انگلیسی تو ماه جولای به صورت آلفا داخل Google Labs میان و انتظار میره تو سه‌ماهه سوم امسال عمومی بشن. این نسخه پولی خواهد بود و جزو پلن‌های Workspace و Google One AI Premium ارائه میشه، ولی شاید در آینده برای کاربرای رایگان هم فعال بشه.

جمنای قراره تو مدیریت اینباکس جیمیل هم کمک کنه، مثلا با قابلیت «پاکسازی اینباکس» می‌تونید ازش بخواید ایمیل‌های نخونده از یه فرستنده خاص رو حذف کنه. یا وقتی می‌خواید جلسه بذارید، جمنای زمان‌های خالی تقویمتون رو برای پیشنهاد دادن نشون میده. چیزای دیگه مثل ترجمه همزمان مکالمه تو گوگل میت، آواتارهای هوش مصنوعی تو Google Vids، و اینکه جمنای موقع کمک به نوشتن تو گوگل داکس بتونه از اسناد لینک‌شده هم اطلاعات بگیره.

#GoogleIO

🔗 theverge
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍315😁2😍2🔥1
گوگل یه تکنولوژی جدید به اسم گوگل بیم (Google Beam) معرفی کرده که با هوش مصنوعی، تماس‌های تصویری رو به تجربه‌ای سه‌بعدی و واقعی تبدیل می‌کنه، از مجموعه ۶ دوربین برای تصویربرداری از زوایای مختلف استفاده می‌کنه. هوش مصنوعی این تصاویر رو در لحظه ترکیب و یک مدل سه‌بعدی زنده از فرد می‌سازه.

ردیابی حرکات سر با دقت میلی‌متری و ویدیو با سرعت ۶۰ فریم بر ثانیه ارائه میشه. نکته مهمش اینه که برای دیدن این تصویر سه‌بعدی، نیازی به عینک یا تجهیزات خاصی نیست، چون از نمایشگر مخصوص میدان نوری (light field display) استفاده می‌کنه.

هدفش اینه که حس و حالی شبیه سیستم‌های ارتباطی هولوگرافیک ایجاد کنه، اما در اندازه واقعی و کاملاً طبیعی. اچ‌پی جزئیات بیشتری از این پلتفرم رو تو نمایشگاه InfoComm در ماه ژوئن ارائه میده. گوگل با شرکت‌های دیگری مثل زوم هم همکاری می‌کند. اولین دستگاه‌های بیم اواخر سال ۲۰۲۵ برای کاربران در دسترس قرار میگیره.

#GoogleIO

🔗 cnet
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥84😍3😁2🤯1
گوگل میت داره ترجمه همزمان مکالمه رو میگیره، یعنی مثلا شما فارسی حرف میزنید ولی طرف مقابل به زبون خودش (مثلا انگلیسی) میشنوه، این فرایند در لحظه انجام میشه. برای ترجمه هم از Gemini استفاده میکنه و حتی سعی میکنه لحن و حالت بیانتون رو هم مثل خودتون انجام بده.

گوگل یه دمو هم نشون داده که یه نفر انگلیسی صحبت می‌کنه و همکارش اسپانیایی. به محض اینکه قابلیت ترجمه Gemini فعال میشه، گوگل میت صحبت‌های هر کدوم رو با همون حس و حال و لحن خودش، برای اون یکی به زبان خودش دوبله می‌کنه.

فعلا این قابلیت می‌تونه بین انگلیسی و اسپانیایی ترجمه کنه، ولی گوگل گفته به زودی (در هفته‌های آینده) زبان‌های ایتالیایی، آلمانی و پرتغالی هم بهش اضافه میشن. این ویژگی همین الان داره برای مشترکین فعال میشه و اواخر امسال هم برای کسب‌وکارها و شرکت‌ها میاد.

#GoogleIO

🔗 theverge
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍77🤯2310
شرکت Xreal داره روی یه عینک واقعیت توسعه‌یافته (XR) مبتنی بر اندروید کار می‌کنه که اسم رمز پروژه هم آئورا هست. این عینک با همکاری ایکس‌ریل، گوگل و کوالکام ساخته میشه.

پروژه آئورا که یه دستگاه XR با قابلیت دیدن محیط اطراف (OST) هست، قراره با استفاده از چیپست کوالکام، تخصص ایکس‌ریل در سیستم‌های بصری و اندروید XR گوگل، ایکس‌ریل رو به رقباش نزدیک‌تر کنه و یه دستگاه محاسبات فضایی کامل‌تر از قبل ارائه بده. از روی تصاویر میشه دید که دوربین داخلی داره، به نظر میرسه از همون تکنولوژی نمایشگر دوچشمی عینک‌های دیگه ایکس‌ریل بهره می‌بره.

با اینکه جزئیات زیادی از آئورا مثل قیمت و تاریخ عرضه هنوز اعلام نشده ولی میتونه بازار این تکنولوژی رو تغییر بده، توی نمایشگاه AWE در ژوئن هم اطلاعات بیشتری ازش میاد.

#GoogleIO

🔗 techradar
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍222
گوگل میخواد به Gemini ویژگی Agent Mode اضافه کنه. با این قابلیت، شما می‌تونید یه کاری رو به Gemini بسپارید اون به نمایندگی از شما میره و انجامش میده. پیچای تو یه مثال میگه، مثلا دو نفر دنبال آپارتمان تو تگزاس می‌گردن. این ایجنت می‌تونه از سایت‌هایی مثل Zillow آگهی پیدا کنه و در صورت نیاز از پروژه مارینر برای تنظیم فیلترهای خاص استفاده کنه. یه نسخه آزمایشی ازش هم به‌زودی برای مشترکان فعال میشه.

همزمان پروژه مارینر که یه جور دستیار هوش مصنوعیه و می‌تونه به جای شما تو وب جستجو کنه، حالا تا ۱۰ تا کار رو همزمان مدیریت میکنه. یه قابلیت جدید هم بهش اضافه شده به اسم یاد بده و تکرار کن (Teach and Repeat). یعنی شما یه بار یه کاری رو بهش نشون میدی، و اون یاد می‌گیره که چطور کارهای مشابه رو در آینده انجام بده. پیچای گفته پروژه مارینر تابستون امسال به طور گسترده‌تری در دسترس قرار می‌گیره.

#GoogleIO

🔗 theverge
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍46🤯92👎2🔥2
جمنای لایو (Gemini Live) برای همه کاربران اندروید و iOS رایگان شد، همون ویژگی هست که با دوربین گوشیتون محیط اطراف رو به جمنای نشون میدید و بعد ازش سوال میکنید. نقطه قوتش اینه که می‌تونه با چیزایی که روی صفحه گوشیتون هم هست تعامل داشته باشه.

گوگل گفته در هفته‌های آینده، جمنای لایو بیشتر با زندگی روزمره ترکیب میشه. مثلا می‌تونه رویداد به تقویم گوگل اضافه کنه، به گوگل مپس دسترسی داشته باشه و با بقیه بخش‌های اکوسیستم گوگل تعامل کنه.

#GoogleIO

🔗 theverge
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45😍83
گوگل یه پلن اشتراک به اسم Google AI Ultra معرفی کرده که هزینش سالی ۳۰۰۰ دلار هست. این پلن مثل یه بلیط VIP برای هوش مصنوعی گوگل هست و برای کاربرای حرفه‌ای مثل محقق‌ها، توسعه‌دهنده‌ها و تولیدکننده‌های محتوا طراحی شده که به حداکثر عملکرد و جدیدترین ویژگی‌ها نیاز دارن.

در کنار بالاترین سقف استفاده از ابزارهای گوگل، سرعت دسترسی سریع‌تر، مشترکانش اولین گروهی هستن که ویژگی‌های جدید رو دریافت میکنن، دسترسی زودهنگام به مدل Veo 3 و همچنین مدل جدید Deep Think 2.5 Pro رو داره. چیزهای دیگه مثل ۳۰ ترابایت فضای ذخیره سازی و اشتراک یوتیوب پریمیوم رو هم داره، کاربرای جدید هم برای ۳ ماهه اول ۵۰ درصد تخفیف میگیرن.

پلن قبلی یعنی AI Premium هم اسمش به Google AI Pro تغییر کرده و یه سری مزایای اضافه هم پیدا می‌کنه. مثل دسترسی زودهنگام به Flow با Veo 2 و Gemini در کروم.

#GoogleIO

🔗 androidauthority
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
😢24👍15🔥71👎1😁1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
مدل تولید ویدیو Veo 3 گوگل به شکل رسمی معرفی شد

جدیدترین مدل گوگل برای ساخت ویدیو، یعنی Veo 3 می‌تونه همزمان با ساخت ویدیو، براش موسیقی متن، افکت‌های صوتی و حتی دیالوگ هم تولید کنه، می‌تونید به Veo 3 یه دستور بدید که شخصیت‌ها و محیط رو توصیف کنه و حتی دیالوگ‌ها رو با توضیحی درباره اینکه چطور باید به نظر برسن، پیشنهاد بدید.

برای کاهش خطر دیپ‌فیک دیپ‌مایند از تکنولوژی واترمارکینگ اختصاصی خودش به اسم SynthID استفاده می‌کنه تا نشانگرهای نامرئی رو تو فریم‌هایی که Veo 3 تولید می‌کنه، جاسازی کنه.

#GoogleIO

🔗 techcrunch
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯34👍9🔥2
مدل جدید تولید عکس گوگل Imagen 4 معرفی شد

ایمجن ۴ عکس‌هایی با جزئیات خیلی دقیق‌تر، نورپردازی غنی‌تر و ایرادات کمتر تولید می‌کنه.این مدل تو نمایش بافت‌های خیلی ریز مثل پشم و موی حیوانات، پارچه و قطرات آب پیشرفت کرده. یه پیشرفت اساسی هم روی نوشتن متن داخل عکس‌ها داره. تا رزولوشن 2K هم پشتیبانی می‌کنه.

از همین الان توی اپ خود جمنای و پلتفرم Vertex AI در دسترس هست، مثل قبل، عکس‌هایی که با ایمجن ۴ ساخته میشن، واترمارک SynthID دارن. گوگل گفته که قراره یه نسخه fast از ایمجن ۴ هم به زودی عرضه کنه که تا ۱۰ برابر سریع‌تر از ایمجن ۳ عکس میسازه.

#GoogleIO

🔗 androidauthority
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯28👍16😍6🔥1
گوگل نسل جدید موتور جستجوی خود را در دسترس قرار داد

گوگل AI Mode رو از این هفته برای همه کاربران تو آمریکا فعال می‌کنه. این قابلیت اجازه میده سوالای پیچیده و چند قسمتی بپرسید. یه سری قابلیت جدید هم براش معرفی کرده مثل جستجوی عمیق (Deep Search)، وقتی یه سوال پیچیده می‌پرسید، AI Mode اون رو به چند موضوع فرعی تقسیم می‌کنه تا جواب بده.

می‌تونه ده‌ها یا حتی صدها سوال کوچیک‌تر مطرح کنه تا جواب شما رو بده و لینک منابع رو هم در اختیارتون میذاره. گوگل میگه اینجوری می‌تونید تو چند دقیقه یه گزارش کامل و مستند بگیرید.

جستجوی زنده (Search Live) که اواخر تابستون میاد می‌تونید بر اساس چیزی که دوربین گوشیتون در لحظه می‌بینه سوال بپرسید. این از گوگل لنز پیشرفته‌تره چون می‌تونید با ویدیو و صدا مکالمه تعاملی داشته باشید.

نتایج جستجو هم بر اساس جستجوهای قبلی شما و با وصل کردن بقیه سرویس‌های گوگل شخصی‌سازی میشه. مثلا اگه جیمیل‌تون وصل باشه، از روی ایمیل رزرو هتل می‌فهمه کی و کجا سفر میرید و رویدادهای اون شهر رو تو همون تاریخ بهتون پیشنهاد میده. گوگل گفته هر وقت بخواید می‌تونید این اتصال رو قطع یا وصل کنید.

#GoogleIO

🔗 techcrunch
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍393😍3🔥1
هوش‌مصنوعی طراح رابط کاربری Stitch توسط گوگل معرفی شد

گوگل استیچ (Stitch) رو معرفی کرد و کارش اینه که به توسعه‌دهنده‌ها کمک کنه تا ایده‌های اولیه‌شون برای طراحی رابط کاربری رو خیلی سریع به طرح‌های کاربردی و آماده برای استفاده تو اپلیکیشن تبدیل کنن.

این ابزار که با Gemini 2.5 Pro کار می‌کنه و به صورت آزمایشی تو Google Labs در دسترسه، می‌تونه با گرفتن دستورات متنی و تصاویر تو چند دقیقه طرح‌های رابط کاربری پیچیده و کد فرانت‌اند آماده تحویل بده. راستی میشه به فیگما هم خروجی گرفت.


#GoogleIO
https://stitch.withgoogle.com/

🔗 techcrunch
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47👍288
شرکت Anthropic نسل جدید مدل‌های Claude 4 را معرفی کرد

دو مدل جدید معرفی کردن به نام‌های Claude Sonnet 4 و 4 Claude Opus. این مدل‌ها توی بخش‌های مختلف پیشرفت‌های قابل‌توجهی کسب کردند و از بهترین مدل‌های هم‌رده خودشون هستن. در دو بنچمارک جدید Agentic Coding و Agentic terminal coding هم بهترین عملکرد رو دارن در مقایسه با مدل‌های مشابه. حالا 4 Opus به عنوان بهترین مدل کدنویسی می‌تونه تسک‌های پیچیده و طولانی رو به صورت پایدار انجام بده. قابلیت‌های جدیدی هم با این مدل‌ها معرفی شدن. مثلاً هر دو مدل حالا می‌تونن در طول فرآیند فکر کردن طولانی‌تر، از ابزارهایی مثل جستجوی وب استفاده کنن و بین فکر کردن و استفاده از ابزار جابجا بشن. همچنین می‌تونن به صورت موازی از ابزارها استفاده کنن. سرویس Claude Code هم که برای همکاری توسعه‌دهنده‌ها با این مدل‌ها ساخته شده بود، حالا به صورت عمومی در دسترس قرار گرفته و با ابزارهایی در VS Code و JetBrains ادغام شده. مدل سبک‌تر یعنی Sonnet برای همه به صورت رایگان در دسترس همه است و مدل Opus برای اشتراکی‌ها.

https://www.anthropic.com/news/claude-4
🤓 hadi @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍44🔥146👏1
Geek Alerts
شرکت Anthropic نسل جدید مدل‌های Claude 4 را معرفی کرد دو مدل جدید معرفی کردن به نام‌های Claude Sonnet 4 و 4 Claude Opus. این مدل‌ها توی بخش‌های مختلف پیشرفت‌های قابل‌توجهی کسب کردند و از بهترین مدل‌های هم‌رده خودشون هستن. در دو بنچمارک جدید Agentic Coding…
توی سناریوهای تستی، Opus 4 تا ۲۴ ساعت پشت‌ سر‌هم تونست Pokemon بازی کنه یا تسک‌های بازسازی کد (refactoring) در Claude Code تونستن هفت ساعت بدون وقفه اجرا بشن که یه پیشرفت مهم نسبت به مدل قبلی هست. [L]

توی تست SWE-bench Verified از مدل Gemini 2.5 Pro گوگل و مدل‌های o3 و GPT-4.1 امتیاز بهتری گرفت اما در ارزیابی چند حالته MMMU یا GPQA Diamond (شامل مجموعه ای از سوالات در سطح دکترای فیزیک، شیمی و زیست شناسی) از مدل‌های استدلالی پیشرفته مثل O3 پایین‌تر هست. [L]

در بحث دستورپذیری، به نظر میرسه این مدل بیشتر میتونه هر دستوری رو انجام بده که به عبارتی میشه گفت قوانین کمتری داره و این میتونه برای افرادی که کار تخصصی انجام میدن مفید و برای استفاده عموم جامعه در مواردی خوب نباشه و از این جهت قوانین امنیتی زیادی رو روش اعمال کردن، مثلا توی یه تست مدل سعی کرده باج‌گیری انجام بده. [L]

abolfazl @geekalerts
👍32🔥96😁3🤯2
خبر خوب، گوگل چند ماه اشتراک هوش مصنوعی رایگان به دانشجوها میده و میتونید شانستون رو امتحان کنید، برای بیشتر اکانت‌ها فعال میشه.

اگر نشد با ای‌پی آمریکا تست کنید. این پلن که اسمش «Google AI Pro» هست به شما دسترسی استفاده از مدل‌های «Deep Search with 2.5 Pro» و «Veo 2» (تبدیل پرامپت به ویدیو) رو میده و فضای ذخیره سازی «Google One» شمارو به 2TB ارتقا میده.
همچنین میتونید از «NotebookLm» (تبدیل اسناد به پادکست) با دسترسی بیشتر استفاده کنید.

پ.ن. اعتبارش تا پایان سال تحصیلی ۲۰۲۶ یعنی ۱۳ ماه هست، ولی از ماه آگوست یعنی ۳ ماه دیگه باید مدارک تحصیلی ارائه بدید تا اشتراک ادامه داشته باشه.

https://one.google.com/join/ai-student
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍12228👎14🔥4😍3😁1
یکی از ویژگی‌هایی که به مرورگر کروم اومد این دیدن تب مرورگر توسط Gemini هست، اینجوری که یه چت گوشه صفحه باز میشه و میتونید در مورد اون تب از Gemini سوال کنید، مثلا بگید به فارسی ترجمه کن این صفحه‌رو یا خلاصش کن و هر سوال دیگه‌ای که دارید.

این نسخه اولیه Gemini (Live) هست که بعدا قراره کارهای بیشتری مثل پر کردن فرم تو سایت‌ها یا انجام دادن یه فرایند رو براتون جلو ببره، فعلا فقط برای مشترکان AI Pro ساکن آمریکا اومده ولی میشه انتظار داشت در آینده یه نسخه رایگان هم داشته باشه.

🔗 9to5google
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
48👍41🤯5👏1
گوگل SynthID Detector رو معرفی کرد، تا الان با SynthID حدود ۱۰ میلیارد عکس و ویدیو رو واترمارک مخفی زدن، تکنولوژیش جوری هست که واترمارک روی عکس دیده نمیشه ولی همین ابزار دتکتور جدیدی که ساختن به راحتی میتونه تشخیص بده که این عکس با هوش‌مصنوعی ساخته شده یا نه، تمام عکس‌هایی و ویدیوهایی که با مدل‌های گوگل میسازید این واترمارک رو دارن. فعلا چون آزمایشی هست دسترسیش رو به بخشی از خبرنگارها و محقق‌ها دادن.

🔗 deepmind
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍25🤯43
اپل میخواد تو کنفرانس WWDC ۲۰۲۵ سیستم‌عامل‌های iOS ۱۹ iPadOS ۱۹، macOS ۱۶ رو با تمرکز بر Apple Intelligence و بازطراحی اساسی معرفی کنه، شایعه شده که اپل در حال آزمایش یک ابزار کدنویسی با همکاری Anthropic هست که ممکنه توی این رویداد معرفی بشه.

خود رویداد هم از ۹ تا ۱۳ ژوئن هست، میشه یکشنبه ۲۰ خرداد، ساعت ۲۰:۳۰ شب که ما به صورت کامل پوشش میدیم.

🔗 macrumors
🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥37👍2413😁3👎2