Geek Alerts
21.7K subscribers
2.9K photos
428 videos
10 files
2.4K links
گیک آلرتس، جایی برای گیک‌ها
نوشته‌ها از هوش‌ مصنوعی، فناوری‌های روز، مقالات علمی، رویدادها، تغییرات و دگرگونی‌های جهانی و ... است.
وب‌سایت: https://geekalerts.org
اکس: https://x.com/Geek_Alerts
ارتباط: [email protected]
Download Telegram
تلگرام مترجم خودش رو ارتقا داده و حالا این مترجم با GPT-4 کار میکنه، برای کاربران پریمیوم هست که میتونن باهاش چت‌ها یا پست‌های کانال‌هارو خودکار به زبان دلخواه ترجمه کنن. [L]

دولت آمریکا یه بار دیگه از توسعه‌دهندگان نرم‌افزار خواسته تا از زبان‌های برنامه‌نویسی (memory safe) مثل راست (Rust) استفاده کنن. مخالفان این توصیه‌ها میگن روش‌هایی برای حل این مشکلات حتی در زبان C هم وجود داره. [L]

آی‌بی‌ام گفته ۹۴ درصد کارهای روتین خودش رو الان با AI داره انجام میده، مایکروسافت هم گفته ۵۰۰ میلیون دلار سر استفاده از AI تو مراکز تماسش صرفه‌جویی کرده. گوگل هم گفته ۵۰ درصد کدهاشونو داره هوش‌مصنوعی میزنه. [L]

انویدیا به عنوان اولین شرکت در جهان، به ارزش بازار ۴ تریلیون دلار رسید و از اپل و مایکروسافت جلو زد. [L]

اپل پشتیبانی از فایرفاکس رو به iCloud Passwords در ویندوز اضافه کرد. قبلا فقط برای کروم و اج در دسترس بود. [L]

اپل داره روی سیستمی کار می‌کنه که به مک‌ها اجازه بده مثل آیفون، وقتی هنوز تو جعبه هستن، به آخرین نسخه macOS آپدیت بشن. اینجوری مشتری‌ها دستگاه رو با نرم‌افزار به‌روز تحویل میگیرن. [L]

پرپلکسیتی از مرورگر وب هوش مصنوعی خودش به اسم Comet رونمایی کرد. این مرورگر که بر پایه کرومیوم ساخته شده، با دستیار AI داخلی‌اش می‌تونه محتوا رو خلاصه کنه و کارهایی مثل رزرو هتل رو انجام بده. البته فعلا فقط برای مشترکین Perplexity Max با هزینه ماهانه ۲۰۰ دلار در دسترسه. [L]

توییتر اکس میخواد اجازه بده بات‌های AI هم بتونن کامیونیتی نوتس ارسال کنن، میگن کل این ویژگی که آدم‌ها نوت میفرستن خوبه ولی بات‌ها میتونن با ارسال سریع نوت کمک بیشتری بکنن. [L]

گوگل قابلیت تحلیل ویدئو رو به جمنای اضافه کرده، یعنی یک ویدیو یوتیوب بهش میدید و بعد در کنار اینکه متن دیالوگ‌های ویدیو رو میتونه بهتون بده حتی امکان تحلیل تصاویر و محتوای داخل ویدیو رو هم داره. [L]

ویندوز ۱۱ نسخه ۲۵H2 که قرار هست آخر امسال فعال بشه ویژگی پاک کردن برنامه‌های پیش‌فرض ویندوز مثل دوربین، ضبط صدا و نوت‌پد رو داره. [L]

کمیسیون ارتباطات فدرال آمریکا (FCC) الان میتونه باند ۶ گیگاهرتز که برای شبکه‌های وای فای استفاده میشه رو به اپراتورهای موبایل بفروشه، یعنی شرکت‌های موبایلی میتونن دکل‌های وای‌فای تاسیس کنن. بعضی‌ها اعتقاد دارن این کار سرعت وای‌فای رو کم میکنه. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
33👍10🔥6🙏3🤯1
پلیر جدید یوتیوب رو میبینید، هنوز مشخص نیست توی فاز آزمایشی باقی میمونه یا برای همه منتشر میشه، یوتیوب تغییرات زیادی این ماه داشته. [L]

از ۱۵ جولای محتوای تولید شده با هوش‌مصنوعی که کیفیت پایینی دارن و به شکل انبوه ساخته میشن رو دیگه بهشون درآمدی پرداخت نمیکنن. به این محتواها «AI slop» میگن. [L]

و اینکه دارن بخش «ترندینگ» رو حذف میکنن و به جای اون روی توصیه‌های شخصی‌سازی شده برای هر فرد تمرکز میکنن. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
53👍19🔥10😍4👎3
گوگل مجموعه‌ای از مدل‌های هوش‌مصنوعی برای استفاده‌های پزشکی رو به‌صورت منبع‌باز منتشر کرده. مدل ۴ میلیارد پارامتری MedGamma می‌تونه متن و تصویر رو پردازش کنه و نسخه ۲۷ میلیارد پارامتری اون فقط در قالب متن و چند وجهیه. این مدل‌ها می‌تونن در زمینه‌های رادیولوژی، چشم‌پزشکی و آسیب‌شناسی بافتی و پوستی، تشخیص پیشنهاد بدن.

مدل 4B تو بنچمارک MedQA (آزمون‌های پزشکی) به دقت ۶۴.۴ و مدل 27B به دقت ۸۷.۷ رسیده. تو بنچمارک MIMIC-CXR (تصاویر اشعه ایکس و گزارش‌ها) هم مدل 4B امتیاز F1 ماکرو ۸۸.۹ رو به‌دست آورده که در مقایسه با مدل Gemma 3 حدود ۸ امتیاز پیشرفت داشته.

این مدل‌ها از HuggingFace قابل دانلود و استفاده‌ هستن که می‌شه از این راهنما برای شروع کار و بهینه‌سازیشون استفاده کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6817🙏6🔥4👎1😁1
خدمات وب‌ آمازون (AWS) با همکاری آنتروپیک، بازارچه ایجنت‌های هوش‌مصنوعی خودشون رو هفته دیگه راه‌اندازی می‌کنن. این بازارچه به استارت‌آپ‌ها کمک می‌کنه ایجنت‌ها رو مستقیما به مشتری بفروشن و مشتری‌های سازمانی بتونن بر اساس نیازشون ایجنت مدنظرشون رو پیدا کنن و اون رو بخرن. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍377🔥3
گوگل مجموعه‌ای از مدل‌های زبانی جدید به اسم T5Gemma رو معرفی کرده که از نوع رمزگذار-رمزگشاست. یعنی دو بخش داره: یکی جمله ورودی رو می‌فهمه (رمزگذار)، یکی با گرفتن اون مقدار جواب می‌ده (رمزگشا). فرقش با مدل‌هایی مثل سری GPT اینه که اونا فقط بخش جواب‌دهی یا رمزگشایی دارن.

کاری که گوگل کرده اینه که اومده مدل‌های قبلی رو، که فقط رمزگشا بودن رو با تکنیک انطباق پذیری آموزش داده و تبدیلشون کرده به مدل‌هایی که هم رمزگذار دارن هم رمزگشا. توی این معماری، اول کل جمله‌ی ورودی خوب پردازش می‌شه، بعد مدل شروع می‌کنه به تولید خروجی. این باعث می‌شه مدل بهتر بفهمه و جواب دقیق‌تری بده.

مقدار پارامتر رمزگذاررمزگشا تو مدل‌های T5 در بعضی موارد تغییر می‌کنه و ترکیبی از ۹ میلیارد و ۲ میلیارد پارامتره. این مدل‌ها روی HuggingFace قابل دانلودن. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
40👍15🔥8
شرکت چینی Moonshot AI مدل agent محور Kimi K2 رو به‌صورت متن‌باز منتشر کرده. این شرکت ادعا کرده که این مدل برای agentic tasks بهینه شده، یعنی خودش شروع به پیدا کردن ابزار می‌کنه و با اون‌ها کاری که می‌خواید رو انجام می‌ده.

مثلاً با گرفتن دسترسی از گوگل کلندر و جیمیل، برای شما تمام پلن‌های مربوط به یک کنسرت رو می‌ریزه و گزارش نهایی رو ایمیل می‌کنه. یا با Ipython داده‌های آماری رو بصری‌سازی می‌کنه و صفحه وب‌های تعاملی می‌سازه. یا شبیه‌سازی‌های محیطی مثل ماینکرفت یا کهکشان رو اجرا می‌کنه. قابلیت اضافه کردن به ترمینال رو هم داره.

راهنمای استفاده ازش روی گیت‌هاب قرار داره، و از HuggingFace می‌شه مدل‌ها رو دانلود کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
53👍19🔥5
چرا گوگل ۲.۴ میلیارد دلار برای استخدام تیم ویندسرف پرداخت کرد؟

ما نوعی قرارداد داریم به اسم اکوی‌هایر، توی این حالت یه شرکت بزرگ جای اینکه یه استارتاپ رو بخره میاد فقط استعداد‌های کلیدیشو استخدام میکنه و مجوز استفاده از تکنولوژی‌هاشو هم میگیره، مثلا مایکروسافت برای اینکه بتونه دانشمند معروف مصطفی سلیمان رو استخدام کنه چنین قراردادی رو برای خرید شرکتش یعنی Inflection AI بست.

روز گذشته گوگل ۲.۴ میلیارد دلار پرداخت کرد تا وارون موهان و داگلاس چن که بنیان‌گذاران ویندسرف هستن رو به استخدام در بیاره و در واقع بیان داخل گوگل دیپ‌مایند کار کنن. از اونجایی که این قرارداد شامل تکنولوژی‌هاشون هم میشه (ادیتور و وایب‌کدینگ) پس میشه انتظار داشت گوگل داره به وایب کدینگ ورود میکنه و میخواد خودش یه محصول مستقیم ارائه بده.

یه ضربه احساسی هم اینجا OpenAI خود چون اونا میخواست ویندسرف رو به مبلغ ۳ میلیارد دلار بخرن که ظاهرا پیشنهاد گوگل جذاب‌تر بوده. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍21😁6🤯43
Geek Alerts
قرار هست OpenAI یه مدل Open-Weight معرفی کنه، یعنی این مدل دیگه فقط روی سرورهای خودشون نیست و میشه دانلودش کرد، افراد، شرکت‌ها و دولت‌ها میتونن روی سرورهای خودشون این مدل رو اجرا کنن، مثل وقتی مدل R1 از دیپ‌سیک اومد و مایکروسافت اونو به سرورهای آژور خودش اضافه…
مدل وزن‌باز OpenAI که قرار بود این هفته بیاد تاخیر خورد، سم‌آلتمن میگه تست‌های ایمنی اضافی لازم داشت چون وقتی وزن‌ها در دسترس همه قرار بگیرن دیگه نمیشه کاری کرد.

این ایمنی که میگن منظور جواب‌هایی هست که مدل میده، مثلا روزهای گذشته جواب‌های تند Grok رو داشتیم که باعث شد تیم xAI موقت نظر دادنش توی توییتر اکس رو مسدود کنن، احتمالا همین دلیلی هست که OpenAI هم ایمنی‌های بیشتر رو اضافه کردن. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4711😁9👎2😡2
گراک ویژگی Companions رو اضافه کرده که میشه کاراکتر انتخاب کرد و با کاراکتر در کنار مدل Grok 4 صحبت کنید. یه سری کاستوم‌ها هم میشه مثل تغییر لحن و مدل جواب دادن. ویژگیش فعلا فقط برای مشترکین سوپر گراک هست و توی نسخه IOS میشه بهش دسترسی داشت. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19👍9🔥3👎1😡1
اداره غذا و داروی آمریکا (FDA) یک رنگ خوراکی جدید (آبی) که از میوه گاردنیا به‌دست میاد رو تایید کرده، امسال تمرکزشون روی حذف رنگ‌های خوراکی مصنوعی هست، این رنگ جدید می‌تونه تو آب‌نبات، نوشیدنی‌های ورزشی و چای استفاده بشه. آمریکا می‌خواد تولیدکننده‌ها سریع‌تر از رنگ‌های نفتی فاصله بگیرن و این‌هارو از صنایع غذایی خودش حذف کنه. این چهارمین افزودنی رنگ طبیعیه که امسال تایید شده.

اشاراتی داشتن از یه تاریخی به بعد دیگه تولید کنندگان غذا، رنگ خوراکی غیر طبیعی نمیتونن استفاده کنن که احتمالا بعد از اون توی آمریکا مواد‌های غذایی بی‌رنگ‌تر میشن. [L]

🤓 @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11231👏13👎2😁2😍2
شرکت MistralAI مدل‌های Voxtral رو که با ورودی صدا(صدا به متن) کار می‌کنن، به‌صورت متن‌باز عرضه کرده. این مدل‌ها با ۳ و ۲۴ میلیارد پارامتر برای انجام وظایفی مثل جواب دادن به سوالات درباره محتوای صوتی یا رونویسی از روی صدا تا ۳۰ دقیقه و درک محتوای صوتی تا ۴۰ دقیقه با محدودیت ۳۲ هزار توکنی می‌تونن به‌کار گرفته بشن.

تو نتایج بنچمارک، Voxtral به‌طور کلی از Whisper large-v3، بهترین مدل رونویسی گفتار متن‌باز تا الان، بهتر عمل می‌کنه و در همه وظایف، عملکرد بهتری از GPT-4o mini Transcribe و Gemini 2.5 Flash داره. از زبان‌های انگلیسی، اسپانیایی، فرانسوی، پرتغالی، هندی، آلمانی، هلندی و ایتالیایی هم پشتیبانی می‌کنه.

به این دو مدل می‌شه از طریق Le chat دسترسی داشت یا برای استفاده محلی از HuggingFace اونا رو دانلود کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
35👍13🔥4
گوگل قابلیت‌های جدیدی که مبتنی بر هوش‌مصنوعی‌ هستن رو به موتور جستجوی خودش اضافه می‌کنه. با اضافه کردن تب AIMode، می‌شه از مدل‌های جمنای 2.5 پرو و فلش برای گرفتن پاسخ استفاده کرد که ورژن پرو برای کارهای پیچیده‌تر مناسب‌تره.

حالت Deep Search هم قابلیت جدیدیه که گوگل اون رو برای تحقیقات پیچیده‌تر مثل پروژه‌های کاری یا تکالیف دانشگاهی اضافه کرده که می‌تونه منابع مختلف رو همزمان جست‌وجو کنه و گزارش نهایی رو با ارائه منبع بسازه. این قابلیت تقریباً مشابه Deep Research که توی جمنای وجود داره، خواهد بود.

قابلیت بعدی تماس گرفتن هوش‌مصنوعی گوگل با کسب‌و‌کارهای محلی برای جمع‌آوری اطلاعات و ساخت گزارش از اوناست. برای مثال با جستجوی «رستوران‌های اطرف من» و اجازه دادن به هوش‌مصنوعی برای بررسی قیمت‌ها، با رستوران‌ها تماس می‌گیره، و با پرس‌وجو یک نسخه سازماندهی‌شده از چیزهایی که لازم دارید رو برای شما تهیه می‌کنه.

این قابلیت‌ها برای آمریکا باز شده و کاربران پرو و اولترا محدودیت بالاتری دارن و در آینده عرضه جهانی می‌شه. [L]

🤓 hadi @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
47👍11🔥7😡3😁1😍1
اوپن‌ای‌آی، ChatGPT agent رو به‌عنوان ایجنتی برای وظایف کلی‌تر منتشر کرده. این ایجنت می‌تونه با کلندر کار کنه، اسلایدهای قابل ویرایش برای ارائه بسازه و کدها رو اجرا کنه. این ابزار قابلیت‌های کلیک روی وبسایت اوپراتور رو با دیپ‌سرچ ترکیب می‌کنه و می‌تونه گزارش‌های کامل‌تری رو تولید کنه.

ترکیب ایجنت با کانکتورهای چت جی‌پی‌تی، اجازه می‌ده از اطلاعات اپ‌هایی مثل جیمیل یا گیت‌هاب استفاده کنه و از اون‌ها برای جواب بهتر دادن به پرامپ استفاده کنه. دسترسی به ترمینال هم برای اون ممکنه و از API می‌تونه برای متصل شدن به اپلیکیشن‌های دیگه هم استفاده کنه.

تو بنچمارک Humanity’s Last Exam که هزاران سوال‌ تو موضوعات مختلفه، ۴۱٪ رو کسب کرده که دو برابر مدل‌های o3 و o4-mini بوده. نتایج بنچمارک FrontierMath، که سخت‌ترین بنچمارک ریاضیه، نشون می‌ده با داشتن ابزاری مثل ترمینال برای اجرای کد، نسبت به مدل o4-mini که ۶.۳٪ رو کسب کرده، ایجنت امتیاز ۲۷.۴٪ رو کسب کرده.

این قابلیت برای مشترکین پرو، پلاس و تیم اوپن‌ای‌آی فعال شده، و می‌شه با فعال کردن agent mode تو چت جی‌پی‌تی ازش استفاده کرد. [L]

🤓 abolfazl @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4913🔥3🤯1