Forwarded from DevTwitter | توییت برنامه نویسی
یک بلاگ بسیار جالب از کمپانی HuggingFace که توضیح میده چطور یک مدل سبک VLM) vision–language) تونسته مهارتهای کار با رابط کاربری رو یاد بگیره و کمکم تبدیل بشه به یه coding agent برای GUI. تمام پروسه را هم کامل توضیح دادند از دستورالعملهای آموزش، ابزارهای پردازش داده، خود مدل، دمو و دیتاستها. تا کامل قابل تکرار باشه. خیلی خوبه! Blog: https://huggingface.co/blog/smol2operator
@DevTwitter | <Mehdi Allahyari/>
@DevTwitter | <Mehdi Allahyari/>
🔥🔥 آنتروپیک مدل Claude Sonnet 4.5 را معرفی کرد؛
این مدل در زمینه کدنویسی، ساخت ایجنتهای پیچیده و استفاده از کامپیوتر عملکرد برتری دارد و پیشرفتهای قابل توجهی در استدلال و ریاضی نشان میدهد.
در ارزیابیها: 77.2% در SWE-bench Verified، 61.4% در OSWorld، و قابلیت حفظ تمرکز در وظایف چندمرحلهای برای بیش از ۳۰ ساعت.
بهروزرسانیهای محصول شامل چکپوینتها در Claude Code، افزونه بومی VS Code، قابلیت ویرایش کانتکست و ابزار حافظه در API برای اجرای طولانیتر، و افزودن اجرای کد و ساخت فایل در اپها است. افزونه Chrome نیز برای کاربران منتخب فعال شده.
با انتشار Claude Agent SDK زیرساخت داخلی را برای ساخت ایجنتهای سفارشی در اختیار توسعهدهندگان قرار میدهد.
این مدل ایمنترین نسخه آنتروپیک تاکنون است؛ با دفاع بهتر در برابر حملات Prompt Injection و عرضه تحت استاندارد ASL-3 با فیلترهای CBRN.
همراه با پیشنمایش پژوهشی موقتی "Imagine with Claude" برای مشترکان Max به مدت پنج روز.
@code2_ir
کانال کد۲
این مدل در زمینه کدنویسی، ساخت ایجنتهای پیچیده و استفاده از کامپیوتر عملکرد برتری دارد و پیشرفتهای قابل توجهی در استدلال و ریاضی نشان میدهد.
در ارزیابیها: 77.2% در SWE-bench Verified، 61.4% در OSWorld، و قابلیت حفظ تمرکز در وظایف چندمرحلهای برای بیش از ۳۰ ساعت.
بهروزرسانیهای محصول شامل چکپوینتها در Claude Code، افزونه بومی VS Code، قابلیت ویرایش کانتکست و ابزار حافظه در API برای اجرای طولانیتر، و افزودن اجرای کد و ساخت فایل در اپها است. افزونه Chrome نیز برای کاربران منتخب فعال شده.
با انتشار Claude Agent SDK زیرساخت داخلی را برای ساخت ایجنتهای سفارشی در اختیار توسعهدهندگان قرار میدهد.
این مدل ایمنترین نسخه آنتروپیک تاکنون است؛ با دفاع بهتر در برابر حملات Prompt Injection و عرضه تحت استاندارد ASL-3 با فیلترهای CBRN.
همراه با پیشنمایش پژوهشی موقتی "Imagine with Claude" برای مشترکان Max به مدت پنج روز.
@code2_ir
کانال کد۲
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Based on internal testing, Sonnet 4.5 represents a new generation of agentic coding models in Cascade.
We're seeing substantially improved planning performance, stronger multi-file reasoning, and more reliable execution on complex refactoring tasks.
In our internal evals, we see Sonnet 4.5 outperform previous generations of Claude, including Opus.
Sonnet 4.5 maximizes actions per context window through concurrent tool use, such as running multiple bash commands simultaneously or reading several files in parallel. This makes Cascade sessions noticeably faster.
The model also proactively writes and executes test scripts to create feedback loops, demonstrating strong judgment about when to verify its own work. We've observed it checking correctness mid-task without prompting, which significantly improves reliability on long-running refactoring operations.
@code2_ir
We're seeing substantially improved planning performance, stronger multi-file reasoning, and more reliable execution on complex refactoring tasks.
In our internal evals, we see Sonnet 4.5 outperform previous generations of Claude, including Opus.
Sonnet 4.5 maximizes actions per context window through concurrent tool use, such as running multiple bash commands simultaneously or reading several files in parallel. This makes Cascade sessions noticeably faster.
The model also proactively writes and executes test scripts to create feedback loops, demonstrating strong judgment about when to verify its own work. We've observed it checking correctness mid-task without prompting, which significantly improves reliability on long-running refactoring operations.
@code2_ir
یه مدل با نام supernova عرضه شده که ide های cursor و windsurf هم فعلا به رایگان ارائه میدند و میتونید ازش استفاده کنید.
به نظر میرسه فعلا مشخص نیست عرضه کنندهاش چه شرکتی هست و صرفا توسط بازیگرهای اصلی حوزه ide های هوش مصنوعی به صورت پارتنرشیپ داره عرضه میشه.
اما در مجموع مدل خوب و قوی و راضی کنندهای هست. از مودل کد زدن و اجرای دستوراتش حس میکنم که از مدلهای چینی باید باشه. البته صرفا حدس. به نظرم ارزش امتحان کردن داره.
@code2_ir
کانال کد۲
به نظر میرسه فعلا مشخص نیست عرضه کنندهاش چه شرکتی هست و صرفا توسط بازیگرهای اصلی حوزه ide های هوش مصنوعی به صورت پارتنرشیپ داره عرضه میشه.
اما در مجموع مدل خوب و قوی و راضی کنندهای هست. از مودل کد زدن و اجرای دستوراتش حس میکنم که از مدلهای چینی باید باشه. البته صرفا حدس. به نظرم ارزش امتحان کردن داره.
مدل کدنویسی سوپرنوا یک مدل هوش مصنوعی کدنویسی جدید، رایگان و بهسرعت در حال ظهور است که قابلیتهای چندحالته (مولتیمودال) دارد و روی پلتفرمهایی مانند Kilo Code و Cursor در دسترس است. این مدل میتواند کد را از روی تصاویر درک و تولید کند و یک پنجرهی متنی بسیار بزرگ با ظرفیت ۲۰۰,۰۰۰ توکن ارائه میدهد، هرچند در انجام وظایف پیچیده نتایج متناقضی نشان داده است. برخی معتقدند که این مدل میتواند نسخهای از هوش مصنوعی کدنویسی Grok باشد. همچنین یک نسخهی بزرگتر با پنجرهی متنی ۱ میلیون توکن نیز منتشر شده است.
@code2_ir
کانال کد۲
👌1
code2 - تکنولوژی و فناوری
❗️ با توجه به رشد خیلی سریع LLM ها و ابزارهای هوش مصنوعی مثل ChatGPT به نظرم رسید که یکی از مباحث مهمی که باید راجع بهش صحبت کرد، بحث حریم شخصی و امنیت در این حوزه هست. فرضا اطلاعاتی که ما در اختیار شرکتها میگذاریم اکثرا به جهت آموزشهای مجدد اونها و…
تعداد کشورهایی که دارن وارد بازی کارزارهای اطلاعات نادرست میشن، داره با سرعت زیادی بالا میره. بعضی گزارشها میگن بین سالهای ۲۰۱۷ تا ۲۰۱۹ تقریباً ۱۵۰ درصد رشد داشته. یعنی موضوع شوخیبردار نیست — اثرش واقعیه و ضررهای سنگینی هم داره.
اطلاعات غلط فقط ذهن مردم یا نتیجهی انتخابات رو تغییر نمیده؛ از نظر اقتصادی هم ضربهی بزرگی میزنه. فقط توی سال ۲۰۱۹، خسارت مالی ناشی از اطلاعات نادرست حدود ۷۸ میلیارد دلار بوده. این جریان با ورود هوش مصنوعی بدتر هم شده — مخصوصاً با پخش شدن ویدیوها، عکسها و مقالههای دیپفیک که تشخیص واقعیت از جعل رو سختتر میکنن.
@code2_ir
اطلاعات غلط فقط ذهن مردم یا نتیجهی انتخابات رو تغییر نمیده؛ از نظر اقتصادی هم ضربهی بزرگی میزنه. فقط توی سال ۲۰۱۹، خسارت مالی ناشی از اطلاعات نادرست حدود ۷۸ میلیارد دلار بوده. این جریان با ورود هوش مصنوعی بدتر هم شده — مخصوصاً با پخش شدن ویدیوها، عکسها و مقالههای دیپفیک که تشخیص واقعیت از جعل رو سختتر میکنن.
@code2_ir
This media is not supported in your browser
VIEW IN TELEGRAM
مدیرعاملی که بدون هیچ تلاشی احترام را جلب کرد
در گرند پری چین ۲۰۱۸، مارتین براندل، مفسر فرمول یک، پرسید: «آیا انگلیسی صحبت میکنید؟» - بدون اینکه متوجه شود با دکتر لیزا سو، مدیرعامل AMD، صحبت میکند.
او آرام، خونسرد و با اعتماد به نفس، ثابت کرد که نفوذ واقعی ربطی به ظاهر ندارد - بلکه به بینش، تخصص و قدرت حضور در لحظه مربوط میشود.
@code2_ir
در گرند پری چین ۲۰۱۸، مارتین براندل، مفسر فرمول یک، پرسید: «آیا انگلیسی صحبت میکنید؟» - بدون اینکه متوجه شود با دکتر لیزا سو، مدیرعامل AMD، صحبت میکند.
او آرام، خونسرد و با اعتماد به نفس، ثابت کرد که نفوذ واقعی ربطی به ظاهر ندارد - بلکه به بینش، تخصص و قدرت حضور در لحظه مربوط میشود.
@code2_ir
یکی از ابزارهای ضروری که این روزها باید داشته باشید. نرمافزارهای رمز عبور دو مرحله ای هست. یا همون two factor authentication.
در واقع یک کد ساده ای هست مثل رمز دوم کارت های بانکی که با پیامک میاد، فقط روی گوشی ساخته میشه. احتمالا مخاطبان این گروه باهاش آشنا بودند. اما برای استفاده ازش نرم افزارهای مختلفی وجود داره که خوبه اون ها رو معرفی کنیم.
خب طبیعتا google authenticator که مال خود گوگل هست و خیلی معروف.
اما من خودم چندتا سرویس دیگه رو هم استفاده کردم و توصیه میکنم. یکیش Bitwarden هست که نرم افزار ذخیرهسازی رمزهای عبور. و 2fa یا همون رمز دومرحله ای رو هم میسازه و براش برنامه جدا هم داره.
بیت واردن که به شدت توصیه میشه برای نگهداری رمز های عبور فقط دقت کنید که اگه رمز اصلی و کلیدهای ریکاوری رو گم کنید دیگه تمام رمز و اطلاعاتی که توش نگه می داشتید غیرقابل دسترس خواهد بود لذا حواستون جمع باشه.
خب پس Google authenticator رو که گفتیم و بیت واردن هم همینطور. من خودم به دلایلی oneAuth استفاده میکنم. مال شرکت Zoho هست و برای لاگین توی سرویس های دیگه اش هم کاربرد داره.
جا داره راجع به شرکت زوهو براتون بیشتر بنویسم. یه شرکت هندی بین المللی نرم افزاری هست. من خیلی با محصولات و کارهای هندی حال نمیکنم علی رغم اینکه خیلی هاش هم قوی هست اما زوهو واقعا متفاوت. انصافا یه شرکت پدر مادر دار و حسابی. یعنی چه بسا از لحاظ نرم افزاری خیلی از ابزارهایی که داره از گوگل چیزی کم نداره! ولی خب کمتر شناخته شده. بگذریم.
خلاصه oneAuth هم برنامه خوب و تر و تمیزی هست.
مایکروسافت هم داره برنامه 2fa.
بازم هست و میتونید جستجو کنید ولی خب پیشنهاد میشه مال شرکتهای معتبر رو استفاده کنید.
در مورد نحوه استفاده هم وقتی سایتی ازتون بخواد که فعالش کنید، یه عکس qr کد نشون میده و شما اپ 2fa رو باز میکنید و اسکن میکنید و مابقی اش سرراست و مشخص. اضافه میشه و هر موقع سایت یا برنامه ازتون کد دو مرحله ای خواست وارد اون برنامه میشید و کپیش میکنید و توی سایت وارد میکنید.
خب اینم از کد ۲ مرحله ای که احتمالا آشنا بودید ولی گفتم توضیح بدم. یه سایتی رو هم در این مورد دیزاین کرده بودم برای آگاهی بخشی عمومی. ایشالله برسم زودتر منتشر کنم و اینجا هم معرفی میکنم.
@code2_ir
کانال کد۲
در واقع یک کد ساده ای هست مثل رمز دوم کارت های بانکی که با پیامک میاد، فقط روی گوشی ساخته میشه. احتمالا مخاطبان این گروه باهاش آشنا بودند. اما برای استفاده ازش نرم افزارهای مختلفی وجود داره که خوبه اون ها رو معرفی کنیم.
خب طبیعتا google authenticator که مال خود گوگل هست و خیلی معروف.
اما من خودم چندتا سرویس دیگه رو هم استفاده کردم و توصیه میکنم. یکیش Bitwarden هست که نرم افزار ذخیرهسازی رمزهای عبور. و 2fa یا همون رمز دومرحله ای رو هم میسازه و براش برنامه جدا هم داره.
بیت واردن که به شدت توصیه میشه برای نگهداری رمز های عبور فقط دقت کنید که اگه رمز اصلی و کلیدهای ریکاوری رو گم کنید دیگه تمام رمز و اطلاعاتی که توش نگه می داشتید غیرقابل دسترس خواهد بود لذا حواستون جمع باشه.
خب پس Google authenticator رو که گفتیم و بیت واردن هم همینطور. من خودم به دلایلی oneAuth استفاده میکنم. مال شرکت Zoho هست و برای لاگین توی سرویس های دیگه اش هم کاربرد داره.
جا داره راجع به شرکت زوهو براتون بیشتر بنویسم. یه شرکت هندی بین المللی نرم افزاری هست. من خیلی با محصولات و کارهای هندی حال نمیکنم علی رغم اینکه خیلی هاش هم قوی هست اما زوهو واقعا متفاوت. انصافا یه شرکت پدر مادر دار و حسابی. یعنی چه بسا از لحاظ نرم افزاری خیلی از ابزارهایی که داره از گوگل چیزی کم نداره! ولی خب کمتر شناخته شده. بگذریم.
خلاصه oneAuth هم برنامه خوب و تر و تمیزی هست.
مایکروسافت هم داره برنامه 2fa.
بازم هست و میتونید جستجو کنید ولی خب پیشنهاد میشه مال شرکتهای معتبر رو استفاده کنید.
در مورد نحوه استفاده هم وقتی سایتی ازتون بخواد که فعالش کنید، یه عکس qr کد نشون میده و شما اپ 2fa رو باز میکنید و اسکن میکنید و مابقی اش سرراست و مشخص. اضافه میشه و هر موقع سایت یا برنامه ازتون کد دو مرحله ای خواست وارد اون برنامه میشید و کپیش میکنید و توی سایت وارد میکنید.
خب اینم از کد ۲ مرحله ای که احتمالا آشنا بودید ولی گفتم توضیح بدم. یه سایتی رو هم در این مورد دیزاین کرده بودم برای آگاهی بخشی عمومی. ایشالله برسم زودتر منتشر کنم و اینجا هم معرفی میکنم.
@code2_ir
کانال کد۲
تعدادی از برنامه های 2fa
برنامه ذخیره سازی رمزهای عبور Bitwarden:
https://play.google.com/store/apps/details?id=com.x8bit.bitwarden
برنامه ذخیره سازی رمزهای عبور Bitwarden:
https://play.google.com/store/apps/details?id=com.x8bit.bitwarden
مباحث AI 🤖🧠
خب بریم سراغ AI که دیگه دست از سرمون بر نمی داره گویا:
یه سری سرفصل معرفی میکنم که میشه در موردشون صحبت کرد، سعی میکنم پرکاربردها رو بیشتر مطرح کنم.
خب بیشتر AIهایی که الان باهاشون سر و کار داریم LLMها 💬 هستند.
مثل همین chatgpt و Gemini و مشابه اون.
📚 چگونگی کارکرد LLMها (مدلهای زبان بزرگ)
یک مورد قابل بحث این هست که LLMها 🗣️ چطوری کار میکنن که میشه صحبت کرد ولی ادعایی در تخصص توی این مطلب ندارم. 🧐
📚 مهندسی پرامپت (Prompt Engineering)
🛠️ اما بحث prompt engineering رو چون تدریس داشتم و مطالبی ازش آماده دارم به نظرم مفید که یه چندتا ویدیو 🎥 یا یه مینی دوره براش گذاشت. خلاصه اش هم این که این LLMها و چت جیپیتی که موجودات زبون نفهمی هستند 🤪 رو چطور ازشون سوال کنیم که جوابهای بهتری ازشون بگیریم.
❓ در واقع این عبارت مهندسی پرامپت رو میشه تعبیر کرد به مهندسی پرسش یا اینکه چطور سوالات بهتری از این هوش مصنوعیها بپرسیم. ✨
@code2_ir
کانال کد۲
خب بریم سراغ AI که دیگه دست از سرمون بر نمی داره گویا:
یه سری سرفصل معرفی میکنم که میشه در موردشون صحبت کرد، سعی میکنم پرکاربردها رو بیشتر مطرح کنم.
خب بیشتر AIهایی که الان باهاشون سر و کار داریم LLMها 💬 هستند.
مثل همین chatgpt و Gemini و مشابه اون.
📚 چگونگی کارکرد LLMها (مدلهای زبان بزرگ)
یک مورد قابل بحث این هست که LLMها 🗣️ چطوری کار میکنن که میشه صحبت کرد ولی ادعایی در تخصص توی این مطلب ندارم. 🧐
📚 مهندسی پرامپت (Prompt Engineering)
🛠️ اما بحث prompt engineering رو چون تدریس داشتم و مطالبی ازش آماده دارم به نظرم مفید که یه چندتا ویدیو 🎥 یا یه مینی دوره براش گذاشت. خلاصه اش هم این که این LLMها و چت جیپیتی که موجودات زبون نفهمی هستند 🤪 رو چطور ازشون سوال کنیم که جوابهای بهتری ازشون بگیریم.
❓ در واقع این عبارت مهندسی پرامپت رو میشه تعبیر کرد به مهندسی پرسش یا اینکه چطور سوالات بهتری از این هوش مصنوعیها بپرسیم. ✨
@code2_ir
کانال کد۲