This was how we ended up winning the second place for the freaking third time.🤦
Both in my opinion and the main referee what we did in just 24 hours was a masterpiece.
As he said the reason was because there were 6 other referees and in summing it up these things can happen
Both in my opinion and the main referee what we did in just 24 hours was a masterpiece.
As he said the reason was because there were 6 other referees and in summing it up these things can happen
🔥3
Media is too big
VIEW IN TELEGRAM
Randomly,out of nowhere. I did an elevator pitch
It was a good speech and I could pitch my idea
It was a good speech and I could pitch my idea
❤2
Forwarded from Tensorflow(@CVision) (Alister ☄️)
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Sana-0.6B میتونه با مدلهای بزرگتر و پیشرفته مثل Flux-12B رقابت کنه، در حالی که ۲۰ برابر کوچکتر و ۱۰۰ برابر سریعتره. این مدل رو میشه روی کارت گرافیک لپ تاپ ۱۶ گیگا بایتی اجرا کرد و برای تولید یه عکس 1024 × 1024 کمتر از ۱ ثانیه زمان می بره. سانا امکان تولید محتوا با هزینه پایین رو فراهم می کنه.
https://arxiv.org/pdf/2410.10629
معرفی یه اتواینکدر جدید که فشرده سازی تصاویر رو به میزان 32 برابر انجام میده (در مقایسه با روشهای قبلی با فشرده سازی 8 برابری) و باعث کاهش تعداد توکنهای پنهان و در نتیجه افزایش سرعت و کارایی مدل در تولید تصاویر با وضوح بالا مثل 4K میشه
استفاده از توجه خطی (Linear DiT) که نسخه بهینه شده مکانیسم توجه استاندارده و برای بهبود کارایی در تولید تصاویر با وضوح بالا طراحی شده. مکانیسم توجه استاندارد به صورت معمولی پیچیدگی محاسباتی O(N2) رو داره ، به این معنی که وقتی اندازه تصویر افزایش پیدا میکنه، مقدار محاسبات هم به صورت نمایی افزایش پیدا میکنه. این موضوع بهخصوص در پردازش تصاویر با وضوح بالا مشکلسازه. توجه خطی پیشنهاد شده پیچیدگی محاسبات رو از O(N2) به O(N) کاهش می ده.
https://arxiv.org/pdf/2410.10629
معرفی یه اتواینکدر جدید که فشرده سازی تصاویر رو به میزان 32 برابر انجام میده (در مقایسه با روشهای قبلی با فشرده سازی 8 برابری) و باعث کاهش تعداد توکنهای پنهان و در نتیجه افزایش سرعت و کارایی مدل در تولید تصاویر با وضوح بالا مثل 4K میشه
استفاده از توجه خطی (Linear DiT) که نسخه بهینه شده مکانیسم توجه استاندارده و برای بهبود کارایی در تولید تصاویر با وضوح بالا طراحی شده. مکانیسم توجه استاندارد به صورت معمولی پیچیدگی محاسباتی O(N2) رو داره ، به این معنی که وقتی اندازه تصویر افزایش پیدا میکنه، مقدار محاسبات هم به صورت نمایی افزایش پیدا میکنه. این موضوع بهخصوص در پردازش تصاویر با وضوح بالا مشکلسازه. توجه خطی پیشنهاد شده پیچیدگی محاسبات رو از O(N2) به O(N) کاهش می ده.
🔥1
آزمایشگاه بینایی کامپیوتر با ارائه آقای محمد صادق نعمت پور با موضوع:
🔰 مقدمه ای بر llm agents and agentic workflow
میزبان شما خواهد بود.
📅 دوشنبه ۳۰ مهر ماه ۱۴۰۳
🕓 ساعت ۱۶:۰۰
📍آزمایشگاه بینایی کامپیوتر، دانشکده کامپیوتر، دانشگاه علم و صنعت
لینک مجازی
https://meet.google.com/qne-zihr-rwx
🔰 مقدمه ای بر llm agents and agentic workflow
میزبان شما خواهد بود.
📅 دوشنبه ۳۰ مهر ماه ۱۴۰۳
🕓 ساعت ۱۶:۰۰
📍آزمایشگاه بینایی کامپیوتر، دانشکده کامپیوتر، دانشگاه علم و صنعت
لینک مجازی
https://meet.google.com/qne-zihr-rwx
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
بالاخره kaggle agent من که کل تابستون رو روش کار میکردم آماده Release شد.🥳
این agent میتونه بصورت خودمختار مسائل kaggle رو فقط با دادن یه لینک حل کنه
لینک ریپو پروژه :
https://github.com/MSNP1381/kaggle-Agent
این agent میتونه بصورت خودمختار مسائل kaggle رو فقط با دادن یه لینک حل کنه
لینک ریپو پروژه :
https://github.com/MSNP1381/kaggle-Agent
🔥3🤩1
https://x.com/MSNP/status/1847929521820848488?t=n4-hLxzkKAgkBELzLDTWIw&s=19
پست توییتر من به ایمپرشن 15.7k ای رسید و سرش خیلی خوشحالم
پست توییتر من به ایمپرشن 15.7k ای رسید و سرش خیلی خوشحالم
🔥3
میخوام از امشب ماژول knowledge injection رو شروع کنم به توسعه فک کنم با مشغولیت هایی که دارم یه ماهه تموم کنمش
🤩3👍1
Forwarded from Tensorflow(@CVision) (Alister ☄️)
This media is not supported in your browser
VIEW IN TELEGRAM
چند روز پیش درباره نسخه جدید Claude 3.5 Sonnet نوشتم که تعامل و دستورات کاربر با کامپیوتر رو از طریق کیبورد مجازی یا صدا فراهم کرده.
کاری که احتمالا این مدل انجام میده شناسایی مطمئن آیکونها و عناصر قابل تعامل توی رابط کاربری و درک مفهوم و معنای عناصر مختلف در تصویر و ارتباط دقیق این عناصر با عملی که کاربر میخواد انجام بده، هست.
امروز مایکرسافت OmniParser رو به صورت متن باز ارائه کرد. OmniParser یه ماژول جمع و جور(با سرعت بالا) برای پردازش صفحه هست و میتونه عکس های رابط کاربری رو به عناصر ساختار یافته تبدیل کنه.
این ماژول رو میشه با مدل های مختلف متن باز زبانی تلفیق کرد تا عامل هایی ساخت که بتونن روی رابط های کاربری عمل کنن، مثل کاری که Claude 3.5 Sonnet انجام میده با این تفاوت که به صورت لوکال اجرا میشه و 100% در کنترل خودتونه.
کد :
https://github.com/microsoft/OmniParser
لینک مقاله:
https://arxiv.org/abs/2408.00203
کاری که احتمالا این مدل انجام میده شناسایی مطمئن آیکونها و عناصر قابل تعامل توی رابط کاربری و درک مفهوم و معنای عناصر مختلف در تصویر و ارتباط دقیق این عناصر با عملی که کاربر میخواد انجام بده، هست.
امروز مایکرسافت OmniParser رو به صورت متن باز ارائه کرد. OmniParser یه ماژول جمع و جور(با سرعت بالا) برای پردازش صفحه هست و میتونه عکس های رابط کاربری رو به عناصر ساختار یافته تبدیل کنه.
این ماژول رو میشه با مدل های مختلف متن باز زبانی تلفیق کرد تا عامل هایی ساخت که بتونن روی رابط های کاربری عمل کنن، مثل کاری که Claude 3.5 Sonnet انجام میده با این تفاوت که به صورت لوکال اجرا میشه و 100% در کنترل خودتونه.
کد :
https://github.com/microsoft/OmniParser
لینک مقاله:
https://arxiv.org/abs/2408.00203
Forwarded from آموزش سواد سایبری
This media is not supported in your browser
VIEW IN TELEGRAM
تحول بنیادین در صنعت توسعه نرمافزار
کلود 3.5 Sonnet اکنون در Copilot
شرکت گیتهاب در اقدامی راهبردی، خط مقدم توسعه نرمافزار را با معرفی Claude 3.5 Sonnet دگرگون ساخت.
این شرکت در جریان کنفرانس GitHub Universe 2024، از یکپارچهسازی مدل Claude با پلتفرم محبوب Copilot پرده برداشت.
کلود 3.5 Sonnet اکنون در Copilot
شرکت گیتهاب در اقدامی راهبردی، خط مقدم توسعه نرمافزار را با معرفی Claude 3.5 Sonnet دگرگون ساخت.
این شرکت در جریان کنفرانس GitHub Universe 2024، از یکپارچهسازی مدل Claude با پلتفرم محبوب Copilot پرده برداشت.
🔥2👍1
بریم که distilled knowledge رو روی کاربرد های orange3 پیاده کنیم
👍2
Yasha
این پرامپت رو به ChatGPT دادم تا با شناختی که ازم داره من رو به تصویر بکشه، شما هم تستش کنید: "based on what you know of me draw a picture of what you think my life currently look like" پینوشت: من هیچ علاقهای به گیتار ندارم و نمیدونم توی عکس اون گوشه برای…
منم همین پرامپت رو به chatGPT دادم و نتیجه خیلی جالب شد
👍3
#دل_نوشت
بعد جدایی که حدود ۸ ماه پیش داشتم خیلی دلم میخواد وارد یه رابطه جدید بشم ولی نیازمند ثبات و تعهد عه و من نمیخوام که به خودم و کسی آسیب وارد کنم ولی همین تبدیل به درگیری روزمره ام شده.
دوستام رو میبینم که تو یه رابطه جدی ان و یا با کسی که میخواستش خیلی خوشحال وارد رابطه شده، خیلی حس عجیبی بهم دست میده
بعد جدایی که حدود ۸ ماه پیش داشتم خیلی دلم میخواد وارد یه رابطه جدید بشم ولی نیازمند ثبات و تعهد عه و من نمیخوام که به خودم و کسی آسیب وارد کنم ولی همین تبدیل به درگیری روزمره ام شده.
دوستام رو میبینم که تو یه رابطه جدی ان و یا با کسی که میخواستش خیلی خوشحال وارد رابطه شده، خیلی حس عجیبی بهم دست میده
Forwarded from Yasha