Tensorflow(@CVision) – Telegram

Tensorflow(@CVision)

15.2K subscribers

1.29K photos

310 videos

81 files

2.54K links

اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت:
https://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support

لینک گروه:
@tf2keras

Download Telegram

About

Blog

Apps

Platform

Tensorflow(@CVision)

15.2K subscribers

Tensorflow(@CVision)

مدل زبانی جدیدی به نام Falcon Mamba 7B معرفی شده که خیلی قدرتمنده! این مدل میتونه متن‌های خیلی بلند رو بدون اینکه نیاز به سخت‌افزار خیلی قوی داشته باشه، پردازش کنه. این یعنی می‌تونه کارهای خلاقانه‌ای مثل نوشتن داستان یا مقاله انجام بده

این مدل بر پایه نسل اول Mamba ساخته شده

Mamba
یک مدل فضای حالته (State Space Model) که ویژگی‌های شبکه‌های عصبی بازگشتی (RNN) و شبکه‌های عصبی کانولوشنی (CNN) را در خود جای داده . با استفاده از یک مکانیزم انتخابی، این مدل می‌توانه بسته به ورودی فعلی، اطلاعات را به طور انتخابی حفظ یا فراموش کنه و به این ترتیب، کارایی پردازش متن را بهبود بخشه

علاوه بر این، Mamba از یک الگوریتم موازی طراحی شده برای سخت‌افزار استفاده می‌کنه که به صورت بازگشتی اجرا می‌شه و از دسترسی‌های ورودی/خروجی بین سطوح حافظه GPU جلوگیری می‌کنه، در نتیجه باعث افزایش کارایی محاسباتی میشه

با حذف مکانیزم attention، به طور موثر مشکل کندی محاسبات مدل در پردازش دنباله‌های طولانی را برطرف کرده از طرفی این مدل می‌توانه دنباله‌هایی با طول نامحدود را پردازش کنه، بدون اینکه نیاز به حافظه بیشتری داشته باشه

صرف نظر از طول متن زمینه، زمان تولید هر توکن تقریباً ثابت هستش!

https://huggingface.co/blog/falconmamba#hardware-performance

Welcome Falcon Mamba: The first strong attention-free 7B model

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍19❤2

4.42K viewsAlister ☄️, 16:05

Tensorflow(@CVision)

doubao
قابلیت تولید موسیقی را راه اندازی کرد: کاربران می‌تونن با یک کلیک، شعر و موسیقی تولید کنن

هوش مصنوعی "دو بائو" متعلق به شرکت بایت‌دنس، قابلیت تولید موسیقی را راه اندازی کرده. کاربران می‌توانن با وارد کردن یک موضوع یا متن ترانه‌ای که خودشان نوشته‌ان در بخش "تولید موسیقی" دو بائو، سبک، احساس و صدای موسیقی را انتخاب کنن و در عرض حدود یک دقیقه، یک آهنگ کامل تولید کنن. به این ترتیب، هر کسی می‌توانه لذت خلق و بیان موسیقیایی را تجربه کنه!

در حال حاضر، این مدل قابلیت تولید موسیقی در 11 سبک مختلف مانند فولک، هیپ هاپ، آر اند بی و همچنین سبک‌های کمتر شناخته شده‌ای مانند جاز، رگی و موسیقی الکترونیک را ارائه می‌ده. کاربران می‌تونن صدای خواننده را به صورت مردانه یا زنانه انتخاب کنن. صدای تولید شده، از نظر وضوح کلمات و روان بودن بسیار خوب عمل میکنه. همچنین، برای اینکه موسیقی تولید شده توسط هوش مصنوعی بتونه احساسات کاربران را بهتر بیان کنه، این مدل حالات احساسی مختلفی مانند شادی، غم و ... را به صورت پیش‌فرض تنظیم کرده. با استفاده از doubao، کاربران می‌تونند موسیقی‌هایی با ویژگی‌های شخصی خودشون بسازن

https://www.doubao.com/chat/?from_logout=1

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

👌3👍1

3.37K viewsAlister ☄️, edited 16:40

Tensorflow(@CVision)

Tensorflow(@CVision)

doubao قابلیت تولید موسیقی را راه اندازی کرد: کاربران می‌تونن با یک کلیک، شعر و موسیقی تولید کنن هوش مصنوعی "دو بائو" متعلق به شرکت بایت‌دنس، قابلیت تولید موسیقی را راه اندازی کرده. کاربران می‌توانن با وارد کردن یک موضوع یا متن ترانه‌ای که خودشان نوشته‌ان…

به عنوان مثال، اگر عبارت "یک نفر در عصر تابستان در حال دوچرخه‌سواری است و غروب خورشید نارنجی رنگ را در دوردست می‌بیند" را وارد کنین و سبک موسیقی را روی "آر اند بی" و احساس را روی "عاشقانه" تنظیم کنید، این مدل به طور خودکار یک قطعه موسیقی و متن ترانه مرتبط با آن را می‌نویسه و می‌سازه و بر اساس متن ترانه، کاور آهنگ را نیز به طور خودکار طراحی می‌کنه

❤7👍1

3.83K viewsAlister ☄️, 16:42

Tensorflow(@CVision)

این هوش مصنوعی نه تنها کد مینویسه، بلکه می‌تونه مشکلات را حل کنه و تصمیمات منطقی بگیره، درست مانند یک برنامه‌نویس انسانی اون هم فقط در عرض ۸۴ ثانیه و تیم توسعه دهنده این مدل فقط از پنج نفر تشکیل شده. این مدل که
Genie
نام داره و ادعا میکنه که در حال حاضر قدرتمندترین هوش مصنوعی روی زمینه و می‌تونه مانند انسان فکر و عمل کنه

به چهار روش مختلف میتونید Genie را به کار بگیرین که یکی از اون روشهای جالب توجه دادن لینک issue در گیت‌هاب به مدل هست

به عنوان مثال، برای حل یک Issue در گیت‌هاب، ابتدا لینک یک مخزن (repo) را به Genie می‌دهم. پس از اون، Genie به طور خودکار شروع به تحلیل اون مسئله می‌کنه

تصور کنین شما به Genie بگین که یک باگ در برنامتون وجود داره. Genie شروع می‌کنه به بررسی کدهای شما، فایل‌های تنظیمات و هر چیز دیگری که فکر کنه که ممکنه به اون کمک کنه تا مشکل را پیدا کنه. این مدل این کار را تا زمانی ادامه می‌ده که به خط کد مشکل‌دار برسه

Genie
پس از انجام تحلیل‌های لازم، به طور خودکار شروع به تولید کد و اجرای اون می‌کنه تا ببینه که آیا مشکل حل شده یا خیر

اگر در حین اجرای کد، خطایی رخ بده، Genie تنها به بخش‌هایی که مشکل دارن برمی‌گرده و دوباره اون‌ها را تحلیل، کد‌نویسی و اجرا می‌کنه تا زمانی که کد بدون هیچ مشکلی اجرا شه و تمام این کارها فقط 84 ثانیه طول می‌کشه!

سرعت تحولات اینقدر در این حوزه بالاست که واقعا بروز بودن غیر ممکنه!

https://cosine.sh/blog/genie-technical-report

🔥18👍7❤4

5.48K viewsAlister ☄️, edited 17:10

Tensorflow(@CVision)

از یه LLM مثل جی‌پی‌تی۴ بخوای بوی یه چادر مسافرتی خیس بارون رو حس کنه، خیلی مودبانه میگه نه. ولی اگه ازش بخوای اون بو رو برات توصیف کنه، شروع می‌کنه به شعر گفتن از «هوای پر از انتظار» و «بوی تازه و خاکی»، بدون اینکه اصلا بارون دیده باشه یا دماغ داشته باشه که بتونه اینجوری قضاوت کنه! یه توضیح ممکن اینه که هوش مصنوعی داره فقط از روی متن‌هایی که تو داده‌های آموزشی زیادش بوده، تقلید می‌کنه، نه اینکه واقعا بوی بارون یا چیزی دیگه رو درک کنه.

اما اینکه چشم ندارن، یعنی مدل‌های زبانی هیچوقت نمی‌تونن بفهمن که شیر از گربه خونگی بزرگتره؟

فیلسوفا و دانشمندان مدت‌ها فکر می‌کردن که توانایی فهمیدن معنی زبان، نشونه‌ی هوش انسانیه و درمورد اینکه چه چیزایی لازم داریم تا بتونیم این کار رو انجام بدیم، زیاد اندیشیدن

دانشمندان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) در تلاش برای کشف راز کارکرد مدل‌های زبانی، نتایج جالبی پیدا کردن. به نظر می‌رسه این مدل‌ها برای بهتر جواب دادن، دارن سعی می‌کنن دنیای واقعی رو خودشون بفهمند.

این تیم اول یه سری پازل ساده به اسم کارل ساختن. این پازلا درباره دادن دستور به یه ربات تو یه دنیای شبیه‌سازی شده بود. بعد این مدل رو با راه حل های این پازلا آموزش دادن، اما بدون اینکه نشون بدن راه حل ها چطور کار می‌کنن. در آخر، با استفاده از یه تکنیک هوش مصنوعی به اسم "probing"، دانشمندان رفتن داخل ذهن مدل و دیدن که وقتی داره جواب جدید می‌سازه، چطور فکر می‌کنه.

بعد از اینکه مدل رو با تعداد زیادی پازل آموزش دادن، مدل خودش یه تصویر ذهنی از دنیایی که توش پازلا حل می‌شد، ساخته. این خیلی جالبه چون مدل هیچ وقت این دنیا رو ندیده بود.
یعنی مدل توانسته با استفاده از اطلاعات پازلاها، خودش یه دنیای مجازی بسازه و درکش کنه. این باعث شده که دانشمندا به این فکر کنن که شاید برای یادگیری زبان، به اطلاعات کمتری از اون چیزی که فکر می‌کردیم نیاز داریم. همچنین، این احتمال وجود داره که مدل‌های زبانی در آینده بتونن خیلی بهتر از الان زبان رو بفهمند.

نویسندگان مقاله میگن اولش که شروع کردیم، مدل زبانی دستورهای بیخود و الکی می‌داد. اما کم کم که آموزشش دادیم، رسیدیم به جایی که مدل تونست تو ۹۲.۴ درصد مواقع دستورهای درست بده. این خیلی برامون هیجان‌انگیز بود چون فکر کردیم اگه مدل بتونه با این دقت کار کنه، شاید بتونه معنی کلمات رو هم بفهمه. این شد نقطه شروع ما برای فهمیدن اینکه آیا مدل‌های زبانی واقعا متن رو می‌فهمن یا نه. حالا می‌بینیم که این مدل‌ها خیلی بیشتر از اینکه فقط کلمات رو کنار هم بچینن، کار بلدن

ادمه دارد ...

https://arxiv.org/pdf/2305.11169

❤17👍11

5.79K viewsAlister ☄️, edited 16:32

Tensorflow(@CVision)

Tensorflow(@CVision)

از یه LLM مثل جی‌پی‌تی۴ بخوای بوی یه چادر مسافرتی خیس بارون رو حس کنه، خیلی مودبانه میگه نه. ولی اگه ازش بخوای اون بو رو برات توصیف کنه، شروع می‌کنه به شعر گفتن از «هوای پر از انتظار» و «بوی تازه و خاکی»، بدون اینکه اصلا بارون دیده باشه یا دماغ داشته باشه…

probe

وظیفه داشت بفهمه مدل زبانی چطور فکر می‌کنه و دستورها چه معنی میدن. معلوم شد که مدل زبانی یه تصویر ذهنی از حرکت ربات برای هر دستور می‌سازه. هر چی مدل زبانی بهتر می‌تونست پازل‌ها رو حل کنه، این تصویر ذهنی هم دقیق‌تر می‌شد. این یعنی مدل زبانی داشت کم کم معنی دستورها رو می‌فهمید. بعد از یه مدت، مدل زبانی تونست دستورهای کاملی بده که ربات رو درست حرکت می‌داد.

مدل زبانی مثل بچه کوچیکه یاد می‌گیره حرف بزنه. اولش فقط تکرار می‌کنه و حرفاش بی‌معنیه. بعدش یاد می‌گیره کلمات چطور کنار هم قرار می‌گیرن (قواعد زبان). اینجوری می‌تونه دستورهایی بده که شبیه جواب درست باشه، ولی بازم کار نمی‌کنه.
کم کم دستورهای مدل زبانی بهتر می‌شن. وقتی مدل زبانی معنی کلمات رو می‌فهمه، شروع می‌کنه به دادن دستورهایی که دقیقا همون کاری رو می‌کنن که خواسته شده، مثل یه بچه که جمله‌های درست می‌سازه.

این تحقیق مستقیما به یه سوال مهم تو هوش مصنوعی میپردازه: آیا قابلیت‌های عجیب مدل‌های زبانی بزرگ فقط به خاطر پیدا کردن الگو تو داده‌های زیاد هست یا این مدل‌ها واقعا معنی چیزی که دارن روش کار می‌کنن رو می‌فهمن؟

نویسنده مقاله میگه این تحقیق نشون می‌ده که مدل زبانی یه مدل ذهنی از دنیای شبیه‌سازی شده می‌سازه، حتی اگه اصلا یاد نگرفته باشه این کار رو بکنه.

این آزمایش بیشتر از قبل نشون داد که مدل‌های زبانی می‌تونن معنی عمیق کلمات رو بفهمن. با این حال، نویسنده قبول داره که مقاله شون محدودیت‌هایی داره: اونا از یه زبان برنامه‌نویسی خیلی ساده و یه مدل کوچیک استفاده کردن. تو کار بعدی شون می‌خوان از یه محیط کلی‌تر استفاده کنن. هرچند این تحقیق نمی‌گه چطور مدل زبانی رو سریع‌تر آموزش بدیم که معنی رو بفهمه، ولی فکر می‌کنه تحقیقات بعدی می‌تونن با استفاده از این یافته‌ها، روش آموزش مدل‌های زبانی رو بهتر کنن.

👍6❤2

4.93K viewsAlister ☄️, 17:08

Tensorflow(@CVision)

This media is not supported in your browser

VIEW IN TELEGRAM

تن الن تورینگ هم توی گور می‌لرزه وقتی بهش بگی هوش مصنوعی خلاصه شد در مدل های با میلیاردها پارامتر که بر روی پیشبینی کلمه بعدی آموزش دیده اند

🔥32👍14😁11🤔1

5.48K viewsAlister ☄️, 17:18

Tensorflow(@CVision)

Tensorflow(@CVision) pinned Deleted message

19:28

Tensorflow(@CVision)

دوستانی که قبلا محتوا خریدند، و قصد ثبت نام دارند، لطفا به پشتیبانی پیام دهند که مبلغ محتوا کسر گردد

4.3K views19:54

Tensorflow(@CVision)

ما آتش رو اختراع کردیم، بارها و بارها خرابکاری کردیم، و بعدش کپسول آتش‌نشانی، راه خروج اضطراری، آژیر آتش و آتش‌نشانی رو اختراع کردیم!

هر پستانداری روی این سیاره به طور غریزی تعادل طبیعی با محیط اطرافش برقرار می‌کنه، اما شما انسان‌ها این کار را نمی‌کنید. شما به جایی نقل مکان می‌کنید و تکثیر و تکثیر می‌شین تا تمام منابع طبیعی مصرف شه و در نهایت تنها راه بقای شما گسترش به محل دیگست. موجود دیگری روی این سیاره وجود داره که از الگوی مشابهی پیروی می‌کنه. میدونید چیه؟ یک ویروس!

Life 3.0 📚

https://youtu.be/rEXUxVzJhuM?feature=shared

Vangelis Hymne (original version) Hymn

"Hymne" by Vangelis, from the "Opera Sauvage" album. This is the original version, which seems hard to find on Youtube. You'll find a lot of cover versions, and also Vangelis' own remake (Retitled "Hymn") on the "Portraits" compilation CD, but this is the…

👍16🤔3❤1😢1

4.18K viewsAlister ☄️, edited 15:04

Tensorflow(@CVision)

قبلاً اگه می‌خواستید یه فیلم دو ساعته رو به یه هوش مصنوعی نشون بدین و ازش سوال بپرسین، باید کلی صبر می‌کردین تا جوابتونو بده. تازه خیلی وقتا هم جواب درست و حسابی نمی‌داد!

ولی حالا یه مدل جدید به اسم mPLUG-Owl3 توسط علی بابا منتشر شده. این مدل می‌تونه تو عرض فقط ۴ ثانیه یه فیلم دو ساعته رو کامل ببینه و بعدش هر سوالی که ازش بپرسین رو جواب بده.

فرقی هم نداره که ازش بپرسین وسط فیلم چه اتفاقی افتاد یا آخرش چی شد، این مدل همه چی رو یادش می‌مونه و جوابتونو با جزئیات میده. انگار که خودش داره فیلم رو براتون تعریف می‌کنه

mPLUG-Owl3
یک مدل زبانی بزرگ چندحالته هست که برای حل چالش‌ درک دنباله‌های طولانی تصاویر طراحی شده، بدین منظور ماژولی بنام hyper attention رو پیشنهاد میدن که سرعت درک دنباله‌های تصویری طولانی در مدل‌های زبانی بزرگ چندحالته رو تا شش برابر افزایش میده و پردازش دنباله‌های تصویری تا هشت برابر طولانی‌تر رو امکان‌پذیر می‌کنه

https://www.arxiv.org/abs/2408.04840

mPLUG-Owl3: Towards Long Image-Sequence Understanding in...

Multi-modal Large Language Models (MLLMs) have demonstrated remarkable capabilities in executing instructions for a variety of single-image tasks. Despite this progress, significant challenges...

👍17

4.81K viewsAlister ☄️, 08:54

Tensorflow(@CVision)

Forwarded from 🚀 کلاس‌ویژن | یادگیری هوش مصنوعی از پایه تا پیشرفته

This media is not supported in your browser

VIEW IN TELEGRAM

🎓ثبت نام دوره تعاملی هوش مصنوعی و دیپ لرنینگ🎓

📢کلاس ویژن با همکاری مجموعه دانش‌بنیان شناسا برگزار میکند
🧠دوره کامل یادگیری عمیق با TensorFlow/Keras🧑‍💻👩‍💻

🔗لینک ثبت نام و اطلاعات دوره

✔️ آموزش‌های آنلاین و جلسات رفع اشکال (15 جلسه)
✔️ محتوای ضبط‌شده (بالغ بر 40 ساعت)
✔️ گواهی پایان دوره
✔️ تسهیل ورود به بازارکار

👤مدرس: علیرضا اخوان‌پور
- مدرس دانشگاه،
- مدیر فنی مجموعه دانش‌بنین شناسا؛
- مدرس و مشاور هوش مصنوعی

🗓شروع از 19 شهریور
~~~~~~~~~~~~~
🎉کد تخفیف ویژه، برای ثبت نام زود هنگام:

deep_early_register

📞سوالات و راهنمایی پیرامون دوره و روال ثبت نام: @classvision_support
🔍اطلاعات تکمیلی و اطلاعیه های بعدی: @class_vision
🔗لینک ثبت نام و اطلاعات دوره

👍9❤3😁2

3.74K views12:51

Tensorflow(@CVision)

ویدیوی معرفی دو تبلیغ بالا با این سرویس رایگان هوش مصنوعی ایجاد شده است.
تصویر با
https://app.leonardo.ai/
و تبدیل تصویر به ویدیو با:
https://lumalabs.ai/

————————
https://t.iss.one/cvision/3660
https://t.iss.one/cvision/3661

❤2👍2

4.71K views14:57

Tensorflow(@CVision)

Forwarded from 🚀 کلاس‌ویژن | یادگیری هوش مصنوعی از پایه تا پیشرفته

This media is not supported in your browser

VIEW IN TELEGRAM

📢🎉ثبت نام دومین دوره جامع یادگیری عمیق کلاس ویژن آغاز شد.

کد تخفیف 700.000 تومانی ویژه ثبت نام زود هنگام برای 10 نفر ثبت نامی اول

deep_early_register

🔗لینک ثبت نام و اطلاعات دوره

✅دسترسی مادام العمر به محتوای کلاس
✅دسترسی به محتوا + کلاسهای رفع اشکال + تمرین و پروژه و تصحیح + مدرک + معرفی به بازارکار
🧑‍🏫مدرس: علیرضا اخوان‌پور
🎁در انتهای دوره دانشجویان برتر به شرکت های فعال در زمینه هوش مصنوعی برای انجام مصاحبه معرفی خواهند شد.
🕔کلاس های رفع اشکال از بازه 19 شهریور تا 25 آذر با مدرس دوره

👍6❤1😁1🤯1

4.14K views15:37

Tensorflow(@CVision)

Forwarded from 🚀 کلاس‌ویژن | یادگیری هوش مصنوعی از پایه تا پیشرفته

دوره‌ی openCV تو مکتب خونه امروز 60 درصد تخفیف خورده...

لینک خرید

❤8😁2🔥1

3.95K viewsClass Vision Support, 17:13

Tensorflow(@CVision)

Restoring speaker voices with zero-shot cross-lingual voice transfer for TTS
https://research.google/blog/restoring-speaker-voices-with-zero-shot-cross-lingual-voice-transfer-for-tts/

👍2

3.88K views02:00

Tensorflow(@CVision)

Forwarded from School of AI (Hamidreza Hosseinkhani)

This media is not supported in your browser

VIEW IN TELEGRAM

اگر در زمینه‌ی بینایی رایانه (Computer Vision) فعال باشید، حتما Roboflow رو می‌شناسید.

مهم‌ترین قابلیتی که Roboflow به متخصصان CV ارائه می‌ده، قابلیت Annotate کردن تصاویر و آماده‌سازی و میزبانی دیتاست‌ست.

این ابزار از مدل‌های بنیادین مثل GroundingDINO و SAM استفاده کرده و تا جای ممکن، عمل Annotation رو به‌صورت خودکار انجام می‌ده.

امروز SAM2 به روبوفلو اضافه شد که عمل‌كرد بی‌نظیر اون رو در تصویر می‌بینید.

👍22❤3

3.46K views06:24

Tensorflow(@CVision)

صحبت های خانم Fei-Fei Li در مورد قدرت الگوریتم ها در دستیابی به هوش فضایی در تد.

به طور خلاصه :

حدود 540 میلیون سال پیش، زمین توی تاریکی مطلق بود، ولی این تاریکی به خاطر نبود نور نبود، بلکه به خاطر این بود که هیچ موجودی توانایی دیدن نداشت. هیچ‌کس نمی‌تونست نور رو حس کنه و به همین دلیل نور و زندگی که تو دریاها وجود داشت، نادیده می‌موند. تا اینکه موجوداتی به نام تریلوبیت‌ها برای اولین بار تونستن نور رو حس کنن و این توانایی باعث یه تحول بزرگ تو زندگی روی زمین شد و در نهایت به تکامل هوش تو جهان حیوانی انجامید.

با گذشت زمان و پیشرفت تکنولوژی، انسان‌ها تونستن با ترکیب الگوریتم‌های شبکه عصبی، سخت‌افزارهای پیشرفته و داده‌های بزرگ، ماشین‌هایی بسازن که مثل انسان‌ها بتونن دنیا رو ببینن و درک کنن. این پیشرفت تو زمینه بینایی ماشین و هوش مصنوعی باعث شد که این ماشین‌ها بتونن تصاویر و ویدئوهای جدیدی رو بر اساس یه جمله توصیفی ایجاد کنن یا فضاهای سه‌بعدی پیچیده‌ای رو از یه تصویر بسازن.

پیشرفت‌های اخیر تو هوش مصنوعی فقط به دیدن محدود نشده، بلکه حالا ماشین‌ها می‌تونن کارهای پیچیده‌ای رو تو دنیای سه‌بعدی انجام بدن. این تغییرات مخصوصاً تو زمینه‌هایی مثل رباتیک و بهداشت کاربردهای زیادی دارن، مثلاً ربات‌های خودمختاری که می‌تونن کارهای روزمره رو انجام بدن و کیفیت زندگی انسان‌ها رو بهتر کنن. البته برای اینکه به طور کامل به این آینده برسیم، لازمه که فناوری‌هایی توسعه بدیم که همیشه انسان رو در اولویت قرار بدن و به بهبود رفاه جمعی و حفظ کرامت انسانی کمک کنن.

https://youtu.be/y8NtMZ7VGmU?si=hXHMVvWwptRJUjuY

With Spatial Intelligence, AI Will Understand the Real World | Fei-Fei Li | TED

In the beginning of the universe, all was darkness — until the first organisms developed sight, which ushered in an explosion of life, learning and progress. AI pioneer Fei-Fei Li says a similar moment is about to happen for computers and robots. She shows…

👍12🎉3👌1

4.75K viewsAlister ☄️, edited 18:05

Tensorflow(@CVision)

Tensorflow(@CVision)

اعضای اصلی تیم Stable Diffusion تأسیس یک شرکت جدید را اعلام کردن Robin Rombach که یکی از نویسندگان اصلی Stable Diffusion هستش و در ماه مارس از Stability AI جدا شد، به همراه چندین همکار سابق خود، به طور رسمی خبر تشکیل یک شرکت جدید رو اعلام کرد نام این شرکت…

می‌تونید با ۱۰ الی ۱۵ تصویر در ۱۰۰۰ گام لورا Flux رو برای هر نوع دست‌خطی، حتی دست‌خط خودتون، آموزش بدین

این قابلیت خیلی جالبه، مخصوصاً با توجه به اینکه Flux هنوز توی مراحل اولیه‌شه.

https://huggingface.co/fofr/flux-tolkien-handwriting

👍7

4.75K viewsAlister ☄️, 09:43

Tensorflow(@CVision)

آیدان گومز(جوانترین عضو از نویسندگان مقاله transformer)، مدیرعامل و یکی از بنیان‌گذاران شرکت Cohere، توی مصاحبه‌اش گفت که فقط فروش مدل‌ها برای موفقیت کافی نیست. او توضیح میده که افزایش مقیاس مدل‌ها تنها راه پیشرفت نیست و استارتاپ‌های هوش مصنوعی باید از خدمات ابری دوری کنند تا بتونند با OpenAI رقابت کنند. به نظرش، کیفیت داده‌ها هم خیلی مهمه و تو پنج سال آینده باید منتظر پیشرفت‌های بزرگ توی رباتیک باشیم.

او افزود که پیشرفت بزرگ بعدی توی هوش مصنوعی به رباتیک مربوط میشه. هزینه‌ها داره کم میشه و باید مدل‌های بهتری داشته باشیم. خیلی از مشکلات قدیمی توی رباتیک حل شده و ربات‌ها الان می‌تونند بهتر استدلال و برنامه‌ریزی کنند. ممکنه تو پنج تا ده سال آینده ربات‌های انسان‌نمای عمومی با هزینه کم و قابلیت‌های بالا رو ببینیم.

گومز معتقده تکنولوژی‌های جدید توی محصولات و اپلیکیشن‌ها می‌تونند تغییرات مثبت و مفیدی توی تعاملات اجتماعی و تولید محتوا ایجاد کنند. به نظرش، هوش مصنوعی می‌تونه توی آموزش و تعاملات مفید باشه، ولی جایگزین روابط انسانی نمیشه. همچنین به نگرانی‌ها درباره کاهش مشاغل هم اشاره کرده و گفته که تکنولوژی ممکنه توی بعضی زمینه‌ها مثل پشتیبانی مشتری جایگزین‌هایی ایجاد کنه، اما به طور کلی این تغییرات به نفع رشد و کارایی انسان‌ها خواهد بود.

https://www.youtube.com/watch?v=FUGosOgiTeI

Aidan Gomez: What No One Understands About Foundation Models | E1191

Aidan Gomez is the Co-founder & CEO at Cohere, the leading AI platform for enterprise, having raised over $1BN from some of the best with their last round pricing the company at a whopping $5.5BN. Prior to Cohere, Aidan co-authored the paper “Attention is…

👍11🔥3

4.38K viewsAlister ☄️, 02:48

Tensorflow(@CVision)

هزینه 1 میلیون توکن GPT تو 18 ماه از 180 دلار به 0.75 دلار کاهش پیدا کرده.

مدل زبانی بزرگ لاما ۳ که متا ساخته، اونقدر که باید مورد استقبال قرار نگرفته و این باعث شده بحث بین مدل‌های منبع‌باز و منبع بسته داغ‌تر بشه.

Lama 3
برای جذب مشتری تو آمازون وب سرویس (AWS) به مشکل بر خورده. بیشتر مشتریان سازمانی آمازون به جای Lama، مدل زبانی منبع بسته کلود که آنتروپیک توسعه داده رو ترجیح میدن.

منابع داخلی مایکروسافت هم میگن که Lama انتخاب اولشون برای فروش نیست و ترجیح میدن Lama رو به شرکت‌هایی پیشنهاد بدن که تخصص داده‌ای بالا دارن، مثل شرکت‌هایی که مهندس و متخصص داده دارن.

❤6👍1

3.43K viewsAlister ☄️, edited 14:43