School of AI
10.6K subscribers
290 photos
94 videos
11 files
612 links
هدف ما در این اجتماع کوچک، آموزش و ترویج هوش مصنوعی و افزایش سطح آگاهی و تخصص نسبت به آن است.
باشد که دست در دست هم، آینده‌ی این صنعت را در میهن‌مان ایران بسازیم.

https://www.aparat.com/v/Pmrs8
Download Telegram
نسخه‌ی دوم از مدل زبانی گوگل به‌نام PaLM 2 معرفی شد.

https://ai.google/discover/palm2
پروژه Open Assistant یک چت‌بات مکالمه‌ای اوپن‌سورس است که توسط شرکت LAION (سازنده‌ی Stable Diffusion) معرفی شده. این چت‌بات:

- توانایی بازیابی اطلاعات را دارد
- میتواند از طریق api به سیستم‌های دیگر متصل شود و با آن‌ها تعامل کند
- مبتنی بر چند LLM اوپن‌سورس است
- از Reinforcement Learning with Hindsight Feedback استفاده می‌کند
- کاملا رایگان است
- کاملا اوپن‌سورس است و می‌تواند برای کابرد خاص شما fine-tune شود

https://open-assistant.io/
👍102
Tamasha ~Pinkmusic.ir
Mahasti ~Pinkmusic.ir
این آهنگ توسط هوش مصنوعی ساخته شده!

آهنگ "تماشا" که توسط شادمهر عقیلی برای بانو مهستی ساخته شده بود ولی به علت بیماری ایشان هرگز اجرا نشد، پس از گذشت ۱۶ سال توسط یک الگوریتم هوش مصنوعی، با صدا و تحریرهای خود مهستی اجرا شد.
این اثر به‌ظاهر ساخته‌ی فردی با نام مستعار Farva است که در کانال یوتیوب زیر منتشر شده:
https://youtu.be/DM7oVfXb1OE
20🔥3👍2
School of AI
Mahasti ~Pinkmusic.ir – Tamasha ~Pinkmusic.ir
همزمان با خلق این اثر هنری به‌یادماندنی، فردی با نام مستعار aproyx آموزش تبدیل صدا به‌کمک مدل‌های یادگیری ماشین رو به زبان ساده در کانال یوتیوب خود گذاشته که بسیار جالبه:

https://youtu.be/iKF7P7X3OuY

این هم یک نمونه خارجی است:
https://youtu.be/kEffWnjy028


برای جدا کردن موزیک از صدای خواننده و استخراج vocal هم می‌تونید از اپ زیر استفاده کنید:
https://github.com/Anjok07/ultimatevocalremovergui/releases/tag/v5.5.0
👍52
This media is not supported in your browser
VIEW IN TELEGRAM
تبلیغ جدید کوکاکولا به کمک Generative AI و StableDiffusion ساخته شده است.
🔥21👍41
نسخه‌ی iOS برای ChatGPT منتشر شد:

- امکان ارسال پرامپت به صورت صدا به کمک سیستم اوپن‌سورس پردازش گفتار OpenAI موسوم به Whisper
- قابلیت همگام‌سازی چت‌ها بین دستگاه‌های مختلف

https://apps.apple.com/app/openai-chatgpt/id6448311069
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
اگر به چالش‌های شرکت در مسابقات برنامه‌نویسی علاقه دارید، سایت Codingame یکی از جذاب‌ترین سایت‌ها برای برگزاری مسابقات برنامه‌نویسی است.
جدید‌ترین چالش این سایت (CODINGAME SPRING CHALLENGE 2023)، مسابقه‌ی برنامه‌نویسی بات هوش مصنوعی است که در تاریخ ۲۵ می (ساعت ۵:۳۰ عصر) شروع شده و به مدت ۱۰ روز ادامه دارد.
با شرکت در این چالش می‌توانید به صورت انفرادی، تیمی و جهانی به رقابت بپردازید.

https://www.codingame.com/contests/spring-challenge-2023
🔥4👍3
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
گوگلی ها با استفاده از RL در هوش مصنوعی یه روش سورت کردن جدید ابداع کردند.
این مقاله در Natute چاپ شده و کد سورت هم به زبان c++ نیز در گیتهاب به صورت اوپن سورس گذاشته شده‌.

این اولین باریه که یه هوش مصنوعی تو ابداع یه روش طراحی الگوریتمی/ساختمان داده ای داره دخالت میکنه :)
https://www.deepmind.com/blog/alphadev-discovers-faster-sorting-algorithms
👍14😍10🔥2
تسلیت به جامعه‌ی علمی ایران 🖤
61🔥3😍3👍2👏2
آموزش فریم‌ورک LangChain برای توسعه اپلیکیشن‌های مبتنی بر LLM

این کورس کوتاه یک ساعته توسط آقای Harrison Chase خالق فریم‌ورک به همراه Andrew Ng تدریس شده.

https://www.deeplearning.ai/short-courses/langchain-for-llm-application-development/
👍12
زبون برنامه‌نویسی C بیش از۵۰ سال پیش توسط Dennis Ritchie ساخته شده و بعضی افراد (🤨) اون رو یک زبون قدیمی (و احیانا منسوخ!) میدونن.
اما واقعیت اینجاست که این زبون هم مثل بقیه زبو‌ن‌ها آپدیت میشه و نسخه‌های مدرن اون وجود داره. آخرین آپدیت C23 است که در حال حاضر نسخه Preview است و به زودی نسخه Stable اون عرضه میشه.

زبون C جوری با زندگی بشر گره خورده که منسوخ شدنش به این راحتی‌ها هم نیست. کامپیوتر رو که روشن می‌کنیم Bootloader (مثلا GRUB) که با C نوشته شده میاد بالا و سیستم‌عامل (مثلا macOS یا Ubuntu یا Windows) که بیشتر بخش‌های کرنل اش با C نوشته شده رو اجرا می‌کنه. همینطور که با کامپیوتر کار می‌کنیم میلیون‌ها خط کد ترجمه شده از C پشت پرده در حال اجرا اند، مرورگر وب (مثلا Chrome یا Firefox) رو که باز می‌کنیم با C نوشته شده، یه وبسایت (مثلا maktabkhooneh.org) رو که توش باز میکنیم یه درخواست به سمت سرور مکتب‌خونه میره و از CDN ها و Reverse Proxy ها و کش ها و Web Server هایی رد میشه که همگی احتمالا به زبون C نوشته شده اند و روی سرورهایی که سیستم عاملشون با C نوشته شده اجرا میشن. در نهایت به کد بک اند مکتب‌خونه می‌رسه که مثلا با پایتون نوشته شده ولی مفسر پایتون و ASGI Server و … همگی با C نوشته شده اند. داخل همین کدهای پایتون هم خیلی از پکیج‌های اصلی مثل Numpy قدرتشون رو از C میگیرن. دیگه من وارد Embedded System ها نمیشم ولی شما تا تهش برید.


در کل هر جا که نیاز به سرعت خیلی بالا دارید، نیاز به مصرف حافظه خیلی بهینه دارید، نیاز به نزدیکی به سخت‌افزار و دسترسی سطح پایین به درایورها، کرنل ها و سلول‌های حافظه دارید، C یکی از بهترین گزینه‌ها است.

ما در دانشگاه صنعتی شریف معتقدیم که زبون C یکی از بهترین گزینه‌ها برای شروع کار مهندسین کامپیوتر است که به درک دقیق ساختار زیرین و سطح پایین‌تر کامپیوتر کمک شایانی می‌کند. حتی اگر قرار نباشد دانشجو بعدا از این زبان استفاده مستقیم کند اما بعد از C یادگیری هر زبون دیگه ای راحت‌تر خواهد بود.

دوره زیر از کلاس‌های درس مبانی برنامه‌نویسی کامپیوتر اینجانب در دانشگاه صنعتی شریف ضبط شده که می‌تونه منبع خوبی برای دانشجویان نوورود به این رشته، افرادی که سخت به این کلاس‌ها دسترسی دارند و همینطور سایر علاقه‌مندان به زبان C باشه. در این دوره تلاش شده مفاهیم پایه برنامه‌نویسی و علوم کامپیوتر به صورت دقیق، به‌روز و مدرن به دانشجویان عرضه شود.
امیدوارم که مفید و در راستای پیشرفت دانشجویان و متخصصان سرزمینمون باشه


https://www.aparat.com/playlist/4834378
👍297👏3🔥1
اگر بخشی از کد پایتون شما محسابات عددی سنگین یا بخش‌های Performance-critical و یا توابع NumPy است، می‌تونید با پکیج Numba اون بخش رو به صورت JIT کامپایل کنید.
اولین باری که تابع فراخوانی میشه، ترجمه به زبان ماشین اتفاق میفته و از سری بعد با پرفورمنسی نزدیک به پرفورمنس native تابع اجرا میشه.
البته توجه کنید که پکیج Numba فقط تابع ها رو کامپایل می‌کنه و برای کامپایل کردن کد Coroutine ها نمیشه ازش استفاده کرد. بنابراین اگرمی‌خواهید همزمان از asyncio هم استفاده کنید مجبورید به جای این پکیج از Cython استفاده کنید.

https://numba.readthedocs.io/en/stable/user/5minguide.html
👍5
یکی از اصلی‌ترین مفاهیمی که مهندسین داده (Data Engineers) روزانه با آن سر و کار دارن، مفهوم Data Transformation است.
به‌صورت خیلی خلاصه، دیتا‌های مختلف و پراکنده رو از دیتابیس‌های مختلف می‌خونن، اون‌ها رو به شکلی که برای تحلیل‌ (Data Analysis) مناسب باشه ترکیب/تبدیل می‌کنن و در یک دیتاورهاوس (یا دیتابیس دیگر) برای مقاصد تحلیلی یا یادگیری ماشینی ذخیره می‌کنند.
یکی از ابزار‌های پرکاربرد برای پیاده‌سازی پایپلاین تبدیل دیتا، ابزار اوپن‌سورس DBT است. این ابزار برای کار با دیتابیس‌ها (و دیتاورهاوس‌ها)ی مبتنی بر SQL ساخته شده اما با MinIO و فایل‌های فلت مثل CSV و Parquet هم کاملا سازگار است.
برای استفاده از DBT اول به کمک pip اون رو نصب کنید (طبیعیه که انتظار میره پایتون از قبل نصب باشه)
---------------------------------------
pip install dbt
---------------------------------------
یک دیرکتوری ساخته و داخل آن (در محیط ترمینال) دستور dbt init رو بزنید تا یک پروژه DBT شامل فایل‌های و دیرکتوری‌های مورد نیاز ساخته شود.
فایل profiles.yml شامل تنظیمات دیتابیس‌های شما است. اطلاعات اون رو کامل کنید. مثلا:
---------------------------------------
my_source_database:
target: dev
outputs:
dev:
type: postgres
host: source_host
user: source_user
password: source_password
database: source_database
schema: source_schema
my_target_database:
target: prod
outputs:
prod:
type: postgres
host: target_host
user: target_user
password: target_password
database: target_database
schema: target_schema
---------------------------------------
بعد داخل دیرکتوری models می‌تونید فایل‌هایی با پسوند .sql بسازید که کار تبدیل داده رو انجام می‌دن. به این فایل‌ها DBT model می‌گیم. مثلا:
---------------------------------------
-- Define the source and target database connections
-- Replace my_source_database and my_target_database with your actual connection names
{{ config(
materialized='table',
tags=['extract_and_load'],
schema='my_target_database'
) }}
-- Extract data from the source database
WITH extracted_data AS (
SELECT
column1,
column2,
...
FROM
{{ source('my_source_database', 'source_table') }}
)
-- Load the extracted data into the target database
INSERT INTO {{ target('my_target_database', 'target_table') }}
SELECT
column1,
column2,
...
FROM
extracted_data;
---------------------------------------
بعد دستور dbt compile رو زده و کدها رو کامپایل کنید (و اگه خطایی وجود داره رفع کنید)
نهایتا هر زمان که خواستید (مثلا هر شب) دستور dbt run رو اجرا کنید تا همه‌ی DBT Model ها اجرا شوند.

اطلاعات بیشتر:
https://docs.getdbt.com/
3👍3
دوره آموزشی تابستانه هوش مصنوعی پروژه محور
اطلاعات بیشتر : https://scs.ipm.ac.ir/ais.jsp
👍2
زمانی که شما یه پروژه هوش مصنوعی یا علوم داده رو مثلا در دانشگاه انجام می‌دید، بیشتر تمرکزتون روی بخش‌های مربوط به تحلیل داده و مدل‌سازی است. اما زمانی که به عنوان یک Machine Learning Engineer و یا یک Data Scientist وارد صنعت می‌شید، از شما انتظار میره که یک محصول واقعی بسازید که در عمل و زیر ترافیک بسیار زیاد، با سرعت قابل قبول کار کنه و از دسترس خارج نشه.
این تقریبا بزرگ‌ترین چالشیه که وقتی وارد بازار کار می‌شید دارید. چالشی که مهندسین نرم‌افزار کم‌تر با اون مشکل دارن.

برای حل این مشکل، من یه codebase به زبون Python آماده کردم که به شما اجازه می‌ده به جای تمرکز روی بخش‌های مهندسی و MLOps روی حل مساله متمرکز شید و در نهایت مدلی که train کردید رو داخل این کدبیس قرار بدید و یه سرویس وب آماده داشته باشید که به بهترین شکل ممکن کار کنه.

- برای توسعه این کدبیس از فریم‌ورک FastAPI به‌همراه سرور Uvicorn استفاده شده و بیشتر بخش‌ها به کمک Coroutine ها به‌صورت Async در اومده. بنابراین می‌تونید انتظار سرعت بالایی (حتی در مواردی نزدیک به زبون Go) ازین سرویس داشته باشید.
- سعی شده ساختار کد تا جای ممکن، ساده ولی حرفه‌ای و ساختارمند بر اساس الگوی MVC باشه ولی از Object Oriented تا جای ممکن استفاده نشه.
- از redis به عنوان feature store استفاده شده اما قابلیت جایگزینی با feast هم وجود داره
- برای بررسی و تحلیل پرفورمنس سیستم در عمل، همه ورودی/خروجی‌ها و زمان‌های اجرا در قالب Analytical Logs روی stdout چاپ می‌شن.
- پروژه کاملا dockerize شده و آماده استفاده روی کوبرنتیز و داکره.
- پروژه به صورت HA میاد بالا. یعنی همزمان چند نسخه از اون روی سرورهای مختلف اجرا می‌شن تا در صورت مشکل، سرویس از دسترس خارج نشه.
- همه practice های خوب MLOps توش رعایت شده مثلا اینکه CI/CD با GitLab و Github روش وجود داره.
- داکیومنت خودکار بر اساس Swagger داره
- یک پروژه ریکامندر سیستم فیلم برای تست روی سرویس قرار گرفته که می‌تونید بر اساس نیاز تغییرش بدید

https://github.com/xei/fastapi-blueprint
👍258🙏5👏2
جدیدترین آگهی‌های شغلی حوزه دیتا (ایران)
در این پست، چند پوزیشن شغلی مرتبط با هوش مصنوعی در ایران که در حال حاضر در حال جذب اند رو معرفی می‌کنیم برای دوستانی که جویای شغل اند:


مدیر تیم دیتا - ازکی
https://jobinja.ir/1001334

- متخصص یادگیری ماشین (object detection) - شرکت های‌وب
https://www.irantalent.com/en/job/artificial-intelligence-expert/112778

- متخصص علوم داده - شرکت بورس تهران
https://www.irantalent.com/en/job/data-scientist/115052

- متخصص علوم داده - ماهکس
https://www.irantalent.com/en/job/data-science-specialist/112471

متخصص علوم داده - ایرانسل
https://www.irantalent.com/en/job/data-scientist/111903

تحلیل‌گر داده (قیمت‌گذاری) - دیجی‌کالا
https://www.irantalent.com/en/jobs/search?keyword=machine-learning&language=english#search

متخصص کلان داده - شرکت بورس تهران
https://www.irantalent.com/en/job/data-engineer-bige-deta/114861

متخصص هوش مصنوعی - توسن
https://jobinja.ir/999489

متخصص یادگیری ماشین - طاقچه
https://jobinja.ir/998476

متخصص یادگیری ماشین - نیک‌آموز
https://jobinja.ir/1007126

تحلیلگر داده - پارس پک
https://jobinja.ir/984742

متخصص علوم داده - اسنپ
https://jobinja.ir/1009325
https://jobinja.ir/1011733

متخصص علوم داده - اسمارتک
https://jobinja.ir/1001226

متخصص علوم داده - بلوبانک
https://jobinja.ir/1011856

متخصص Data Platform - اسنپ
https://jobinja.ir/1002250

مهندس داده - مفید
https://jobinja.ir/996099

مهندس داده - شیپور
https://jobinja.ir/1008298

متخصص کلان‌داده - بهسازان ملت
https://jobinja.ir/984691

تحلیلگر داده - اسنپ
https://jobinja.ir/1009352

کارشناس جونیور علوم داده - کیلید
https://jobinja.ir/994211

کاراموز یادگیری ماشین - رستاوا
https://jobinja.ir/1005054
👍12🙏3