مهندسی داده

عکس ها مرتبط با پست بالا هستند. 👆👆👆

👍1

316 views19:13

‍ آیا دوران دیتابیس‌های خودتولیدشونده رسیده است؟

نگاهی به خرید Neon توسط Databricks و شروع عصر جدید معماری‌های AI-first

چند روز پیش خبری منتشر شد که در ظاهر، فقط یکی دیگر از خریدهای میلیاردی دنیای دیتا بود:

شرکت Databricks شرکت Neon را خرید.

منبع : https://www.databricks.com/blog/databricks-neon

اما پشت این خبر، نشانه‌هایی از یک تحول بنیادی در دنیای پایگاه داده و زیرساخت داده‌ای نهفته است:

بیش از ۸۰٪ از دیتابیس‌های ساخته‌شده در Neon توسط ایجنت‌های AI ساخته شده‌اند، نه انسان‌ها!

🧠 تحول از چت‌بات‌ها به ایجنت‌های زیرساخت‌ساز

در چند سال اخیر، تمرکز اصلی اکوسیستم هوش مصنوعی بر تولید متن، تصویر یا کد بوده؛ اما حالا با رشد ایجنت‌های هوشمند (AI Agents)، با نسل جدیدی از ابزارها روبه‌رو هستیم:

⛔️ فقط "چه چیزی را تحلیل کنیم؟"

✅ بلکه: "کجا ذخیره کنیم؟ چطور ساختار بدهیم؟ چه دیتابیسی بسازیم؟"

ایجنت‌ها اکنون:

منطق کسب‌وکار را تحلیل می‌کنند،

ساختار داده‌ای را طراحی می‌کنند،

و در کمتر از یک ثانیه، دیتابیسی مبتنی بر PostgreSQL را به‌صورت کامل می‌سازند.

📌 نئون چیست و چرا این‌قدر مهم شد؟

نئون یک سرویس PostgreSQL کاملاً سرورلس، open-source و cloud-native است که با ویژگی‌هایی منحصربه‌فرد به محبوبیت بالایی رسید:

✅ساخت دیتابیس در کمتر از ۱ ثانیه

✅معماری تفکیک‌شده‌ی Storage/Compute

✅پشتیبانی از Branching/Forking برای دیتابیس (مثل Git)

✅مدل پرداخت بر اساس مصرف واقعی (usage-based billing)

✅کاملاً API-first و قابل استفاده در pipelineها و توسط ایجنت‌ها

و نسبت به سرویس محبوب Supabase، زیرساخت جداگانه‌ی Storage/Compute ارائه می‌دهد که آن را به‌مراتب مقیاس‌پذیرتر و اقتصادی‌تر کرده است

🧠 چرا Databricks این‌قدر به Neon علاقه داشت؟

دیتابریکز فقط به‌دنبال یک پایگاه داده نبود — بلکه دنبال قطعه‌ای گمشده برای زنجیره‌ی AI-first + Open-Source + Cloud-Native خودش بود.

📈 در ۳ سال گذشته، Databricks با خریدهای زیر این مسیر را به‌وضوح ترسیم کرده:

MosaicML (۲۰۲۳) → برای مدل‌های زبانی و آموزش اختصاصی (۱.۳ میلیارد دلار)

Tabular (۲۰۲۴) → برای تقویت آیس‌برگ در تحلیل‌های مدرن (بیش از ۱ میلیارد دلار)

Neon (۲۰۲۵) → لایه‌ی عملیاتی و سبک‌وزن برای پایگاه‌داده (حدود ۱ میلیارد دلار)

🎯 نتیجه؟

یک معماری end-to-end برای AI که در آن:

📌 MosaicML → لایه مدل و آموزش

📌 Tabular → لایه تحلیل و ذخیره‌سازی برداری (Data Lakehouse)

📌 Neon → لایه عملیات و دیتابیس سبک OLTP

و همه چیز open، قابل‌برنامه‌ریزی، و سازگار با ایجنت‌ها

🔭 معماری آینده: Lance، Neon، و دیتابیس‌هایی برای ایجنت‌ها

در این معماری نوین، جایگزینی فرمت‌های قدیمی مانند Parquet با فرمت‌های جدید مانند Lance برای تحلیل و ML کاملاً منطقی‌ست:

نئون - Neon برای داده‌های transaction و تنظیمات سریع ایجنت‌ها

لنس - Lance برای ذخیره و پردازش برداری (embedding، RAG، ML training)

آیس‌برگ - Delta/Iceberg برای versioning و تحلیلی سنگین

🧩 چرا این تغییر اهمیت دارد؟

چون ابزارهای آینده نه‌تنها باید مقیاس‌پذیر و سریع باشند، بلکه باید با هوش مصنوعی هم‌صحبت شوند، ساختار بگیرند و بازطراحی شوند.

معماری‌های آینده باید:

📌 مبتنی بر اصل API-first باشند

📌 برای تعامل با ایجنت‌ها طراحی شده باشند

📌 بر پایه‌ی open formats بنا شده باشند

📌 از مصرف‌کننده به معمار تغییر نقش داده شوند

برای مطالعه بیشتر :

https://www.linkedin.com/pulse/databricks-neon-deal-final-piece-ai-driven-enterprise-dmitriy-gerzon-orwic/

https://www-cnbc-com.cdn.ampproject.org/c/s/www.cnbc.com/amp/2025/05/14/databricks-is-buying-database-startup-neon-for-about-1-billion.html

https://www.linkedin.com/feed/update/urn:li:activity:7328542430599811072/

👍5

329 viewsedited 09:36