👩💻 Короткий гайд по векторным базам данных
👉 Что это:
Векторная база данных — это особый тип базы данных, информация в которой хранится в виде многомерных векторов, представляющих определённые данные. Эти данные (текст, изображения, аудио, видео) преобразуются в векторы с помощью разных методов.
❓Зачем это нужно:
Основное преимущество векторных баз данных — способность быстро и точно находить и извлекать данные в зависимости от близости или сходства их векторов. Например, можно искать тексты, которые совпадают со входной статьёй по теме, или песни, которые перекликаются с другой по мелодии и ритму.
✔️Какие есть векторные базы данных:
- Chroma
Опенсорсная база данных, упрощающая создание LLM-приложений.
- Pinecone
Помогает создать векторный поиск для получения релеватных данных в задачах RAG, создания рекомендаций и др.
- Weaviate
Позволяет проводить автоматическую векторизацию с помощью моделей генерации эмбеддингов.
👉 Что это:
Векторная база данных — это особый тип базы данных, информация в которой хранится в виде многомерных векторов, представляющих определённые данные. Эти данные (текст, изображения, аудио, видео) преобразуются в векторы с помощью разных методов.
❓Зачем это нужно:
Основное преимущество векторных баз данных — способность быстро и точно находить и извлекать данные в зависимости от близости или сходства их векторов. Например, можно искать тексты, которые совпадают со входной статьёй по теме, или песни, которые перекликаются с другой по мелодии и ритму.
✔️Какие есть векторные базы данных:
- Chroma
Опенсорсная база данных, упрощающая создание LLM-приложений.
- Pinecone
Помогает создать векторный поиск для получения релеватных данных в задачах RAG, создания рекомендаций и др.
- Weaviate
Позволяет проводить автоматическую векторизацию с помощью моделей генерации эмбеддингов.
👍2
Forwarded from Библиотека питониста | Python, Django, Flask
Обозначим расстояние между деревьями после вырубки d. Тогда существует n – d х (m – 1) – m + 1 способов вырубить деревья. Чтобы найти все варианты, нужно просуммировать способы по всем d. Кроме того, нужно учесть 2 частных случая – когда количество оставшихся после вырубки деревьев равно 0 или 1.
1️⃣ вариант:
n, m = list(map(int, input().split()))
trees = 0
if m == 0:
trees = 1
elif m == 1:
trees = n
else:
for d in range(1, n):
trees += (n - d) // (m - 1)
print(trees)
2️⃣ вариант:
n, m = map(int, input().split())
trees = 0
if m == 0:
trees = 1
elif m == 1:
trees = n
else:
for d in range(1, (n - 1) // (m - 1) + 1):
trees += n - (m - 1) * d
print(trees)
👉Ещё четыре олимпиадных задачи с решениями ищите в нашей статье👈
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
👍1
📈 9 главных трендов в разработке фронтенда в 2024 году
В статье разбираем самые популярные языки, технологии, инструменты и архитектурные концепции:
1️⃣ JavaScript — по-прежнему бесспорный лидер
2️⃣ TypeScript набирает популярность
3️⃣ Прогрессивные веб-приложения (PWA) стали стандартом
4️⃣ Микрофронтенды (Micro Frontends) — микросервисы на фронтенде
5️⃣ Feature-Sliced Design — оптимальная архитектура
6️⃣ Jamstack — статические сайты, неотличимые от динамических
7️⃣ SWC — супербыстрый транспайлер
8️⃣ Backend-driven UI — интерфейс, управляемый бэкендом
9️⃣ Использование ИИ на всех этапах разработки фронтенда
В статье разбираем самые популярные языки, технологии, инструменты и архитектурные концепции:
1️⃣ JavaScript — по-прежнему бесспорный лидер
2️⃣ TypeScript набирает популярность
3️⃣ Прогрессивные веб-приложения (PWA) стали стандартом
4️⃣ Микрофронтенды (Micro Frontends) — микросервисы на фронтенде
5️⃣ Feature-Sliced Design — оптимальная архитектура
6️⃣ Jamstack — статические сайты, неотличимые от динамических
7️⃣ SWC — супербыстрый транспайлер
8️⃣ Backend-driven UI — интерфейс, управляемый бэкендом
9️⃣ Использование ИИ на всех этапах разработки фронтенда
🩺 Модели машинного обучения превзошли традиционные методы диагностики одной из форм рака поджелудочной железы
Речь идёт о протоковой аденокарциноме поджелудочной железы (англ. pancreatic ductal adenocarcinoma, PDAC). Разработанная учёными система Prism по диагностике этого заболевания включает в себя две модели:
▪️нейронную сеть PRISM;
▪️логистическую регрессию.
Обе модели используют данные медицинских записей, в том числе демографические данные, диагнозы пациента, данные по лекарствам, которые он принимает, результаты различных анализов, чтобы предсказать риск рака. Нейросеть применяется для обнаружения сложных закономерностей в таких данных, как возраст, история болезни и результаты лабораторных исследований. Логистическая регрессия используется для простого анализа, выдаёт вероятность развития PDAC по этим признакам.
Стандартные методы диагностики способны обнаружить около 10% случаев PDAC, а обе модели Prism, используемые совместно, — 35%.
📖 Исследовательская статья
Речь идёт о протоковой аденокарциноме поджелудочной железы (англ. pancreatic ductal adenocarcinoma, PDAC). Разработанная учёными система Prism по диагностике этого заболевания включает в себя две модели:
▪️нейронную сеть PRISM;
▪️логистическую регрессию.
Обе модели используют данные медицинских записей, в том числе демографические данные, диагнозы пациента, данные по лекарствам, которые он принимает, результаты различных анализов, чтобы предсказать риск рака. Нейросеть применяется для обнаружения сложных закономерностей в таких данных, как возраст, история болезни и результаты лабораторных исследований. Логистическая регрессия используется для простого анализа, выдаёт вероятность развития PDAC по этим признакам.
Стандартные методы диагностики способны обнаружить около 10% случаев PDAC, а обе модели Prism, используемые совместно, — 35%.
📖 Исследовательская статья
🔥2
🤔А как вам такой алгоритм сортировки?
Перевод: «ждёт, пока космическая солнечная радиация не проманипулирует битами и отсортирует список»
➕Комментарий от пояснительной бригады:
Шутка основана на явлении single-event upset (SEU). Это изменение состояния электронного компонента, вызванное частицей ионизирующего излучения. Оно происходит из-за возникновения свободного заряда, который появляется в результате ионизации внутри или рядом с логическим элементом, таким как бит памяти.
#memes
Перевод: «ждёт, пока космическая солнечная радиация не проманипулирует битами и отсортирует список»
➕Комментарий от пояснительной бригады:
Шутка основана на явлении single-event upset (SEU). Это изменение состояния электронного компонента, вызванное частицей ионизирующего излучения. Оно происходит из-за возникновения свободного заряда, который появляется в результате ионизации внутри или рядом с логическим элементом, таким как бит памяти.
#memes
👍2
🧩🧠 Хотите узнать насколько хорошо вы знаете математику, чтобы начать заниматься Data Science?
Вот несколько не самых сложных задач, главное в которых — проверить математическую интуицию и смекалку. Все задачи снабжены пояснениями и ответами.
🔗 Пройти тест
Не расстраивайтесь если не сможете набрать максимальное колличество баллов. Чтобы подтянуть знания поможет наш курс Математика для Data Science.
👉 Начать можно с вводных занятий, чтобы познакомиться с преподавателями и форматом обучения.
На водных занятиях вас ждет:
– Лекции с преподавателями кафедры ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск.
– Практические задания для закрепления материала.
– Ссылки на дополнительные материалы.
⚡️Переходите и активируйте – https://proglib.io/w/8bdc6caf
Вот несколько не самых сложных задач, главное в которых — проверить математическую интуицию и смекалку. Все задачи снабжены пояснениями и ответами.
🔗 Пройти тест
Не расстраивайтесь если не сможете набрать максимальное колличество баллов. Чтобы подтянуть знания поможет наш курс Математика для Data Science.
👉 Начать можно с вводных занятий, чтобы познакомиться с преподавателями и форматом обучения.
На водных занятиях вас ждет:
– Лекции с преподавателями кафедры ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск.
– Практические задания для закрепления материала.
– Ссылки на дополнительные материалы.
⚡️Переходите и активируйте – https://proglib.io/w/8bdc6caf
This media is not supported in your browser
VIEW IN TELEGRAM
А пока вы предвкушаете начала выходных, можете поделится в комментариях вашим любимым мемом за последнее время
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3😁1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Новый #дайджест статей по машинному обучению и работе с данными
🤖 Запускаем локальный ML-процесс в облаке с помощью DataSphere Jobs
В сервисе DataSphere можно удалённо запускать задания (jobs) — вычисления на ВМ DataSphere за пределами JupyterLab.
🤖 Как мы с помощью ML вылечили проблему, не дававшую перейти на автомаршрутизацию курьеров
Интересная статья от компании CDEK, рассказывающая о решении следующей задачи: определить, на какой маршрут поставить конкретный заказ до того, как появился сам маршрут.
🤖 Who's Harry Potter? Approximate Unlearning in LLMs
Авторы пытались заставить модель Llama2-7b «забыть» «Гарри Поттера».
🤖 Hadoop в Облаке: история миграции сотен петабайт
Рассказ от руководителя Data Platform в ОК о переносе Hadoop с Bare Metal в облако.
🤖 Open-source LLMs as LangChain Agents
Статья рассказывает о том, что такое LLM-агенты и как их интегрировать в системы с использованием LangChain.
🤖 Запускаем локальный ML-процесс в облаке с помощью DataSphere Jobs
В сервисе DataSphere можно удалённо запускать задания (jobs) — вычисления на ВМ DataSphere за пределами JupyterLab.
🤖 Как мы с помощью ML вылечили проблему, не дававшую перейти на автомаршрутизацию курьеров
Интересная статья от компании CDEK, рассказывающая о решении следующей задачи: определить, на какой маршрут поставить конкретный заказ до того, как появился сам маршрут.
🤖 Who's Harry Potter? Approximate Unlearning in LLMs
Авторы пытались заставить модель Llama2-7b «забыть» «Гарри Поттера».
🤖 Hadoop в Облаке: история миграции сотен петабайт
Рассказ от руководителя Data Platform в ОК о переносе Hadoop с Bare Metal в облако.
🤖 Open-source LLMs as LangChain Agents
Статья рассказывает о том, что такое LLM-агенты и как их интегрировать в системы с использованием LangChain.
👍2
Forwarded from Библиотека программиста | программирование, кодинг, разработка
📌 Git flow — стратегия ветвления, полезная для команд, у которых есть четкие процессы выпуска и необходимость поддерживать стабильность своих продакшн-окружений.
Однако зависимость от множества веток и правил добавляет много сложности к процессу. Это может быть непосильно для новых членов команды и может привести к конфликтам из-за несоблюдения принципов непрерывной интеграции.
📌 GitHub flow — легковесная стратегия ветвления, хорошо подходящая для команд, практикующих непрерывный деплой. Эта стратегия подчеркивает совместную работу, частые выпуски и упрощенный процесс разработки.
Учитывая ее простоту, GitHub flow лучше всего подходит для небольших команд и проектов. Однако по мере увеличения размера и сложности становится сложно управлять изменениями во всей кодовой базе.
📌 Trunk-based development — стратегия ветвления, при которой разработчики работают над кодом в одной ветке, называемой
trunk
. Она требует прямых пушей в trunk
и совместной работы разработчиков для поддержания стабильной ветки trunk
. Поскольку изменения непрерывно интегрируются в
trunk
, существует более высокий риск внесения изменений, которые могут повлиять на стабильность всей системы.📌 Space Git flow — стратегия ветвления от JetBrains, похожая на GitHub flow, но с бо́льшим акцентом на безопасность при внесении изменений в ветку
main
и возможностью масштабирования до крупных проектов и команд. 💬 Каждая стратегия имеет свои сильные и слабые стороны, и лучший выбор зависит от конкретных потребностей вашей команды, а также таких факторов, как размер команды, процесс разработки, частота деплоя и требования к качеству кода.
👉 Подробнее здесь и здесь
#советыдляразрабов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🦢Теорема о гадком утёнке
Эта теорема показывает, что классификация невозможна без некоторой степени предубеждения (bias). Допустим, у нас есть n объектов. Всего существует 2^n способов составить подмножества из этой выборки. Без каких-либо дополнительных условий каждый объект будет сгруппирован с каким-то объектом из выборки так же часто, как с любым другим объектом. Поэтому нужно выбрать некоторый вес для определённых свойств. То есть необходим bias (предубеждение), чтобы классификация приобрела смысл.
✔️ Теорема утверждает, что гадкий утёнок на самом деле настолько же близок к обычному птенцу лебедя, насколько два обычных птенца лебедя близки друг к другу (смотрите картинку выше). Всё зависит от bias.
Эта теорема показывает, что классификация невозможна без некоторой степени предубеждения (bias). Допустим, у нас есть n объектов. Всего существует 2^n способов составить подмножества из этой выборки. Без каких-либо дополнительных условий каждый объект будет сгруппирован с каким-то объектом из выборки так же часто, как с любым другим объектом. Поэтому нужно выбрать некоторый вес для определённых свойств. То есть необходим bias (предубеждение), чтобы классификация приобрела смысл.
✔️ Теорема утверждает, что гадкий утёнок на самом деле настолько же близок к обычному птенцу лебедя, насколько два обычных птенца лебедя близки друг к другу (смотрите картинку выше). Всё зависит от bias.
👍2
Ответьте на 3 вопроса, чтобы получить вводные занятия к курсу «Алгоритмы и структуры данных»
⚡️Получить занятия – https://proglib.io/w/18971db1
В вводной частичасти вас ждут:
1. Лекция «Производительность алгоритмов» от руководителя разработки Яндекс.Самокатов
2. Лекция «Итеративные сортировки и линейные сортировки» от аспирант департамента искусственного интеллекта ВШЭ
3. Практические задания после лекций
4. Ссылки на дополнительные материалы для самостоятельно изучения
Переходите и начинайте учиться уже сегодня!
⚡️Получить занятия – https://proglib.io/w/18971db1
В вводной частичасти вас ждут:
1. Лекция «Производительность алгоритмов» от руководителя разработки Яндекс.Самокатов
2. Лекция «Итеративные сортировки и линейные сортировки» от аспирант департамента искусственного интеллекта ВШЭ
3. Практические задания после лекций
4. Ссылки на дополнительные материалы для самостоятельно изучения
Переходите и начинайте учиться уже сегодня!
👍2🔥1
Forwarded from Библиотека питониста | Python, Django, Flask
🐍➰ Создаем игру «Виселица» на Python. Часть 2. Графический интерфейс на PySimpleGUI
В первой части мы написали код для получения и обработки вводимых игроком данных, создали некоторые компоненты и текстовый пользовательский интерфейс (TUI). Во второй части реализуем логику игры «Виселица» и создадим графический интерфейс с помощью PySimpleGUI.
🔗 Читать статью
В первой части мы написали код для получения и обработки вводимых игроком данных, создали некоторые компоненты и текстовый пользовательский интерфейс (TUI). Во второй части реализуем логику игры «Виселица» и создадим графический интерфейс с помощью PySimpleGUI.
🔗 Читать статью