Big Data AI
16.8K subscribers
819 photos
97 videos
19 files
822 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
Complete-Data-Analytics-with-Projects

В этом репозитории собрано все, что вам нужно, чтобы стать экспертом в #DataAnalytics 45 готовых проектов.

https://github.com/Coder-World04/Complete-Data-Analytics-with-Projects

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥41
Pandas_cheatsheet.pdf
2.7 MB
🐼Шпаргалка по основным методам Pandas с примерами кода и описанием

#doc #pandas

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥3👍2
From SQL to Pandas 50.pdf
2.4 MB
Крутая и полезная шпаргалка с методами и примерами кода

@bigdatai
👍82🔥2
Библиотека Python с открытым исходным кодом для автоматизации рабочих процессов машинного обучения🔥

PyCaret - сквозной инструмент для машинного обучения:

- Предварительная обработка данных
- Разработка признаков
- Обучение модели
- Настройка гиперпараметров и
- Оценка модели

"pip install pycaret"

Github

@bigdatai
👍19🔥61👏1
Как создать на Python скринер акций и выполнить анализ настроений на основе ИИ

Поиск акций для инвестирования может оказаться долгим и утомительным. А что, если использовать ИИ и Python для создания программы, способной ускорить этот процесс? В этой статье я расскажу, как применить Python-библиотеку finvizfinance для поиска “недооцененных” акций. Затем представлю метод анализа настроений с помощью FinBERT, предварительно обученной NLP-модели, позволяющей анализировать эти “недооцененные” акции.

Первые шаги
Прежде всего импортируем необходимые библиотеки. Сайт finviz.com предлагает различные инструменты для анализа акций, в том числе бесплатный скринер акций (Screener). Импортируем объект скринера finvizfinance, который возвращает DataFrame Pandas с результатами скрининга в разделе “Overview” (“Обзор”).

from finvizfinance.screener.overview import Overview

Теперь импортируем библиотеки Pandas, csv и os, которые используются в основном для работы с csv-файлами.

import pandas as pd
import csv
import os


Скрининг потенциальных акций
Теперь, следуя подходу стоимостного инвестирования, необходимо составить список потенциально недооцененных акций, к которым стоит присмотреться. Для этого надо создать функцию, которая использует библиотеку finvizfinance для отправки запроса к онлайн-скринеру акций. Вот функция, которая будет выполнять это:

📌 Читать

@bigdatai
👍124🔥4
🔥 Гайд: пишем Transformer с нуля

Интерсный Jupyter-блокнот, в котором пошагово описан процесс создания собственной модели Transformer. Каждый блок кода сопровождается подробным комментарием.

Гайд начинается с предобработки текста и заканчивает полной сборкой работающей архитектуры. За основу он взял классическую статью Attention Is All You Need и видео Андрея Карпаты Let's build GPT: from scratch, in code, spelled out.

https://blog.matdmiller.com/posts/2023-06-10_transformers/notebook.html

@bigdatai
👍17🔥32
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Ego-Exo4D: A diverse, large-scale multi-modal, multi-view, video dataset and benchmark.

Ego-Exo4D:, крупномасштабный датасет для обучения на видел.


Проект помочь качественному обучению моделей ИИ сложными человеческими навыками и подойдет для создания приложений систем виртуальной реальности, робототехники, и многого другого.

Ego-Exo4D содержит три, тщательно синхронизированных датасета естественного языка в сочетании с видео и комментариями экспертов, включают в себя более 1400 часов видео, а также аннотации для бенчмарков.
.

Project: ego-exo4d-data.org/
Request acess: https://docs.ego-exo4d-data.org/getting-started/

@bigdatai
👍62🔥1
🖥 SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 1.

Читать

#junior

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍5🔥3
⚡️ InternLM / InternLM-XComposer

InternLM-XComposer2 - это новаторская большая модель языка зрения (VLLM), позволяющая составлять и понимать текст-изображение в свободной форме.

Github
Demo

@bigdatai
7👍2🔥1
📚 Aya: Большой датасет с открытым доступом для настройки многоязычных моделей.

- База данных по инструкциям, охватывающая 65 языков.
- Самая обширная многоязычная коллекция на сегодняшний день.

https://arxiv.org/abs/2402.06619

@bigdatai
👍11🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
Nvidia выпустила Chat with RTX - чатбота с искусственным интеллектом, который работает локально на вашем компьютере.

Он может обобщать или искать документы в файлах вашего ПК и даже видео и плейлисты YouTube.

Чатбот работает локально, что означает быстрое получение результатов и возможность использования бота без интернета.

https://www.nvidia.com/en-us/ai-on-rtx/chat-with-rtx-generative-ai/

@bigdatai
🔥8👍62
This media is not supported in your browser
VIEW IN TELEGRAM
📕 Экономим время на чтении научных статей 

SciSummary — это полезная нейросеть, которая не только способна создать краткое резюме любой научной статьи, но и постарается сделать это простыми для понимания словами.

Кроме того, есть возможность выбрать русский язык для резюме и получить пояснения по непонятным терминам прямо в чате этого инструмента.

https://scisummary.com/

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍53
📊 Matplotlib Panel

Панель Matplotlib позволяет отображать графики Matplotlib в приложении Panel.В том числе фигуры, созданные Seaborn, Pandas .plot, Plotnine и любой другой библиотекой для построенной графиков поверх Matplotlib.

Панель Matplotlib отрендерит объект в PNG или SVG при заявленном DPI и затем отобразит его.

В этом руководстве приведены примеры с кодом по работе с панелью.

https://panel.holoviz.org/reference/panes/Matplotlib.html

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
👉 Введение в машинное обучение

Бесплатные курсы, которые служит введением в машинное обучение и охватывает основные понятия.

Github

@bigdatai
🔥6👍32🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Depth Anything

Эта нейросеть анализирует сцену и определяет глубину каждого пикселя, что открывает новые горизонты для автономного вождения, робототехники, дополненной реальности и многого другого. Загружайте изображения по одному или пакетом, экспортируйте прямо в свой проект.

https://github.com/LiheYoung/Depth-Anything

@bigdatai
👍6🔥42
💫 Не только NVIDIA: Программирование на GPU, которое работает везде

Если вы хотите запускать GPU-программы в CI, на Mac и т.д., wgu-py - отличный вариант.

https://pythonspeed.com/articles/gpu-without-cuda/

@bigdatai
👍11🔥52
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Advances in private training for production on-device language models

Языковые модели, предсказывающие следующее слово, являются ключевой технологией для многих ИИ приложений. Узнайте, как многолетние исследования стали основой обучения языковых моделей Google

Статья

@bigdatai
👍8🔥1🥰1
👉 Awesome AWS

Кураторский Список библиотек Amazon Web Services (AWS), репозиториев с открытым исходным кодом, руководств, блогов и других ресурсов.

🔗 https://github.com/donnemartin/awesome-aws

@bigdatai
3👍3🔥1
⚡️ Шпаргалка по ML

Нереальной полезности пост — ловите Cheatsheet по Machine Learning, тут разобраны самые основные понятия и даже больше:
❯ метод понижения размерности PCA
❯ ложноположительные, ложноотрицательные ошибки
❯ наивный Байесовский классификатор
❯ регрессионный анализ
❯ регуляризация
❯ архитектура, устройство, известные реализации нейронных сетей CNN
❯ базовые структуры данных: массив, связный список, стек, очередь, хеш-таблица, дерево

Поможет без проблем подготовиться к собесу и освежить знания

📁 PDF

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥31😁1