AI на дровах 🪵
238 subscribers
77 photos
19 videos
1 file
131 links
Привет! Меня зовут Семён, я работаю в сфере ML и аналитики данных, пишу в блог nerdit.ru статьи о своем опыте и том, что может пригодиться начинающим в начале их пути изучения больших данных.

👾HSE ML Unit Head⚡️
❤️Litres DS Team
Download Telegram
Forwarded from Рестарт
«Мстители» в XIX веке — новое творение Джимми Нейрона с помощью нейросетей.

Посмотрите, как эпично выглядит Халк, это просто магия старинных нейрофотографий.
Forwarded from Рестарт
This media is not supported in your browser
VIEW IN TELEGRAM
Что почитать на выходных: прикольная интерактивная визуализация того, как устроены нейросети.

Самое то для тех, кто интересуется архитектурой нейронок.
Forwarded from TechSparks
Ну и сегодняшняя наша яндексовая новость: все желающие поиграть с генеративными языковыми моделями, но без плясок с ботами, VPN и вообще не заморачиваясь, могут поговорить в таком режиме с Алисой:) С сегодняшнего дня в ответ на фразу "Алиса, давай придумаем" запускается простейшая версия YaGPT (пока без памяти контекста, просто однократная генерация) -- и на лету генерится придумка по запросу:) Пока это скорее игрушка, но для первого знакомства широкой публики -- в самый раз. Дальше будет больше, много больше, и очень скоро:))
https://t.iss.one/yandex/1272
1
В итоге сервис отжима воды из публикаций много куда будет интегрирован, но пользоваться им можно уже сейчас (хотя наружу его открыли только что, так что это публичная бета, а не готовый отлаженный продукт). Интерфейс и функционал предельно просты: даешь ссылку на статью, получаешь выжимку (в идеале потом ее качество оцениваешь, чтобы дообучить алгоритм).
Если сервис подвис (на то и бета, с ним бывает) — просто перегрузить страницу:)
На мой взгляд, сильно полезнее многих генеративных штучек, когда приходится много текстов проглядывать.
https://300.ya.ru
Привет всем! Если вы хотите начать изучать Data Science, но не знаете, с чего начать, то этот пост для вас.

Data Science - это область науки, которая занимается анализом данных и использованием этих данных для принятия решений в бизнесе, науке и других областях. Чтобы начать изучать Data Science, нужно иметь базовые знания в математике, статистике и программировании.

Если вы уже знакомы с этими областями, то можете начать с изучения языков программирования, таких как Python или R. Эти языки широко используются в Data Science и позволяют обрабатывать большие объемы данных.

Также важно понимать, что Data Science - это постоянно развивающаяся область, и новые методы и технологии появляются каждый день. Поэтому важно следить за новостями и обновлениями в этой области.

Не бойтесь экспериментировать и учиться на своих ошибках. Data Science - это процесс, который требует постоянного обучения и развития.

А если у вас возникнут вопросы или нужна помощь в изучении Data Science, то не стесняйтесь обращаться к специалистам в этой области или к сообществу Data Scientists. Вместе мы сможем достичь больших результатов!
В чем разница между машинным обучением с учителем и без учителя?

Для обучения с учителем требуются данные, помеченные для обучения. Например, чтобы провести классификацию (задача обучения с учителем), вам нужно сначала пометить данные, которые вы будете использовать для обучения модели, для классификации данных по помеченным группам; в то же время обучение без учителя не требует явной маркировки данных.
#вопросы_с_собеседований
❤‍🔥63😴32👎2🥴2😐1🍓1🍾1👨‍💻1🤝1
Искусственный интеллект (ИИ) — это область компьютерных наук, которая занимается созданием интеллектуальных машин, способных выполнять задачи, обычно требующие человеческого интеллекта. К ним относятся распознавание речи, обработка естественного языка, компьютерное зрение, робототехника, игра в шахматы и многое другое. Искусственный интеллект может быть применен в различных областях, таких как медицина, финансы, транспорт и т. д.

Основные методы машинного обучения:

1. Обучение с учителем — это метод, при котором машина обучения получает набор данных с известными ответами. Затем она использует эти данные для обучения и создания модели, которая может предсказать ответы на новые данные.

2. Обучение без учителя — это метод, который не требует наличия известных ответов. Он используется для поиска закономерностей в данных.

3. Обучение по подкреплению — это метод, основанный на принципе вознаграждения и наказания. Машина обучения получает вознаграждение за правильное решение задачи и наказание за неправильное решение.

4. Рекуррентное обучение — это метод, используемый для обработки последовательностей данных. Он позволяет учитывать информацию о предыдущих элементах последовательности при принятии решения.

5. Глубокое обучение — это метод машинного обучения, который использует нейронные сети с большим количеством слоев. Он позволяет создавать более сложные модели.
🤡1😭1😨1
Если вы хотите начать изучать Python, то вам нужно начать с базовых понятий языка программирования. Вот несколько советов, с которых можно начать:

1. Изучите основы программирования: начните с изучения основных конструкций языка, таких как переменные, условия, циклы и функции.

2. Изучите базовые библиотеки Python: Python имеет множество библиотек, которые позволяют ускорить процесс разработки и упростить работу с данными. Например, библиотека NumPy используется для работы с массивами и матрицами, библиотека Pandas для работы с табличными данными, библиотека Matplotlib для построения графиков и диаграмм.

3. Практикуйтесь: начните писать небольшие программы и проекты, чтобы закрепить полученные знания. Это поможет вам лучше понять, как работает Python и как использовать его для решения реальных задач.

4. Изучайте документацию: Python имеет отличную документацию, которая поможет вам разобраться в тонкостях языка и его библиотек.

5. Присоединяйтесь к сообществу Python: существует множество сообществ Python, где вы можете задавать вопросы, получать помощь и делиться своими проектами.

6. Используйте онлайн-курсы и ресурсы: существует множество онлайн-курсов и ресурсов, которые помогут вам изучить Python. Некоторые из них бесплатны, а другие требуют оплаты.

7. Не бойтесь экспериментировать: Python позволяет экспериментировать и создавать свои собственные библиотеки и инструменты. Это поможет вам стать более гибким и творческим в работе с языком.
💋1
Протоколы в Python

В Python 3.8. появилась новая примечательная возможность — протоколы (protocols). Протоколы — это альтернатива абстрактным базовым классам (abstract base classes, ABC). Они позволяют пользоваться структурной подтипизацией (structural subtyping), то есть — осуществлять проверку совместимости классов исключительно на основе анализа их атрибутов и методов.

Смотреть статью
🤔1
Секреты создания качественных ML-систем

Серия из двух статей про планирование, документацию и жизненный цикл ML-проекта, Data-centric ИИ, данные для обучения, Data Engineering и ETL. Как и зачем определять ценность для бизнеса, собирать требования и трезво оценивать, действительно ли в данном случае нужно именно машинное обучение.

Читать первую часть
Читать вторую часть
🎃4👎3🥱3😴3🤝3😱2🙏2😍2💋2🔥1🥴1
LangСhain: создаем свой AI в несколько строк
• LangChain - перспективный фреймворк для работы с языковыми моделями.
• LangChain позволяет собрать различные компоненты для создания ChatGPT.
• Модели: универсальный интерфейс для работы с языковыми моделями, поддержка API OpenAI, Cohere, Hugging Face и других.
• Промпты: функции для работы с промптами, представление промпта согласно типу модели, формирование шаблона на основе внешних данных, форматирование вывода модели.
• Индексы: структурируют документы для оптимального взаимодействия с языковыми моделями, поддержка индексов на основе векторных баз данных.
• Цепочки: объединение разных языковых моделей и запросов в многоступенчатые конвееры, применение для разговоров, ответов на вопросы, суммаризации и других сценариев.
• Агенты: доступ модели к различным источникам информации, таким как Google, Wikipedia и т.д.
• Память: сохранение состояний в цепочках, например, для создания чат-бота, сохранение предыдущих вопросов и ответов.

Документация: https://python.langchain.com/docs/get_started/introduction
Forwarded from AI для Всех (Artemii)
Новый курс: создание диалоговых агентов на основе LangChain

Компания LangChain (совершенно пропустил момент когда они стали компанией) выпустила бесплатный курс о последних достижениях в области языковых моделей и как их можно использовать для создания диалоговых агентов.

В курсе рассматриваются новые возможности, такие как вызов функций в ChatGPT. Также вводится новый синтаксис LangChain Expression Language для настройки поведения агентов.

Слушатели научатся:

- Генерировать структурированный вывод с помощью вызова функций
Использовать LCEL для настройки цепочек обработки запросов
- Применять вызовы функций для задач вроде тегирования данных
- Понимать маршрутизацию запросов с помощью инструментов LangChain

Курс рассчитан на 1 час и доступен бесплатно в течение ограниченного времени. Рекомендуется базовое знание Python и опыт написания промптов для языковых моделей.

Это отличная возможность изучить новейшие инструменты для создания приложений на основе ИИ и улучшить свои навыки в этой области!

🦜🔗 Курс
Forwarded from Не баг, а фича
This media is not supported in your browser
VIEW IN TELEGRAM
Плагин для VSCode пишет весь код локально на вашем ноутбуке. CodeGPT объяснит код, найдет баги, сделает тесты и напишет функции — всё это даже без интернета.

Есть поддержка разных языков программирования, а еще импорт библиотек и фреймворков. Можно взять с собой ноут куда угодно и кодить в паре с ИИ.

Плагин CodeGPT — тут.
Гайд по локальному запуску — тут.

@bugnotfeature
Forwarded from эйай ньюз
Я знаю, у вас мало времени, поэтому TLDR по OpenAI DevDay:

1️⃣ Релизнули ChatGPT-4-Turbo - ускоренную и более дешевую версию.
• Расширили контекст до 128к токенов (это ~300 страниц текста)
• Увеличили лимиты генерации токенов/сек.
• Каждый токен в промпте стал в 3x раза дешевле, а сгенерированные токены - в 2x раза дешевле по сравнению с ChatGPT-4
• База знаний ChatGPT-4-Turbo рсширилась до апреля 2023 (у ChatGPT-4 было до сентября 2021).
• Очень интересно уведеть бенчмарки, насколько пожертвовали качеством генерации у Turbo версии ради ускорения.

2️⃣ Запустили Assistants API - набор no-code инструментов для создания кастомных ботов-ассистентов на основе ChatGPT.
• Ассистенты могут писать и выполнять код, принимать на вход документы и PDF. Возможность грузить картинки добавят позже.
• Это убило много стартапов, которые строили свои продукты вокруг промптинга и предоставления доступа к кастомным агентам.

3️⃣Новые модальности (Vision & Audio):
Dalle-3 теперь доступна через API.
Релизнули модель для синтеза речи (TTS). Доступна через API.
Релиз Whisper-3 - более мощный speech-2-text. Уже в опен-соурсе на GitHub. А также через API.
• ChatGPT теперь может принимать картинки через API.

4️⃣ Анонсировали "GPTs" - возможность создания кастомных версий ChagGPT для разных целей и маркетплейс для них.
• Девелоперы могут продавать свои кастомизированные GPT на централизированном маркетплейсе и получать процентик от ревенью. Типа App Store для ботов.

5️⃣ Copyright Shield - защита от нарушения автораских прав для пользователей Enterprise плана и API. То есть если на пользователя подали в суд за нарешение авторских прав в результате генерации моделями OpenAI, то OpenAI впрягается за пользователя и оплавчивает все судебные издержки.

Видео-выжимка выступлений с основными моментами: тык (19 минут).

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
В нашем мире информационного изобилия мы часто сталкиваемся с проблемой перегрузки информацией. Статьи, книги, отчеты - все это требует нашего внимания и времени на прочтение.
Но что если бы вы могли получить краткое содержание любого текста, сохраняя при этом все ключевые моменты? Вот где на помощь приходит суммаризация текста - и это то, о чем мы сегодня поговорим.
https://nerdit.ru/maghiia-summarizatsii-tieksta/
#nlp #суммаризация #nltk
1
Рекомендательные системы - это мощный инструмент, который помогает нам справляться с информационным перегрузкой и находить интересующий нас контент. Они основаны на анализе наших предпочтений и поведения, предлагая нам наиболее подходящие варианты.
https://nerdit.ru/recommend-systems/
👍1