Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.26K photos
115 videos
64 files
4.68K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
gemini_final_text_table_bigger_font_amendment_lines.gif
124.4 KB
Google представила свою крупнейшую ИИ-модель — Gemini

Модель является мультимодальной — может работать и с текстом, и с изображениями, и с видео, и с аудио.

Google заявляет, что Gemini превосходит людей-экспертов в задачах MMLU (Massive Multitask Language Understanding).

Доступна в трёх версиях: Ultra (самая большая для сложных задач), Pro и Nano. У последней есть нативная поддержка в смартфоне Pixel 8 Pro.

Google делает акцент на том, что Gemini может хорошо генерировать код на Python, Java, C++ и Go.

Google Bard начал использовать Gemini Pro. Доступность расширяется постепенно: Google обещает поддержку обновлённого чат-бота на английском языке в более чем 170 странах и территориях. В будущем появится и поддержка других языков.

👩‍💻С 13 декабря разработчики смогут получить доступ к Gemini Pro через Gemini API в Google AI Studio или Google Cloud Vertex AI.

🔗Читать о новинках подробнее в блоге Google
🔥8👍4🤔2
🍏«PyTorch для MacBook»: Apple выпустила собственный фреймворк для ML на Apple Silicon

MLX должен быть прост в использовании, если вы уже знакомы с самыми популярными библиотеками для машинного обучения. Вот основные особенности фреймворка:

▫️Под капотом Python API и интерфейсы, похожие на PyTorch.
▫️Ленивые вычисления.
▫️Унифицированная память, в которой хранятся массивы. Операции с ними могут выполняться на любом из поддерживаемых типов устройств без перемещения данных.
▫️Встроенные функции для автоматического дифференцирования, автоматической векторизации и оптимизации вычислительного графа.

👩‍💻Репозиторий MLX на GitHub
6👏2🤯1
💬Итак, настало время узнать: PyTorch или TensorFlow

Есть мнение, что единственная причина использовать TensorFlow — вас заставили это делать. Но вдруг у вас другая точка зрения? Расскажите, чем пользуетесь чаще, что больше по душе.

❤️ — PyTorch
👍 — TensorFlow

Пишите свои соображения в комментарии👇

#интерактив
84👍21🤯3
✏️Очередная хитрость по работе с LLM

Исследователи продолжают изучать поведение собственных больших языковых моделей. На этот раз создатели Claude 2.1 из Anthropic выяснили, что достаточно добавить в промпт одну фразу, чтобы повысить качество ответа с 27% до 98%.

Дело в том, что модель может неохотно давать ответы на базе отдельных предложений в документе, особенно если эти предложения как-то искажены или неуместны. Это следствие того, что Claude 2.1 специально обучили не генерировать недостаточно аргументированные ответы. Поэтому, чтобы исправить такое поведение, нужно добавить в промпт следующее:

✍️«Assistant: Here is the most relevant sentence in the context:» («Ассистент: Вот самое релевантное предложение из контекста:»)
👍12
⚡️Свершилось: канал с книгами только по Data Science

Мы создали для вас канал, куда будем публиковать самые полезные книги только для специалистов по Data Science. Подписывайтесь!

👉Книги для дата сайентистов | Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍4
💌 Сегодня пятница, а значит вы можете подписаться и получить завтра свежий выпуск еженедельной email-рассылки про ИИ

Там мы рассказали:
Как исследователи обнаружили любопытный парадокс, касающийся восприятия людьми сгенерированных ИИ материалов.
Какие новые ИИ-инструменты появились у Google.

А ещё составили список интересных сервисов:
🎄Santa Cat — ИИ-кот, готовый поддержать беседу на любую тему.
🎒Jagoda — личный репетитор по 30+ школьным предметам.
📷Magnific AI — повышает разрешение размытых низкокачественных изображений.

📖 Помимо этого, мы подобрали бесплатные ресурсы для изучения машинного обучения. Например, 12-недельную программу ML-For-Beginners для новичков от Microsoft.

В тексте поста — только часть содержания рассылки, а если хотите всё, то подписывайтесь

#ИИproglib
2🥰1
Forwarded from Библиотека программиста | программирование, кодинг, разработка
📯Внимание всем отважным героям и искателям приключений!

«Библиотеки Программиста» с гордостью представляет новую захватывающую игру — «Битва с Драконом». Выберите своих персонажей и сразитесь с древним Крылатым Ужасом Бурлопиворогом в эпическом поединке!

Мы предлагаем вам взять под свой контроль хитроумного изобретателя или ловкого вора.

💎Победителей ждет почет, уважение и награда! Итак, кто осмелится бросить вызов Бурлопиворогу? Начните свою «Битву с Драконом»!
2👍2
cheatsheets.pdf
2.8 MB
📈Отличная шпаргалка по библитеке Matplotlib

Что в ней есть:
▫️разные типы графиков,
▫️элементы оформления графиков,
▫️названия всех доступных цветов,
▫️параметры текста,
▫️советы по улучшению производительности.

🔗По этой ссылке находится веб-версия шпаргалки
🔥12
🐍 5 задач для подготовки к собеседованию по Python

В нашей новой подборке задачи про составление анонимного письма, гипотезу Коллатца, судоку, разработку кэша для операций над ISBN и вычисление интервалов занятости. Можно попробовать сначала решить их самостоятельно, а затем прочесть нашу статью с подробным объяснением и кодом.

🔗Читать статью
👍4👾2
😈 Скандалы и интриги в ИИ-отрасли

🍿На днях Google представила свою мультимодальную модель Gemini и выпустила ролик, демонстрирующий её возможности. Там модели предъявляли разные видеозаписи и просили рассказать, что она «видит». Многие сразу отметили, что «это выглядит слишком хорошо, чтобы быть правдой».

Как оказалось, они были правы. Во-первых, Google ещё в описании видео указала, что ускорила ответы Gemini. Во-вторых, и вовсе призналась позже, что модель не давала ответы непосредственно на голос и видеоролики. Gemini лишь показывали кадры, сопровождаемые промптом. Например, ИИ предъявили изображение резиновой утки и спросили, из какого материала она сделана, добавив в текстовый запрос информацию о том, что игрушка издаёт характерный звук при сжатии.

🍿Другой скандал разворачивается вокруг твиттерского ИИ-ассистента Grok от Илона Маска. Один из пользователей опубликовал скриншот ответа модели, в котором она не удовлетворяет запрос, ссылаясь на политику OpenAI. Многие решили, что для Grok просто скопировали кодовую базу ChatGPT. Как заявили создатели ассистента, это всё произошло из-за того, что в интернете полно сгенерированного главным чат-ботом контента.
😁8👍32🎉1
Forwarded from Книги для дата сайентистов | Data Science
📚Data Science from Scratch: First Principles with Python, Second Edition (2019)

✍️Автор: Joel GrusPerry S.D.George B. Thomas Jr.

📃Страниц: 406

Если у вас есть способности к математике и некоторые навыки программирования, автор Джоэл Грас поможет вам освоиться с основами науки о данных, а также со специальными навыками, необходимыми для начала работы в качестве специалиста по дата сайнсу. С помощью этого обновленного издания вы узнаете, как работают многие из инструментов и алгоритмов data science

Что внутри:
🔸Пройдите ускоренный курс по Python
🔸Изучите основы линейной алгебры, статистики и теории вероятностей, а также то, как и когда они используются в науке о данных
🔸Собирайте, исследуйте, очищайте данные, управляйте ими и манипулируйте ими
🔸Погрузитесь в основы машинного обучения

Ссылка на книгу
👍7
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
3
🇪🇺Согласован Европейский The AI Act

Это первое соглашение Евросоюза по регулированию искусственного интеллекта. Скоро будет принят и общеевропейский закон.

Европейские чиновники договорились, что ИИ никогда не должен применяться для:
▪️биометрических систем классификации, использующих чувствительные характеристики (раса, сексуальная ориентация и так далее);
▪️сбора изображений лиц из интернета или с камер видеонаблюдения;
▪️распознавания эмоций на рабочих или учебных местах;
▪️системы социального рейтинга;
▪️систем, манипулирующих человеческим поведением;
▪️систем, использующих уязвимости людей (ввиду их возраста или социального статуса).

Использование технологии удалённой биометрической идентификации в общественных местах правоохранительными органами не было полностью запрещено, но парламент решил это ограничить.

👩‍💻Также чиновники ввели такое понятие как высокорисковая ИИ-система. Такие системы могут нанести «значительный потенциальный вред здоровью, безопасности, основным правам, окружающей среде, демократии и верховенству закона». Подобные GPT модели были определены как «общие». Их регулирование тоже будет усилено.
👍4🤔43