Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.26K photos
115 videos
64 files
4.68K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
✏️Очередная хитрость по работе с LLM

Исследователи продолжают изучать поведение собственных больших языковых моделей. На этот раз создатели Claude 2.1 из Anthropic выяснили, что достаточно добавить в промпт одну фразу, чтобы повысить качество ответа с 27% до 98%.

Дело в том, что модель может неохотно давать ответы на базе отдельных предложений в документе, особенно если эти предложения как-то искажены или неуместны. Это следствие того, что Claude 2.1 специально обучили не генерировать недостаточно аргументированные ответы. Поэтому, чтобы исправить такое поведение, нужно добавить в промпт следующее:

✍️«Assistant: Here is the most relevant sentence in the context:» («Ассистент: Вот самое релевантное предложение из контекста:»)
👍12
⚡️Свершилось: канал с книгами только по Data Science

Мы создали для вас канал, куда будем публиковать самые полезные книги только для специалистов по Data Science. Подписывайтесь!

👉Книги для дата сайентистов | Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍4
💌 Сегодня пятница, а значит вы можете подписаться и получить завтра свежий выпуск еженедельной email-рассылки про ИИ

Там мы рассказали:
Как исследователи обнаружили любопытный парадокс, касающийся восприятия людьми сгенерированных ИИ материалов.
Какие новые ИИ-инструменты появились у Google.

А ещё составили список интересных сервисов:
🎄Santa Cat — ИИ-кот, готовый поддержать беседу на любую тему.
🎒Jagoda — личный репетитор по 30+ школьным предметам.
📷Magnific AI — повышает разрешение размытых низкокачественных изображений.

📖 Помимо этого, мы подобрали бесплатные ресурсы для изучения машинного обучения. Например, 12-недельную программу ML-For-Beginners для новичков от Microsoft.

В тексте поста — только часть содержания рассылки, а если хотите всё, то подписывайтесь

#ИИproglib
2🥰1
Forwarded from Библиотека программиста | программирование, кодинг, разработка
📯Внимание всем отважным героям и искателям приключений!

«Библиотеки Программиста» с гордостью представляет новую захватывающую игру — «Битва с Драконом». Выберите своих персонажей и сразитесь с древним Крылатым Ужасом Бурлопиворогом в эпическом поединке!

Мы предлагаем вам взять под свой контроль хитроумного изобретателя или ловкого вора.

💎Победителей ждет почет, уважение и награда! Итак, кто осмелится бросить вызов Бурлопиворогу? Начните свою «Битву с Драконом»!
2👍2
cheatsheets.pdf
2.8 MB
📈Отличная шпаргалка по библитеке Matplotlib

Что в ней есть:
▫️разные типы графиков,
▫️элементы оформления графиков,
▫️названия всех доступных цветов,
▫️параметры текста,
▫️советы по улучшению производительности.

🔗По этой ссылке находится веб-версия шпаргалки
🔥12
🐍 5 задач для подготовки к собеседованию по Python

В нашей новой подборке задачи про составление анонимного письма, гипотезу Коллатца, судоку, разработку кэша для операций над ISBN и вычисление интервалов занятости. Можно попробовать сначала решить их самостоятельно, а затем прочесть нашу статью с подробным объяснением и кодом.

🔗Читать статью
👍4👾2
😈 Скандалы и интриги в ИИ-отрасли

🍿На днях Google представила свою мультимодальную модель Gemini и выпустила ролик, демонстрирующий её возможности. Там модели предъявляли разные видеозаписи и просили рассказать, что она «видит». Многие сразу отметили, что «это выглядит слишком хорошо, чтобы быть правдой».

Как оказалось, они были правы. Во-первых, Google ещё в описании видео указала, что ускорила ответы Gemini. Во-вторых, и вовсе призналась позже, что модель не давала ответы непосредственно на голос и видеоролики. Gemini лишь показывали кадры, сопровождаемые промптом. Например, ИИ предъявили изображение резиновой утки и спросили, из какого материала она сделана, добавив в текстовый запрос информацию о том, что игрушка издаёт характерный звук при сжатии.

🍿Другой скандал разворачивается вокруг твиттерского ИИ-ассистента Grok от Илона Маска. Один из пользователей опубликовал скриншот ответа модели, в котором она не удовлетворяет запрос, ссылаясь на политику OpenAI. Многие решили, что для Grok просто скопировали кодовую базу ChatGPT. Как заявили создатели ассистента, это всё произошло из-за того, что в интернете полно сгенерированного главным чат-ботом контента.
😁8👍32🎉1
Forwarded from Книги для дата сайентистов | Data Science
📚Data Science from Scratch: First Principles with Python, Second Edition (2019)

✍️Автор: Joel GrusPerry S.D.George B. Thomas Jr.

📃Страниц: 406

Если у вас есть способности к математике и некоторые навыки программирования, автор Джоэл Грас поможет вам освоиться с основами науки о данных, а также со специальными навыками, необходимыми для начала работы в качестве специалиста по дата сайнсу. С помощью этого обновленного издания вы узнаете, как работают многие из инструментов и алгоритмов data science

Что внутри:
🔸Пройдите ускоренный курс по Python
🔸Изучите основы линейной алгебры, статистики и теории вероятностей, а также то, как и когда они используются в науке о данных
🔸Собирайте, исследуйте, очищайте данные, управляйте ими и манипулируйте ими
🔸Погрузитесь в основы машинного обучения

Ссылка на книгу
👍7
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
3
🇪🇺Согласован Европейский The AI Act

Это первое соглашение Евросоюза по регулированию искусственного интеллекта. Скоро будет принят и общеевропейский закон.

Европейские чиновники договорились, что ИИ никогда не должен применяться для:
▪️биометрических систем классификации, использующих чувствительные характеристики (раса, сексуальная ориентация и так далее);
▪️сбора изображений лиц из интернета или с камер видеонаблюдения;
▪️распознавания эмоций на рабочих или учебных местах;
▪️системы социального рейтинга;
▪️систем, манипулирующих человеческим поведением;
▪️систем, использующих уязвимости людей (ввиду их возраста или социального статуса).

Использование технологии удалённой биометрической идентификации в общественных местах правоохранительными органами не было полностью запрещено, но парламент решил это ограничить.

👩‍💻Также чиновники ввели такое понятие как высокорисковая ИИ-система. Такие системы могут нанести «значительный потенциальный вред здоровью, безопасности, основным правам, окружающей среде, демократии и верховенству закона». Подобные GPT модели были определены как «общие». Их регулирование тоже будет усилено.
👍4🤔43
🏠А вы знали, что знаменитый датасет Boston housing prices удалили из scikit-learn?

Раньше можно было загрузить датасет одной строчкой sklearn.datasets.load_boston(). Начиная с версии scikit-learn 1.2 вызов этой функции приводит к ошибке.

Дело в том, что в датасете нашли этическую проблему. Оказалось, что авторы Boston housing prices сгенерировали новый признак B, учитывающий долю темнокожих по городам. Этот признак показывал, что расовая самосегрегация положительно влияет на цены на жильё.

Стоит отметить, что эти данные были собраны для исследования «Hedonic prices and the demand for clean air» («Гедонические цены и спрос на чистый воздух») 1978 года.

Команда scikit-learn настоятельно не рекомендует использовать этот набор данных, если только целью не является изучение этических проблем в data science и machine learning. Датасет всё ещё можно достать по прямой ссылке: https://lib.stat.cmu.edu/datasets/boston
😁33🤔9👍6👏2👾21🥰1