Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

✏️Очередная хитрость по работе с LLM

Исследователи продолжают изучать поведение собственных больших языковых моделей. На этот раз создатели Claude 2.1 из Anthropic выяснили, что достаточно добавить в промпт одну фразу, чтобы повысить качество ответа с 27% до 98%.

Дело в том, что модель может неохотно давать ответы на базе отдельных предложений в документе, особенно если эти предложения как-то искажены или неуместны. Это следствие того, что Claude 2.1 специально обучили не генерировать недостаточно аргументированные ответы. Поэтому, чтобы исправить такое поведение, нужно добавить в промпт следующее:

✍️«Assistant: Here is the most relevant sentence in the context:» («Ассистент: Вот самое релевантное предложение из контекста:»)

👍12

3K views07:23

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

⚡️Свершилось: канал с книгами только по Data Science

Мы создали для вас канал, куда будем публиковать самые полезные книги только для специалистов по Data Science. Подписывайтесь!

👉

Книги для дата сайентистов | Data Science

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5👍4❤1

65.1K views11:48

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

💌 Сегодня пятница, а значит вы можете подписаться и получить завтра свежий выпуск еженедельной email-рассылки про ИИ

Там мы рассказали:
⚡ Как исследователи обнаружили любопытный парадокс, касающийся восприятия людьми сгенерированных ИИ материалов.
⚡ Какие новые ИИ-инструменты появились у Google.

А ещё составили список интересных сервисов:
🎄Santa Cat — ИИ-кот, готовый поддержать беседу на любую тему.
🎒Jagoda — личный репетитор по 30+ школьным предметам.
📷Magnific AI — повышает разрешение размытых низкокачественных изображений.

📖 Помимо этого, мы подобрали бесплатные ресурсы для изучения машинного обучения. Например, 12-недельную программу ML-For-Beginners для новичков от Microsoft.

В тексте поста — только часть содержания рассылки, а если хотите всё, то подписывайтесь

#ИИproglib

❤2🥰1

2.64K views18:06

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека программиста | программирование, кодинг, разработка

📯Внимание всем отважным героям и искателям приключений!

«Библиотеки Программиста» с гордостью представляет новую захватывающую игру — «Битва с Драконом». Выберите своих персонажей и сразитесь с древним Крылатым Ужасом Бурлопиворогом в эпическом поединке!

Мы предлагаем вам взять под свой контроль хитроумного изобретателя или ловкого вора.

💎Победителей ждет почет, уважение и награда! Итак, кто осмелится бросить вызов Бурлопиворогу? Начните свою «Битву с Драконом»!

❤2👍2

2.29K views06:03

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

cheatsheets.pdf

2.8 MB

📈Отличная шпаргалка по библитеке Matplotlib

Что в ней есть:
▫️разные типы графиков,
▫️элементы оформления графиков,
▫️названия всех доступных цветов,
▫️параметры текста,
▫️советы по улучшению производительности.

🔗По этой ссылке находится веб-версия шпаргалки

🔥12

3.07K views09:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека питониста | Python, Django, Flask

🐍 5 задач для подготовки к собеседованию по Python

В нашей новой подборке задачи про составление анонимного письма, гипотезу Коллатца, судоку, разработку кэша для операций над ISBN и вычисление интервалов занятости. Можно попробовать сначала решить их самостоятельно, а затем прочесть нашу статью с подробным объяснением и кодом.

🔗Читать статью

👍4👾2

2.38K views18:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

😈 Скандалы и интриги в ИИ-отрасли

🍿На днях Google представила свою мультимодальную модель Gemini и выпустила ролик, демонстрирующий её возможности. Там модели предъявляли разные видеозаписи и просили рассказать, что она «видит». Многие сразу отметили, что «это выглядит слишком хорошо, чтобы быть правдой».

Как оказалось, они были правы. Во-первых, Google ещё в описании видео указала, что ускорила ответы Gemini. Во-вторых, и вовсе призналась позже, что модель не давала ответы непосредственно на голос и видеоролики. Gemini лишь показывали кадры, сопровождаемые промптом. Например, ИИ предъявили изображение резиновой утки и спросили, из какого материала она сделана, добавив в текстовый запрос информацию о том, что игрушка издаёт характерный звук при сжатии.

🍿Другой скандал разворачивается вокруг твиттерского ИИ-ассистента Grok от Илона Маска. Один из пользователей опубликовал скриншот ответа модели, в котором она не удовлетворяет запрос, ссылаясь на политику OpenAI. Многие решили, что для Grok просто скопировали кодовую базу ChatGPT. Как заявили создатели ассистента, это всё произошло из-за того, что в интернете полно сгенерированного главным чат-ботом контента.

😁8👍3❤2🎉1

2.65K viewsedited 07:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Книги для дата сайентистов | Data Science

📚Data Science from Scratch: First Principles with Python, Second Edition (2019)

✍️Автор: Joel GrusPerry S.D.George B. Thomas Jr.

📃Страниц: 406

Если у вас есть способности к математике и некоторые навыки программирования, автор Джоэл Грас поможет вам освоиться с основами науки о данных, а также со специальными навыками, необходимыми для начала работы в качестве специалиста по дата сайнсу. С помощью этого обновленного издания вы узнаете, как работают многие из инструментов и алгоритмов data science

Что внутри:
🔸Пройдите ускоренный курс по Python
🔸Изучите основы линейной алгебры, статистики и теории вероятностей, а также то, как и когда они используются в науке о данных
🔸Собирайте, исследуйте, очищайте данные, управляйте ими и манипулируйте ими
🔸Погрузитесь в основы машинного обучения

Ссылка на книгу

👍7

2.55K views18:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈

❤3

2.63K views06:04

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🇪🇺Согласован Европейский The AI Act

Это первое соглашение Евросоюза по регулированию искусственного интеллекта. Скоро будет принят и общеевропейский закон.

Европейские чиновники договорились, что ИИ никогда не должен применяться для:
▪️биометрических систем классификации, использующих чувствительные характеристики (раса, сексуальная ориентация и так далее);
▪️сбора изображений лиц из интернета или с камер видеонаблюдения;
▪️распознавания эмоций на рабочих или учебных местах;
▪️системы социального рейтинга;
▪️систем, манипулирующих человеческим поведением;
▪️систем, использующих уязвимости людей (ввиду их возраста или социального статуса).

Использование технологии удалённой биометрической идентификации в общественных местах правоохранительными органами не было полностью запрещено, но парламент решил это ограничить.

👩‍💻Также чиновники ввели такое понятие как высокорисковая ИИ-система. Такие системы могут нанести «значительный потенциальный вред здоровью, безопасности, основным правам, окружающей среде, демократии и верховенству закона». Подобные GPT модели были определены как «общие». Их регулирование тоже будет усилено.

👍4🤔4❤3

3.01K views07:15

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Продолжаем наш опрос — вторая часть👇

Продолжаем наш опрос — последняя, третья часть👇

❤1

2.52K views14:28

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

На каком языке программирования вы пишете больше всего?

Anonymous Poll

566 voters2.55K views14:29

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Какая ваша специализация в IT?

Anonymous Poll

529 voters2.6K views14:30

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Какой грейд у вас на работе?

Anonymous Poll

646 voters2.73K views14:30

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🏠А вы знали, что знаменитый датасет Boston housing prices удалили из scikit-learn?

Раньше можно было загрузить датасет одной строчкой sklearn.datasets.load_boston(). Начиная с версии scikit-learn 1.2 вызов этой функции приводит к ошибке.

Дело в том, что в датасете нашли этическую проблему. Оказалось, что авторы Boston housing prices сгенерировали новый признак B, учитывающий долю темнокожих по городам. Этот признак показывал, что расовая самосегрегация положительно влияет на цены на жильё.

Стоит отметить, что эти данные были собраны для исследования «Hedonic prices and the demand for clean air» («Гедонические цены и спрос на чистый воздух») 1978 года.

Команда scikit-learn настоятельно не рекомендует использовать этот набор данных, если только целью не является изучение этических проблем в data science и machine learning. Датасет всё ещё можно достать по прямой ссылке: https://lib.stat.cmu.edu/datasets/boston

😁33🤔9👍6👏2👾2❤1🥰1

3.36K views18:01

About

Blog

Apps

Platform