Яндекс

ВНИМАНИЕ 🛑 Yже сеrодня эти технологии 3ащитят вашу п0чту от спама❗️

С начала года сервис Яндекс 360 отправил в спам почти восемь миллиардов писем, а ещё более пяти миллиардов оказались потенциально опасными для пользователя и были заблокированы.

Распознавать такие письма помогают алгоритмы Спамообороны, защитной системы в Почте Яндекса, которая для каждого письма вычисляет более 600 параметров и использует более 20 источников данных. А что это за параметры и как работают алгоритмы — читайте в карточках.

Подписывайтесь 👉 @yandex

51.2K views08:04

Яндекс

Галлюцинирование 🌀
что это за проблема и как с ней борются в Яндексе.

Галлюцинациями называют ответы больших языковых моделей (LLM), которые звучат правдиво, но на самом деле являются ошибочными. Простой пример — вы спрашиваете у чат-бота, кто написал «Женитьбу Бальзаминова», а он отвечает — Антон Чехов (на самом деле Александр Островский).

Основные причины галлюцинаций — недостаток знаний и принцип работы языковой модели. При обучении она учится предсказывать вероятное продолжение на основе предыдущих слов. Если модель не выучила какой-то факт, например того же автора «Женитьбы», то предскажет другое имя или другого писателя, ведь это более вероятное продолжение, чем, например, «эту книгу написала собака».

Этот феномен не изучен до конца, поэтому применяются разные способы решить проблему. Во время создания YandexGPT 2 мы поработали со знаниями модели, сильно улучшив её претрейн. Во-первых, стали тщательнее отбирать данные, во-вторых, проверять, как они влияют на тестовую модель, и только потом «вливать» их в основную. В будущем планируем использовать ещё и обучение с подкреплением.

Подписывайтесь 👉 @yandex

54.1K views15:21

Яндекс

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

Забежали сказать, что у нас день рождения!

Спасибо, что вы с нами! Дальше — больше! 🎉

58.6K views07:58

«ИИ отнимет нашу работу?» 🤔

Запускаем мини-сериал, в котором ответим на популярные вопросы и распространённые заблуждения об искусственном интеллекте и новых технологиях.

В первом выпуске — вопрос, который волнует, кажется, вообще всех.

Подписывайтесь 👉 @yandex

420.4K views13:22

Яндекс

Открыли исходный код ☁️ нашего инструмента для визуализации данных

Команда Yandex Cloud запустила DataLens в 2019 году. Его уже используют, чтобы анализировать ключевые бизнес-метрики и визуализировать большое количество данных в Hoff, М.Видео, Ренессанс Страховании и Яндексе. О том, как разработчики работают с визуализациями, рассказываем в карточках.

🔗 Исходный код DataLens открыт и выложен на GitHub.

💭 А если посмотрите выпуск yet another podcast про опенсорс, то сможете легко разобраться в том, зачем мы и другие технологические компании выкладывают свои продукты в открытый доступ.

Подписывайтесь 👉 @yandex

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

70.6K views08:05

Яндекс

«Огонь», «отвратительно», «супер» 🔥🤢👍 Как ругают и хвалят заведения в Яндекс Картах

Мы изучили тексты отзывов на рестораны, кофейни, пиццерии и другие заведения в Яндекс Картах — а таких отзывов, между прочим, больше 15 миллионов, — и теперь рассказываем, что интересного нам удалось выяснить. Подробнее об этом узнаете в нашем большом исследовании.

Подписывайтесь 👉 @yandex

47.1K views11:44

About

Blog

Apps

Platform