Яндекс
178K subscribers
1.22K photos
428 videos
1 file
1.2K links
Технологии будущего и сервисы, которые делают жизнь лучше уже сегодня

ya.ru
Download Telegram
ВНИМАНИЕ 🛑 Yже сеrодня эти технологии 3ащитят вашу п0чту от спама❗️

С начала года сервис Яндекс 360 отправил в спам почти восемь миллиардов писем, а ещё более пяти миллиардов оказались потенциально опасными для пользователя и были заблокированы.

Распознавать такие письма помогают алгоритмы Спамообороны, защитной системы в Почте Яндекса, которая для каждого письма вычисляет более 600 параметров и использует более 20 источников данных. А что это за параметры и как работают алгоритмы — читайте в карточках.

Подписывайтесь 👉 @yandex
Галлюцинирование 🌀
что это за проблема и как с ней борются в Яндексе.

Галлюцинациями называют ответы больших языковых моделей (LLM), которые звучат правдиво, но на самом деле являются ошибочными. Простой пример — вы спрашиваете у чат-бота, кто написал «Женитьбу Бальзаминова», а он отвечает — Антон Чехов (на самом деле Александр Островский).

Основные причины галлюцинаций — недостаток знаний и принцип работы языковой модели. При обучении она учится предсказывать вероятное продолжение на основе предыдущих слов. Если модель не выучила какой-то факт, например того же автора «Женитьбы», то предскажет другое имя или другого писателя, ведь это более вероятное продолжение, чем, например, «эту книгу написала собака».

Этот феномен не изучен до конца, поэтому применяются разные способы решить проблему. Во время создания YandexGPT 2 мы поработали со знаниями модели, сильно улучшив её претрейн. Во-первых, стали тщательнее отбирать данные, во-вторых, проверять, как они влияют на тестовую модель, и только потом «вливать» их в основную. В будущем планируем использовать ещё и обучение с подкреплением.

Подписывайтесь 👉 @yandex
This media is not supported in your browser
VIEW IN TELEGRAM
Забежали сказать, что у нас день рождения!

Спасибо, что вы с нами! Дальше — больше! 🎉
Media is too big
VIEW IN TELEGRAM
«ИИ отнимет нашу работу?» 🤔

Запускаем мини-сериал, в котором ответим на популярные вопросы и распространённые заблуждения об искусственном интеллекте и новых технологиях.

В первом выпуске — вопрос, который волнует, кажется, вообще всех.

Подписывайтесь 👉 @yandex
Открыли исходный код ☁️ нашего инструмента для визуализации данных

Команда Yandex Cloud запустила DataLens в 2019 году. Его уже используют, чтобы анализировать ключевые бизнес-метрики и визуализировать большое количество данных в Hoff, М.Видео, Ренессанс Страховании и Яндексе. О том, как разработчики работают с визуализациями, рассказываем в карточках.

🔗 Исходный код DataLens открыт и выложен на GitHub.

💭 А если посмотрите выпуск yet another podcast про опенсорс, то сможете легко разобраться в том, зачем мы и другие технологические компании выкладывают свои продукты в открытый доступ.

Подписывайтесь 👉 @yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
«Огонь», «отвратительно», «супер» 🔥🤢👍 Как ругают и хвалят заведения в Яндекс Картах

Мы изучили тексты отзывов на рестораны, кофейни, пиццерии и другие заведения в Яндекс Картах — а таких отзывов, между прочим, больше 15 миллионов, — и теперь рассказываем, что интересного нам удалось выяснить. Подробнее об этом узнаете в нашем большом исследовании.

Подписывайтесь 👉 @yandex