«Яндекс» научил свои нейросети расшифровывать архивы с дореволюционной орфографией✍️
«Яндекс» обучил собственные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией, сообщили представители пресс-службы компании.
Как уточнили представители компании, попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллионам страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов,
Как отметили в пресс-службе, специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII - XIX веков и десятков миллионов сгенерированных примеров. Сами материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. «Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье.
Фото: пресс-служба «Яндекса»
#сделановроссии
#нейросети
#расшифровка
🇷🇺 Подписывайтесь на «Сделано в России»
«Яндекс» обучил собственные нейросети расшифровывать архивные записи со сложной дореволюционной орфографией, сообщили представители пресс-службы компании.
Как уточнили представители компании, попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллионам страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов,
Как отметили в пресс-службе, специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII - XIX веков и десятков миллионов сгенерированных примеров. Сами материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. «Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье.
Фото: пресс-служба «Яндекса»
#сделановроссии
#нейросети
#расшифровка
Please open Telegram to view this post
VIEW IN TELEGRAM