Цифровой филолог👩‍💻
443 subscribers
57 photos
9 videos
14 files
151 links
Канал об электронных филологических ресурсах:
- электронных словарях,
- текстовых корпусах,
- базах данных,
- лингвистических программах.

Автор канала: @Elena_Rechnaya (открыта для диалога)

Чат: t.iss.one/digital_philologist_chat
Download Telegram
Узнала о специальном проекте "Системного Блока" "Подтекст".

Этот проект посвящен вопросу о том, как нейросети проникают в литературу.

Материалы проекта:

0️⃣1️⃣ Экзамен для Игоря Викторовича и ChatGPT: чей рассказ лучше, нейросети или писателя?

0️⃣2️⃣ Как это (не) работает: технологии нейросети-писателя

0️⃣3️⃣ Писатели в эпоху киберпанка: сотрудничество авторов с нейросетями

0️⃣4️⃣ Как писать художественные тексты с нейросетями и не облажаться

0️⃣5️⃣ Слово живое и цифровое: как нейросети повлияют на литературу

#ии@digital_philologist
#литература@digital_philologist
Forwarded from Тёма в тему
Как делать презентации за 5 минут,без водяного знака?

prezapro — бот в телеграмме который даст вам за пару минут создать презентацию и полностью редактировать ее на этапе создания и после создания
ПрезаПро (@prezaprobot)
Сегодня хочу рассказать вам о канале @youthandcareer, на котором ежедневно публикуются подборки актуальных стажировок, конкурсов и конференций.

Например, в этой подборке собраны сайты для поиска работы, которые будут полезны переводчикам и лингвистам, владеющим разными языками, редакторам, SMM-менеджерам и PR-специалистам.

Авторы делятся советами по поиску работы и построению карьеры, в том числе в научной сфере, рекомендуют образовательные платформы и собирают подборки материалов об особенностях деловой коммуникации. Здесь можно найти курс об орфографии и пунктуации в электронных редакторах, курс об основах деловых коммуникаций, подкаст о правилах деловой переписки и рекомендации книг о цифровом этикете и эффективных приёмах в речевом взаимодействии.

Особую ценность представляют подборки приложений для работы с заметками, для продуктивной работы и создания майнд-карт. Эти сервисы станут ценными помощниками в преподавательской деятельности.

Лично меня больше всего заинтересовали обзоры ИИ-ресурсов, которые можно использовать при написании курсовых, рефератов и научных работ и изучения иностранного языка (Unstuck, Perplexity, сервисов для транскрибации, ChatPDF, Бегемот, Gliglish, Gamma, Consensus, Napkin AI), а также разнообразных сервисов для научной работы (библиографических менеджеров, библиотечных систем, программ,  совершающих проверку орфографии и проверяющих тексты на антиплагиат).

Подписывайтесь на @youthandcareer

#рекомендации@digital_philologist
#ии@digital_philologist
Как можно улучшить ответы языковых моделей? Гайд по промтам

Сегодня качество ответов языковых моделей напрямую зависит от того, как сформулирован запрос. Новейшие LLM (large language model, большая языковая модель) уже неплохо справляются с неточными формулировками, но в большинстве случаев для успешной коммуникации с нейросетями всё ещё необходимы специальные методы и качественные промты. О том, как сформулировать запросы для языковых моделей, рассказываем в новом гайде.

👌🏻 Zero-shot prompting

Простые и короткие запросы к моделям приведут к выдаче простых и стандартных ответы. Например, есть запрос без примеров (zero-shot prompting): в этом случае мы рассчитываем на качество модели, на ее системные установки. Такие запросы хорошо работают для популярных запросов, для которых обучали модель (например, суммаризация текста или предварительный анализ данных).

✌🏻 One/few shot prompting

Если вы хотите получить от модели более развернутый и глубокий ответ в определенном формате/стиле, то при помощи одного или нескольких примеров (подсказок) необходимо явно показать, чего вы от нее ждете. Такой метод формулирования запросов называется one/few shot prompting. Примеры актуализирует в контексте модели более глубокие связи, которые были построены ею в процессе обучения, что в итоге помогает добиться ответа, который точнее соответствует запросу.

🙌🏻 Chain-of-Thought

Для решения сложных логических или математических задач используется техника chain-of-thought, или цепочка рассуждений (мы уже рассказывали о ней здесь). Простейший способ задействовать эту технику — прямо обозначить ее в запросе, используя выражения-маркеры вроде: «Давай думать шаг за шагом». В более сложных случаях можно задать для модели логику рассуждения, последовательность действий и этапы проверки.

Сравнить ответы языковой модели на одни и те же запросы, сформулированные с помощью разных методов, и узнать, что мотивировало ChatGPT-4o написать в обращении письма «Многоуважаемый и всечестнейший Профессор», можно, перейдя к полной версии статьи.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Топ-6 сервисов, которые заточены на поиск ошибок

В тему орфографических ошибок из недавнего... 😁

📌 text.ru
Орфография, пунктуация, опечатки, проверка на уникальность. А ещё сервис посчитает количество символов и слов.

📌 yandex.ru/dev/speller/
Яндекс.Спеллер помогает находить и исправлять орфографические ошибки на разных языках. При анализе сервис учитывает контекст.

📌 advego.com/text/
Проверяет ошибки в тексте на 20 языках. За одну проверку может «прочитать» до 100 000 знаков.

📌 orfogrammka.ru
Умная проверка пунктуации, грамматики и стилистики на основе машинного обучения.

📌 gramota.ru
Крупнейший русскоязычный онлайн-словарь, можно посмотреть толкование слова по нескольким словарям и способы употребления слова в зависимости от контекста.

📌 glvrd.ru
Главред помогает очистить текст от словесного мусора, проверяет на соответствие информационному стилю. Полезный сервис, когда текст нужно привести в порядок.
Коллега поделалась программой Международного онлайн-проекта "Корпусная неделя". Спасибо, Наталия Ивановна (@igolkinani)!

Корпусная Неделя представляет собой платформу для обмена знаниями, опытом и идеями между специалистами, студентами и всеми, кто интересуется вопросами автоматизации лингвистических изысканий и обработки больших данных в языке. В течение недели вы сможете погрузиться в мир корпусов - цифровых коллекций текстов, используемых для лингвистических исследований.

Чтобы стать слушателем, необходимо зарегистрироваться по следующей
ссылке. Ссылка придет за день до мероприятия.

Также можно подключиться к онлайн-трансляции ВКонтакте на странице Института гуманитарных наук ИвГУ.

Чтобы вы не пропустили интересные доклады, в начале каждого дня "Корпусной недели" я буду публиковать названия докладов.

С полной программой можно ознакомиться ниже.

#конференции@digital_philologist
Собрала для вас список полезных материалов с канала @youthandcareer, который обозревала в этом посте.

🖌Подборка 8 образовательных платформ. Некоторые из них я рекомендовала в предновогоднем посте.

🖌Подборка материалов об особенностях деловой коммуникации

🖌Подборка 10 приложений для работы с заметками

🖌Подборка 10 приложений для продуктивной работы и создания майнд-карт

🖌Небольшой глоссарий современного карьерного сленга

🖌Обзор "Unstuck" - ИИ-инструмента для создания конспектов

🖌Обзор "Perplexity" - ИИ-инструмента для поиска авторитетной информации. Я знакомила читателей с этим инструментом в этом посте, но в обзоре @youthandcareer вы можете найти некоторые полезные советы по работе (например, как сфокусироваться на более узкой проблематике).

🖌Подборка 7 сервисов для транскрибации. Это хорошее продолжение к моему посту о программе по распознаванию речи Speech2Text.

🖌10 сервисов для научной работы. Библиографические менеджеры, библиотечные системы, программы,  совершающие проверку орфографии и проверяющие тексты на антиплагиат. Давно хотела рассказать о библиографических менеджерах,  обязательно сделаю отдельный пост о работе с "Mendeley", потому что регулярно им пользуюсь.

🖌Обзор "ChatPDF" - ИИ-инструмента, резюмирующего тексты

🖌Обзор сервиса "Бегемот" - ИИ-помощника для создания рефератов, курсовых и научных работ

🖌Достоинства и недостатки "Gliglish" -  приложения для изучения иностранного языка. Краткий обзор программы уже был на нашем канале в этом посте.

🖌Обзор сервиса "Gamma" - ИИ-инструмента для создания презентаций

🖌Обзор сервиса "Consensus" - программы, помогающей исследователям искать, анализировать и синтезировать информацию на основе нейросетей.

🖌Обзор сервиса "Napkin AI" - ИИ-инструмента, который умеет бесплатно визуализировать тексты.

#рекомендации@digital_philologist
#ии@digital_philologist
Please open Telegram to view this post
VIEW IN TELEGRAM
Пушкин цифровой: два века работы в одном интерактивном издании

Александр Пушкин — один из самых изученных писателей. Есть тысячи работ, посвященных ему и его текстам. Исследователи из Пушкинского Дома подсчитали, что только для прочтения всего объема пушкинистики потребуется около 58 лет. А чтобы проанализировать этот объем вручную, нужно еще больше времени. Pushkin Digital решает эту проблему: цифровые методы обработки текстов и поиска связей между ними помогают быстро и эффективно работать с текстами как самого Пушкина, так и его исследователей.

Кратко: что это за проект?


Pushkin Digital – уже третье семантическое издание текстов и персоналий «большой литературы» в русскоязычном веб-пространстве (есть ещё «Слово Толстого» от команды Tolstoy Digital и Chekhov Digital, о котором «Системный Блокъ» писал здесь и здесь). Над созданием проекта о Пушкине параллельно работают Институт русской литературы (Пушкинский Дом) и Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, а DH-центр ИТМО разрабатывает интерфейсы для навигации, чтения и изучения материалов.

На сайте Pushkin Digital можно найти основные тексты произведений Пушкина, его рукописи и материалы академического пушкиноведения с середины XIX века и до наших дней. В отдельном разделе представлены тексты-путеводители, которые помогут современному читателю лучше понять контекст произведений. Там, например, можно выяснить, что в стихотворении «Я помню чудное мгновенье…» Пушкин позаимствовал у Жуковского, Баратынского и Батюшкова, а также какой была в жизни вдохновившая это стихотворение Анна Керн. 

Путеводители раскрывают культурный контекст, биографию людей пушкинского круга и поэтику текстов. Они параллельны и связаны одновременно. Каждый можно прочесть отдельно как лонгрид (на странице даже указано время чтения), а можно изучать все три слоя одновременно, листая само произведение и переходя по ссылкам.

Узнать, какие возможности открывает работа с порталом, как она устроена и какие дальнейшие планы есть у создателей проекта, можно из полной версии статьи.

Время чтения: 10,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня в программе "Корпусной недели"

24.02.2025


16.00 – 17.00
Рычкова Людмила Васильевна, к.ф.н., профессор кафедры перевода и межкультурной коммуникации, Гродненский государственный университет им. Янки Купалы (Республика Беларусь)

Критерии выбора корпусов для решения задач современной лингвистики

17.00 – 18.00
Pedro A. Fuertes Olivera, full Professor at the University of Valladolid, Spain, Extraordinary Professor at the University of Stellenbosch, South Africa, and Member of the Centre of Excellence in Language Technology (Ordbogen A/S, Denmark).

Lexicography Comes into Contact with Natural Language Processing: Working with Large Language Models

Запись трансляции

#конференции@digital_philologist
Дорогие коллеги!

Рады сообщить, что очередная конференция «‎Конкорт» пройдет в Нижнем Новгороде 2-3 июня 2025 г. Организаторы конференции — Школа лингвистики московского кампуса ВШЭ и Факультет гуманитарных наук нижегородского кампуса ВШЭ.
Основная тематика конференции — исследования, выполненные с помощью корпусных, статистических и прочих компьютерных методов, и исследования в области NLP и компьютерной лингвистики, однако приветствуются также работы с использованием экспериментальных методов и типологического метода.
Приглашаем подать короткие тезисы объёмом до 2000 знаков. Из тезисов должны быть ясны тема и цель исследования, применяемые технологии и подходы и достигнутые результаты. Тезисы нужно прислать до 15 марта (включительно) в эту форму: https://forms.yandex.ru/u/67b5c614d04688f67a9c4f06/
У конференции будет ограниченная возможность оплатить проезд и проживание в общежитии для участников-студентов из Москвы в Нижний Новгород и обратно.

От лица оргкомитета,
Илья Макарчук
Доклады "Корпусной недели" 25.02.2025

15.00 – 16.00
Дроздова Дарья Васильевна, преподаватель кафедры теоретической и прикладной лингвистики, член лаборатории корпусной лингвистики, Минский государственный лингвистический университет (республика Беларусь)

Моделирование образа социальной группы на корпусном материале

16.00-17.00
Солнышкина Марина Ивановна, д.ф.н., профессор, главный научный сотрудник научно-исследовательской лаборатории «Мультидисциплинарные исследования текста», Казанский (Приволжский) федеральный университет

RuLingua: Интеллектуальные решения для текстовой аналитики

Запись трансляции

#конференции@digital_philologist
Media is too big
VIEW IN TELEGRAM
Мы продолжаем совершенствовать Портрет слова в НКРЯ. Недавно в нем появилась возможность сравнивать скетчи, а теперь в Портрете слова Основного корпуса можно изучить, как менялись слова-ассоциаты во времени, а также ознакомиться с толкованием слова.

Виджет «Толкование β» содержит определения искомого слова, сгенерированные нейросетью. Сейчас авторизованным пользователям сайта доступны определения примерно для 5,5 тысяч слов, которые чаще всего искали в Основном корпусе. Толкования могут содержать ошибки и неточности – мы просим вас сообщать о них, используя кнопку «‎Оценить»‎ рядом с виджетом. Ваша обратная связь поможет нам улучшить генерацию толкований.

Виджет «‎Похожие слова»‎ теперь позволяет изучать список слов-ассоциатов (то есть слов, употребляемых в таких же контекстах, как искомое слово – не путать с синонимами!) не только по всему корпусу, но и по текстам, созданным в определенный период времени. Все тексты Основного корпуса с 1700 по 2022 год поделены на 11 временных периодов. Пользователи могут посмотреть на похожие слова одного периода или сравнить два периода, а также скачать скриншот. Например, интересно проследить, как менялись семантические ассоциаты слова ‎поезд или машина.