Вместе делаем науку
148 subscribers
118 photos
1 file
70 links
Научно-учебная группа «Когнитивные исследования языка» НИУ ВШЭ СПб
Download Telegram
В октябре у нас прошли уже две рабочие встречи (02.10 и 15.10) 💡
Делимся коротким отчетом по проектам:

🔹 Билингвы
— Отправили статью на рецензирование!
— Коллеги из Казахстана откликнулись — добавляем казахские слова в корпус!

🔹 Афазии
— Пишем статью, а параллельно готовим подачу на «Диалог»!

🔹 Нарративы про живопись
— Идет разметка: размечаем экспертный сэмпл.
— Скоро будем экспериментировать и проходить тест на эмоциональный интеллект, а пока финализируем для него инструкцию!

А также мы готовимся к финальному отчету: собираем все наши статьи, таблицы и выводы. Желаем вам всем и себе сил и успехов!
❤‍🔥4
Казахстан × НУГ: как мы изучаем слова для эмоций

Мы расширили географию исследований тюркско-русского билингвизма: коллеги из Казахстана (Шымкент, Университет им. М. Ауэзова) присоединились к нашему эксперименту по наименованию эмоций. Делимся, что уже сделали, а что будет дальше!
#проектынуг
🔥61
8 октября с докладом «Что было, что будет, чем дело кончится: представления о времени русскоязычных дошкольников» выступила Полина Михайловна Эйсмонт, кандидат филологических наук, доцент кафедры общего языкознания им. Л.А. Вербицкой Санкт-Петербургского государственного университета.

Полина Михайловна поделилась результатами исследования формирования представлений о времени у русскоязычных дошкольников, уделив особое внимание тому, как дети выражают этот концепт в языке. Одной из ключевых трудностей, с которой сталкиваются дети, является осмысление сложных предложений, содержащих описание последовательности действий. В докладе было показано, как восприятие времени зависит от возраста ребенка и его когнитивного развития.

Эксперимент был ориентирован на детей в возрасте от 5 до 7 лет, разделенных на три возрастные группы. В ходе эксперимента участники рассказывали историю, основанную на мультфильме, при этом в рассказах использовались различные временные маркеры и наречия. Результаты показали, что дети младшего возраста чаще используют простые временные маркеры, такие как «потом» и «теперь», для организации хронологии событий, но не всегда понимают их точное временное значение. В отличие от этого, более старшие дети (6-7 лет) уже более уверенно применяли пространственные и временные наречия, что позволяло им создавать более сложные и логически последовательные нарративы. Тем не менее, даже в старших группах сохранялась трудность с полным осмыслением более сложных временных отношений, таких как порядок событий в сложных предложениях.

Особое внимание в эксперименте уделялось использованию жестов, которые помогали детям в восприятии временных связей. Для того чтобы минимизировать возможные погрешности при взаимодействии с ребенком, ученые разработали алгоритм для робота-ассистента. Этот робот сопровождал рассказ движениями «назад» и «вперед», что соответствовало маркерам времени «до» и «после», помогая детям легче воспринимать и организовывать последовательность действий.

В ходе обсуждения участники подняли вопросы о значении развития рабочей памяти для правильного восприятия и организации временных отношений в тексте. Также обсуждались перспективы дальнейших исследований, направленных на более глубокое понимание того, как дети осваивают временные связи в языке.

Благодарим Полину Михайловну за интересный доклад и предлагаем вам посмотреть ее выступление!
❤‍🔥5
Сегодня, 29 октября, у нас прошла рабочая встреча 💡
Делимся коротким отчетом по проектам:


🔹 Билингвы
— Частично обработали ответы новых респондентов из Казахстана!
— Собрали список слов, которые дублировались в большинстве ответов, а также список уникальных лексем.
— Переводим с казахского на русский: прямой перевод + толкование значения.
— Готовимся проектировать новую «карту» для казахского языка.

🔹 Эрмитаж
— Выступили в Казани! Получили позитивный фидбек, отдельно отметили фокус на «трудности».

🔹 Афазии
— Выступили на открытом семинаре (посмотреть можно здесь)!
— Договариваемся о валидации в Санкт-Петербурге.
— Прорабатываем обновленную методику валидации текстов.

А также мы продолжаем активно готовиться к финальному отчету! Трудимся, не покладая рук! 💪

Движемся вперед и только вперед!
3
22 октября на очередном открытом семинаре научно-учеюбной группы выступили ее руководитель Анастасия Владимировна Колмогорова, а также ее участники Анастасия Марголина, Алина Тельнова и Игорь Ильченко. Они рассказали о новом этапе нашего проекта, посвященного речевой терапии пациентов с афазией.

Основная проблема в области речевой терапии взрослых — дефицит специализированных текстов, которые одновременно должны быть простыми для восприятия (частотная лексика, простые предложения) и при этом содержательно интересными для пациента. На прошлом этапе в НУГ тестировался метод симплификации (упрощения) готовых текстов художественной литературы и СМИ для пациентов с разной степенью тяжести речевого нарушения. Однако более продуктивным оказался метод генерации таких текстов с нуля с помощью большой языковой модели (LLM), о чем и рассказали выступающие.

На семинаре был представлен разработанный пайплайн, позволяющий генерировать коллекции таких текстов с помощью многоэтапного промптинга. Этот подход дает возможность контролировать как лингвистические параметры, так и смысловое наполнение итоговых материалов.

⁃ требования к грамматическим структурам, сложности лексики и длине текста были разработаны совместно с логопедами,
⁃ способ контроля содержания представляет собой трехчастную комбинаторную систему: 12 тематических категорий, 10 архетипических персонажей и 11 ключевых объектов комбинируются между собой,
⁃ набор тематических категорий основывается на топе популярных Google запросов,
⁃ список архетипических персонажей опирается на типы персонажей по В.Проппу,
⁃ список прототипических объектов разработан с опорой на теорию аргументации в языке О.Дюкро и Ж.-П.Анскомбра.

К семинару присоединились и наши коллеги-логопеды из Москвы и Красноярска! После доклада состоялась продуктивная дискуссия о дальнейших путях развития проекта, а также о возможностях валидации и применения текстов, сгенерированных по нашей методике, для работы с реальными пациентами.

Участникам семинара были продемонстрированы примеры текстов трех уровней сложности, сгенерированных для пациентов с комплексной моторной афазией разной степени тяжести. Представленный метод позволил создать корпус из более чем 1.000 текстов, который вскоре будет валидирован в клинической практике!

Благодарим Анастасию Владимировну и др. за интересный доклад и предлагаем вам посмотреть наше выступление!
❤‍🔥10
🤓 В среду, 5 ноября, в 16:30 по МСК с докладом «"Смотрю и грустно как-то": о разметке нарративов об искусстве большими языковыми моделями» выступит Мария Сергеева, стажер-исследователь Лаборатории языковой конвергенции, участница НУГ «Когнитивные исследования языка».

🏫 Нарративы об искусстве — это рассказы зрителей о том, что именно «с ними делает» изображение. В докладе мы обсудим эксперимент с одной картиной: её описывали разные люди с различным уровнем эмоционального интеллекта. Процедура проходила в два этапа: сначала участники смотрели на картину и фиксировали своё первичное эмоциональное впечатление, затем формулировали словесное описание и повторно отмечали преобладающую эмоцию. Этот сдвиг — от мгновенного отклика к рефлексивному нарративу — принципиален: он позволяет увидеть, как язык закрепляет, уточняет или, наоборот, смещает исходное чувство. Материалы были собраны и представлены ранее Ксенией Степанец, выпускницей ОП «Филология» НИУ ВШЭ СПб. В рамках НУГ «Когнитивные исследования языка» мы провели эксперимент: нарративы были пропущены через несколько больших языковых моделей, которым предлагалось определить доминирующую эмоцию из фиксированного набора категорий: гнев, радость, удивление, грусть, страх. Мы сопоставляем метки моделей с самооценками людей до и после вербализации, чтобы понять, где машинная классификация совпадает с человеческой интуицией, а где расходится из-за особенностей повествования, интерпретационных рамок или стратегий описания. Нас интересует не столько «точность ради точности», сколько поведенческий профиль: какие типы формулировок усиливают определённую эмоцию, какие — не позволяют модели распознать её, и как сам акт описания влияет на итоговую метку.

Приглашаем к участию в семинаре лингвистов, когнитивистов, искусствоведов, психологов и всех, кто интересуется исследованиями в области автоматической классификации эмоций.

📹Ссылка для подключения

https://telemost.yandex.ru/j/58755049991144
5
📍 21-24 октября мы приняли онлайн-участие в VI Казанском международном лингвистическом саммите.

Наши коллеги П.А. Колмогорова и К.А. Дмитриева представили доклад «Метод Painter Recognition Test в изучении восприятия текстов об искусстве: валидация и перспективы применения для оценки трудности текста».

Что рассказали:
• показали, как PRT (тест на «насмотренность») помогает исследовать восприятие текстов об искусстве;
• обсудили различия сложности и трудности текста — ключевые понятия казанской лингвистической школы, на которые мы опираемся!

Кроме того, нашу секцию модерировала М. И. Солнышкина — автор подходов к измерению сложности/трудности, важных для нашей задачи! Очень приятная встреча! 🙌

Также прозвучал вопрос: можно ли перенести методику PRT на другие виды искусства, например, на музыку? Идея переноса на другие модальности показалась нам очень интересной! На данном этапе мы сфокусированы на визуальном искусстве и завершаем валидацию теста, но вопрос обозначил новую перспективу исследования. 🎶
11
5 ноября на нашем открытом семинаре выступила Мария Сергеева, стажер-исследователь Лаборатории языковой конвергенции, участница НУГ «Когнитивные исследования языка». Она представила доклад «„Смотрю и грустно как-то“: о разметке нарративов об искусстве большими языковыми моделями».

В центре исследования — устные рассказы русскоязычных взрослых о картине «Фермерша». В эксперименте участники после первого просмотра картины оценивали своё эмоциональное состояние, затем проговаривали впечатления, а после повторного просмотра снова отмечали эмоции и их интенсивность. Эти тексты и составили корпус нарративов. Дополнительно измерялся уровень эмоционального интеллекта, что позволило связать особенности вербализации с индивидуальными различиями.

Корпус был автоматически размечен четырьмя моделями — mistral-small, llama-3, deepseek-r1 и qwen3 — по тем же пяти категориям эмоций, что предлагались участникам. Это дало возможность проследить, как меняются переживания в процессе проговаривания, насколько вербальные маркеры согласуются с самоотчётами и какие языковые средства модели считают наиболее эмоционально нагруженными.

В ходе доклада было представлено, что эстетическое переживание часто «дрейфует» от стартового страха и удивления к более сложной грусти, а самоотчёты нередко расходятся с тем, что фиксируется в нарративах. Модели лучше всего сходятся между собой и с участниками в оценке страха и грусти, менее устойчивы в распознавании радости и гнева и особенно сильно расходятся в оценке удивления. Отдельно обсуждались различия между моделями: mistral-small и llama-3 образуют «ядро» с минимальными смещениями, deepseek-r1 даёт более «эмоционально щедрые» оценки, тогда как qwen3 систематически занижает радость и удивление.

Исследование показывает, что для описания эстетических эмоций важны не столько отдельные ярлыки, сколько устойчивые лексико-семантические паттерны в нарративах, а ансамбль языковых моделей может выступать в роли многоголового «аннотатора» со своими biases. В обсуждении поднимались вопросы о том, как учитывать уровень эмоционального интеллекта при интерпретации таких данных и какие эмоциональные категории вообще пригодны для автоматической разметки художественных описаний.

В дальнейших планах — привлечение волонтёров для ручной оценки эмоциональных нарративов и сопоставление человеческих аннотаций с выводами моделей, а также расширение корпуса за счёт нарративов по другим картинам, участвовавшим в эксперименте.

Благодарим Марию за интересный доклад и предлагаем вам посмотреть ее выступление!
9
📍 30-31 октября мы приняли участие во Всероссийской конференции «Когнитивные исследования языка и дискурса» в МГЛУ.

Наши коллеги К.А. Дмитриева, П.А. Колмогорова и Е.А. Сытикова представили доклад «Painter Recognition Test: оценка опыта рецепции картин в задаче измерения трудности музейных текстов».

Пленарная сессия прошла в формате круглого стола памяти Е.С. Кубряковой, было много теплых воспоминаний и идей ее учеников и коллег. Из докладов особенно запомнилось выступление О.К. Ирисхановой про феномен адаптации применительно к жестам, а также работа Е.Е. Голубковой про асимметрию метафоры, а также обсуждение границ между метафорой, метонимией и метафтонимией. 👀

В целом наша секция оказалась очень «жестикуляционной»: было много докладов про жесты и жестовые языки, а один доклад даже шел на РЖЯ. Нашу работу встретили с интересом: коллеги занимаются адаптацией материалов для слабослышащих людей и ищут решения там, где кураторы не готовы упрощать исходные тексты. Обменялись контактами — будем на связи. 🤝
❤‍🔥93
🤓 В среду, 19 ноября, в 16:30 по МСК с докладом «Прагмасемантика недедуктивных форм рассуждения (на материале русского и китайского языков)» выступят Баребина Наталья Сергеевна, доктор филологических наук, доцент, профессор кафедры теоретической и прикладной лингвистики Байкальского государственного университета, и Фэн Юньфэй, аспирант 3-го года обучения Байкальского государственного университета.

🏫 В исследовании подчёркивается, что западная логика исторически формировалась как строгая формальная система, в то время как китайская логико-методологическая традиция остаётся недооценённой и часто сводится к стереотипам об «интуитивности Востока». Утверждается, что логическая рациональность не единична: формальная строгость и контекстуальная уместность могут сосуществовать как равноправные способы познания. В повседневной жизни, где полная и достоверная информация – редкость, люди чаще прибегают не к дедукции с принудительностью вывода, а к недедуктивным формам рассуждения. Последние давно известны в рамках изучения неформальной логики, однако систематизация их вербализации в разных языках фрагментарна. Такие рассуждения – индукция, традукция, абдукция и кондукция – основаны не на логической необходимости, а на степени правдоподобия и адаптированы к условиям неопределённости и иллюстрируют особенность человеческого рассуждения. Несмотря на ограничения – риск обобщений, необоснованной экстраполяции или манипуляции – эти формы играют ключевую роль в науке, диагностике, праве и повседневной коммуникации. В отличие от дедукции, недедуктивные рассуждения учитывают эмоциональность, спонтанность и социальный контекст мышления. Исследование предлагает рассматривать их как естественные и необходимые инструменты человеческого познания. Особое внимание уделяется их проявлению в диалогическом дискурсе, где последовательность «вопрос–ответ» позволяет реконструировать реальный ход рассуждения. Анализ строится на материале русского и китайского языков, что открывает возможности для межкультурного сопоставления стилей аргументации. Считаем, что признание множественности логических практик обогащает как теорию познания, так и прикладные исследования в лингвистике.
Предполагается, что интеграция моделей недедуктивных рассуждений в процесс дообучения языковых моделей позволит значительно повысить их способность к адекватной, контекстуально чувствительной и культурно адаптированной генерации аргументов. Внедрение таких схем рассуждения (например, абдуктивных догадок, кондуктивного взвешивания или метафорической традукции) в обучающие данные может сделать ИИ-ассистенты менее «логически жёсткими» и более естественными, гибкими и убедительными в реальных диалогах с пользователями из разных языковых и культурных сред.

Приглашаем к участию в семинаре лингвистов, когнитивистов, логиков, философов и всех, кто интересуется исследованиями недедуктивных форм рассуждения.

📹Ссылка для подключения

https://telemost.yandex.ru/j/58755049991144
👍3
19 ноября на очередном открытом семинаре НУГ с докладом «Прагмасемантика недедуктивных форм рассуждения (на материале русского и китайского языков)» выступили Баребина Наталья Сергеевна, доктор филологических наук, доцент, профессор кафедры теоретической и прикладной лингвистики Байкальского государственного университета, и Фэн Юньфэй, аспирант 3-го года обучения Байкальского государственного университета.

Доклад был посвящен особенностям недедуктивных форм рассуждения на материале русского и китайского языков. В центре внимания находилось сопоставление западной традиции формальной рациональности и восточных моделей интуитивного и контекстуально ориентированного мышления, а также влияние структуры языка и системы письма на организацию мыслительных процессов.

В ходе выступления были рассмотрены ключевые типы недедуктивных умозаключений — индукция, традукция, абдукция и кондукция — с иллюстрациями из китайской и русской языковых практик. Было показано, что в китайской традиции аргументация опирается не на логическую необходимость, а на ассоциативность, прецедентность и обращение к опыту, авторитету и этическим нормам.

Отдельное внимание было уделено историческим этапам развития логики в Китае и формированию специфической традиции неформальной аргументации, ориентированной скорее на убеждение, чем на формальное доказательство.

В ходе обсуждения были обозначены перспективы продолжения исследования, связанного с моделированием недедуктивных рассуждений в больших языковых моделях.

Благодарим Наталью Сергеевну и Юньфэй за интересный доклад и предлагаем вам посмотреть выступление!
11
🤓 Сегодня в 16:30 по МСК с докладом «Анализ метафор в нарративах о живописи, созданных человеком и визуально-языковой моделью» выступит Полина Налобина, стажер-исследователь Лаборатории языковой конвергенции, участница НУГ «Когнитивные исследования языка».

🏫 В докладе будут представлены результаты сравнения особенностей метафоризации в нарративах о живописи, составленных людьми и визуально-языковой моделью (VLM), на примере трех произведений из Эрмитажа, таких как «Фермерша (поясное изображение)» и «Портрет Солера» Пикассо, а также «Пейзаж. Дюнаберг в окрестностях Мурнау» Кандинского. В основу исследования легли 90 устных нарративов от 30 информантов, где участники отвечали на вопросы о содержании, деталях, ассоциациях и чувствах, вызванных каждой картиной. Для сравнения аналогичные тексты были сгенерированы с помощью модели Gemma-3-12B. Анализ метафор проводился по классификации Золтана Кевечеса, с выделением источников вроде телесности и эмоций, природных явлений, социальных ролей и других. Процесс анализа включал этапы автоматического выявления метафор, определения их источников и сравнения. Результаты показывают, что естественные нарративы информантов эмоционально-ассоциативны, с большим разнообразием источников метафор, в то время как искусственные метафоры более формализованы и фокусируются на физических свойствах и структуре описываемых объектов. Таким образом, несмотря на то, что модель способна успешно генерировать человеческую речь, эмоциональная интерпретация искусства, включая эффективное использование метафор, пока остается сферой естественного человеческого восприятия.

📹Ссылка для подключения

https://telemost.yandex.ru/j/58755049991144
8
4–5 декабря в Санкт-Петербурге участники нашей группы выступили на II Всероссийской научной конференции с международным участием «Язык, текст, культура через призму цифровых технологий».

Мы представили три доклада:

🔹 Налобина П. А., Степанец К. В. «Сравнение метафор в нарративах о живописи, созданных человеком и визуально-языковой моделью»
🔹 Сергеева М. О. «Нарративы об искусстве: большие языковые модели в оценке эмоциональной тональности текстов»
🔹 Дмитриева К. А., Колмогорова П. А. «Трудность текстов виртуального тура по Эрмитажу: дизайн эксперимента с применением Painter Recognition Test»

В этом году наши выступления особенно плотно сошлись на теме искусства и ИИ: от анализа текстов об искусстве до цифровых методов работы с музейным контентом! Было приятно увидеть, как эти направления все активнее пересекаются в рамках одной конференции.

От всей души благодарим организаторов за теплую и рабочую атмосферу, а также за возможность обсудить наши исследования с коллегами! ❤️
11👍3