Истории (не)успеха (ИИ)ЕИ
417 subscribers
158 photos
87 videos
2 files
227 links
Просто о математике, нейросетях, программировании, спорте, политике, культуре. Общение, контакты, международные онлайн дискуссии/лекции в формате лайвстрим, встречи на спорт в Мюнхене.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
А как вы проводите рождественские праздники?
Dmytro
Video
Какой ты Молодец всё- таки!!!
Это так восхищает способность людей дарить своё время и присутствие другому человеку.
1
Пять факторов личности и большие языковые модели 🤖🧠

Начав тут и тут , я постепенно разбираюсь с машинным обучением, нейросетями и их применениями. Пoка только по выходным доходят до этого руки, но всё же руки доходят по чуть-чуть!

Погнали в психологию с помощью больших языковых моделей! 🚀

Сегодня начнем сводить человеческую личность к числу! Точнее, даже не к числу, а к вектору. Причём не в каком-нибудь обычном евклидовом пространстве, а в пятимерном. Но чтобы туда попасть, сначала придётся подняться в 768-мерное пространство векторных эмбеддингов больших языковых моделей, а оттуда уже спуститься в "уютное" пятимерное пространство, чтобы соответствовать эмпирическим выводам психологов.

Итак, начнём с теории личности, основанной на «Большой пятёрке» — пяти измерениях человеческой личности (подробнее тут).
5 измерений 👇

1️⃣ Открытость опыту (Openness to Experience)
Характеризует любознательность, творческое мышление и склонность к восприятию нового. Люди с высоким уровнем открытости чаще экспериментируют, думают нестандартно и любят необычные идеи.
📝 Примеры слов: креативность, интеллектуальная любознательность, эстетическая чувствительность.

2️⃣ Добросовестность (Conscientiousness)
Отражает организованность, ответственность и целеустремлённость. Такие люди дисциплинированы, хорошо планируют и качественно выполняют задачи.
📝 Примеры: целеустремлённость, самоорганизация, аккуратность.

3️⃣ Экстраверсия (Extraversion)
Связана с энергичностью, общительностью и стремлением к социальной активности. Экстраверты любят быть в центре внимания и активно взаимодействуют с окружающими.
📝 Примеры: коммуникабельность, социальная активность, энтузиазм.

4️⃣ Согласие (Agreeableness)
Характеризует доброжелательность, альтруизм и готовность к сотрудничеству. Такие люди чаще проявляют эмпатию и заботу о других.
📝 Примеры: альтруизм, дружелюбие, эмпатия.

5️⃣ Невротизм (Neuroticism)
Отражает склонность к эмоциональной нестабильности, переживаниям и тревожности. Высокий уровень невротизма — это стресс, беспокойство и частые волнения.
📝 Примеры: тревожность, эмоциональная нестабильность, стресс.

💡 Важно: эта модель не делит людей на "чёрное" и "белое". Например, нельзя однозначно сказать, экстраверт человек или интроверт, добросовестный или нет. В каждом измерении человек получает свою оценку - число. Как говорил дедушка Фрейд, в психологии нет однозначностей, всё очень размыто. Каждый человек уникален, и в рамках модели его можно описать пятью числами — по одному для каждого измерения.

📊 Если в каждом измерении бесконечное множество значений, то в пятимерном пространстве этих чисел в пять раз больше, чем в одномерной бесконечности. Этого достаточно, чтобы описать всех людей, живших и живущих.

Теперь самое интересное: как разместить конкретную личность в пятимерном пространстве? 🤔

С помощью трёх основных инструментов: эксперименты, наблюдения, тесты. И здесь на помощь приходят большие языковые модели и методы машинного обучения, которые позволяют извлекать признаки из огромных объёмов данных (Feature Extraction).

О том, как всё это связано с 768-мерным пространством, расскажу в следующем посте.

Продолжение следует...

#LLM #Transformer #Psychology #Cognitive
🥱1
👍1
Пять факторов личности: oт слов к делу коду 🚀

Вернёмся к теории личности "большая пятёрка" и математических моделей для неё, как было описано тут.

Проверим, как эмбеддинги (числовые представления текста) могут помочь в сравнении поведения с личностными чертами. Для этого мы вычисляем схожесть между фразами, описывающими поведение человека, и признаками из пяти факторов личности.

model = SentenceTransformer('distilbert-base-nli-stsb-mean-tokens')
sentences = [
"I like to work hard.",
"I enjoy being active.",
"I like to meet new people.",
"I prefer to follow routines.",
"I love trying new things."
]
factors = {
'Openness to Experience': [
"Creativity", "Intellectual curiosity", "Aesthetic sensitivity"
],
'Conscientiousness': [
"Goal-oriented", "Self-discipline", "Organization"
],
'Extraversion': [
"Sociability", "Enthusiasm", "Activity"
],
'Agreeableness': [
"Altruism", "Empathy", "Cooperation"
],
'Neuroticism': [
"Anxiety", "Emotional instability", "Stress"
]
}

# Получаем эмбеддинги для предложений
sentence_embeddings = model.encode(sentences, convert_to_tensor=True)

# Для каждого фактора личности, вычисляем схожесть с предложениями
for factor, keywords in factors.items():
for keyword in keywords:
factor_embedding = model.encode(keyword, convert_to_tensor=True)
similarities = util.pytorch_cos_sim(sentence_embeddings, factor_embedding)

Результаты:
{'Sentence': 'I like to work hard.', 'Factor': 'Openness to Experience', 'Keyword': 'Creativity', 'Similarity': 0.23025937378406525}
{'Sentence': 'I enjoy being active.', 'Factor': 'Openness to Experience', 'Keyword': 'Creativity', 'Similarity': 0.4642907977104187}
....

полный список результатов в комментариях 👇

Что мы видим из результатов?

1. Активность и креативность
🏃‍♂️ *"I enjoy being active."* — высокая схожесть с креативностью (0.464). Люди, которые активны, часто проявляют творческий подход.

2. Рутина и открытость
🔄 *"I prefer to follow routines."* — низкая схожесть с креативностью (-0.072). Люди, предпочитающие рутину, менее склонны к нестандартному мышлению.

3. Активность и экстраверсия
🌟 *"I enjoy being active."* — очень высокая схожесть с экстраверсией (0.608). Активность напрямую связана с общительностью и жизнерадостностью.

4. Трудолюбие и тревожность
💼 *"I like to work hard."* — умеренная схожесть с тревожностью (0.220). Стремление к достижению целей может быть связано с переживаниями.

5. Невротизм и стресс
😰 *"I like to work hard."* — схожесть с уровнем стресса (0.220). Высокий уровень трудолюбия может быть связан с повышенным стрессом.

6. Невротизм и эмоциональная нестабильность
🌩 *"I like to work hard."* — умеренная схожесть с эмоциональной нестабильностью (0.182). Трудолюбивые люди могут переживать больше эмоций в стрессовых ситуациях.

Такие выводы помогают лучше понять, как привычки и предпочтения связаны с личностными чертами. Таким образом, с помощью эмбеддингов можно исследовать, как различные результаты психологических экспериментов, тестов и наблюдений соотносятся с личностными признаками в теории большой пятёрки.

полный список результатов в комментариях 👇
______________

Cсылка на код, вдруг кто захочет поиграться:

https://colab.research.google.com/drive/1-jXFB-5We8it_p8eL0_8G4xB1ODGxTX1?usp=sharing

не благодарите 😂

Источники:

📝 Wulff, D.U., & Mata, R. (2023). Automated jingle–jangle detection: Using embeddings to tackle taxonomic incommensurability.
📝 Hussain, Z., & Binz, M., & Mata, R. & Wulff D.U. (2024) A tutorial on open-source large language models for behavioral science
📝 Costa, P., & McCrae, R.R. (2022) Personality in Adulthood: A Five-Factor Theory Perspective

#LLM #Transformer #Interpretability #Literature
🔥3👎2🤡1
Истории (не)успеха (ИИ)ЕИ pinned «Посоветуйте на чём ещё поигратья с нейросетями/трансформерами (и на чём их пообучать - данных для обучения полно сейчас)»
Dmytro
Посоветуйте на чём ещё поигратья с нейросетями/трансформерами (и на чём их пообучать - данных для обучения полно сейчас)
Могу скинуть кучу данных из лаборатории биомеханики, ныне закрытой.
Лаборатория работала 2014-2023, специализация на БОС (Биологическая Обратная Связь) у пациентов с неврологическими заболеваниями (преимущественно последствия инсультов и хроническая ишемия головного мозга), в базе много чего есть (психологические тесты), БОС с мелкой моторикой итд итп.: 5000 пациентов.
Пример выгрузки с джойстиками:
Папку можно получить по ссылке:

Джойстики выгрузка 2023 апрель
https://disk.yandex.ru/d/P7RmwCg2ui7ZsA

Что именно там навыгружал уже и не помню.
2
Forwarded from Двач
This media is not supported in your browser
VIEW IN TELEGRAM
Общая теория относительности для самых маленьких.

Наконец-то вы её поймёте
Forwarded from FightSpace
This media is not supported in your browser
VIEW IN TELEGRAM
Настроение 31 декабря: Готовимся провожать и встречать
💡 Интересная новость 2024-го года: машинное обучение в криминалистике и трудность преодоления устоявшихся канонов

Традиционно криминалисты не связывают отпечатки разных пальцев одного человека. Например, если преступник оставит отпечатки указательного пальца на одном месте преступления и большого пальца на другом, эксперты не могут доказать, что эти следы принадлежат одному человеку, если у них нет полного набора его отпечатков.

В 2024 году студент Колумбийского университета, Гейб Го, решил эту проблему, применив искусственный интеллект. Используя базу данных из 60 000 отпечатков, он обучил модель находить сходства между отпечатками разных пальцев одного человека.

📉 Почему это вызвало спор?
Когда Гейб представил свою работу криминалистам, они её отвергли. Основной аргумент: подход противоречит устоявшимся канонам и не учитывает специфику их работы. Однако студент предположил, что сходство между отпечатками пальцев может быть связано с закономерностями, заложенными на уровне ДНК.

🔄 Как он преодолел сопротивление?
Гейб отправил свою статью биологам, и те поддержали его гипотезу. После дополнительных проверок работа была опубликована в Science Advances.

🔍 Почему это важно?

Теперь можно находить связь между отпечатками разных пальцев одного человека, что может помочь связать следы преступника на разных местах преступления. Это открытие может привести к пересмотру старых нераскрытых дел. Подход предлагает учитывать биологические и генетические факторы в анализе отпечатков, что ранее игнорировалось.

Эта история показывает, как трудно преодолеть устоявшиеся каноны даже в тех областях, где технологии способны значительно повысить эффективность. Hасколько быстро криминалисты смогут адаптироваться к новым методам?

Меня лично всегда восхищает, что машины могут находить такие закономерности, которые нам, людям, недоступны. Мы не умеем думать в многомерных пространствах, а ИИ свободно работает с такими сложными структурами и выявляет скрытые связи.
Литературные/исторические персонажи, психология и нейрoсети

@felixg_haifa предложил взглянуть на личностную классификацию исторических и литературных персонажей по Big-Five-Theory или по MBTI с точки зрения искусственных нейросетей. За что ему огромное спасибо, потому что это оказалось очень интересно 😄! Я пока не знаю, что там можно получить в разумное время и с разумными затратами, но начнём по-немногу! 🚀

Как пример я взял героя романа Штефана Цвейга "Нетерпение сердца". Сюжет романа прост: молодой лейтенант Антон Гофмиллер, стремясь следовать этикету, совершает оплошность. Решив загладить ошибку, он начинает регулярно навещать девушку с инвалидностью, дочь местного аристократа Кекешфальвы, и оказывается не в состоянии противостоять приятным чувствам — принятию в светском обществе и осознанию, что делает что-то хорошее. Но прав ли был главный герой, что так легко поддался кратковременному сиюминутному чувству? Или лучше было перетерпеть и действовать более обдуманно? 🤔 Кульминацией истории Гофмиллера становится внезапная и неосознанная помолвка, за которой следуют испуг и желание выкрутиться из ситуации. В результате его невеста покончила с собой, а сам Гофмиллер, спасаясь от чувства вины, отправился на войну. На войне импульсивность оказалась преимуществом: смелость, а точнее, безрассудство, хоть и сделали его героем, но никак не излечили его душевные раны. 💔

Другой герой романа, аристократ и магнат Кекешфальва, отец погибшей девушки, в романе описывается так:

«Он старался наскрести лишний крейцер где только мог — и на побегушках у купца, и посыльным из деревни в деревню. В том возрасте, когда другие дети еще играют в стеклянные шарики, он уже точно знал, сколько стоит каждая вещь, где и что продается или покупается и как сделаться незаменимым, исполняя мелкие поручения; сверх того, он находил еще время, чтобы немного подучиться. <...> Конечно, проявив столько энергии и упорства, можно нажить немало добра. Однако настоящие состояния, как правило, образуются лишь при особом соотношении между доходами и расходами, между прибылью и издержками. И вот в этом и заключался второй секрет преуспеха нашего приятеля: Каниц почти ничего не расходовал, если только не считать того, что он подкармливал кучу родственников и платил за учение брата. Единственное, что он приобрел для себя лично, — это черный сюртук, да <...> очки в золотой оправе, благодаря которым он прослыл среди крестьян за „ученого“».

Очевидно, что классифицировать личности обоих героев романа по MBTI или Big-Five довольно легко вручную, просто прочитав роман. 📚 Но для меня тут возникают несколько вопросов:

#LLM #AI #CognitiveScience #Literature #Sociology
Может ли нейросеть дать более точную характеристику героев, чем человек, исходя из текста романа? 🤖
Нейросети могут анализировать текст на более глубоком уровне, выявляя скрытые закономерности и связи, которые могут быть неочевидны для человека. Но насколько эта характеристика будет "точной"? И в каком контексте мы говорим о точности? В плане психологического профиля, более структурированного анализа поведения или какого-то другого аспекта?

Может ли нейросеть, используя многомерные пространства, описать личности этих литературных героев более тонко и комплексно, чем традиционные классификационные системы, такие как MBTI или Big-Five, которые оперируют всего 4-6 измерениями? 🌌
В отличие от традиционных систем, которые классифицируют личности по нескольким ключевым признакам (например, экстраверсия/интроверсия, нейротизм, открытость и т.д.), нейросети могут использовать гораздо более сложные многомерные векторы. Эти векторы представляют не просто 4-6 характеристик, а могут учитывать гораздо более тонкие, почти бесконечно разнообразные аспекты человеческого поведения и личности. С помощью нейросетей можно создать многомерные модели, в которых персонажи, такие как Гофмиллер и Кекешфальва, будут отображены не по одной плоскости (например, по шкале "экстраверсия-интроверсия"), а по множеству переменных, которые гораздо точнее отражают их сложные психологические и социальные взаимодействия.

Можно ли из этой более точной классификации создать мостик к разделам психологии, где используются байесовские модели? 📊
Байесовские модели позволяют работать с вероятностями и неопределенностями, что идеально сочетается с задачей построения психолого-психометрических профилей. Если нейросеть сможет предложить более точную классификацию, эту информацию можно использовать в байесовских подходах, где каждый из аспектов личности рассматривается как вероятностная переменная. Например, можно будет вычислить вероятность определённых поведенческих реакций в различных ситуациях, что позволит получить более динамичное и адаптивное представление о характере героя.

Продолжение следует...

#LLM #AI #CognitiveScience #Literature #Sociology