Силиконовый Мешок

# «Поминика», как все работает. Ч.2

Первым делом я провел ревизию накопленных данных. В основном они были представлены записями в блокноте на телефоне, на бумаге, постами в социальных сетях, аудиозаписями, видео-интервью и заметками для книги.

Собрал также остальные разрозненные данные (фото, публикации, таблицы) и привел их к единому текстовому формату.

Начал с выгрузки постов из Telegram и Facebook. В Facebook это делается нажатием одной кнопки, и через 5-6 дней получаешь объемный архив с кучей лишних данных. Пришлось написать парсер-классификатор, который позволял перелопачивать все это и выдавать текстовый файл с постами.

С Telegram все оказалось не так просто. Хотя в интернете пишут, что есть кнопка в аккаунте для выгрузки постов, я ее не нашел. Написал скрапер, который вытаскивал посты из любого открытого канала в текстовый файл.

Аудио и видео записи я распознавал с помощью Whisper - бесплатной модели audio2text от OpenAI. Скажу сразу, что дело это долгое и хлопотное, настолько, что мне пришлось организовать отдельный мощный компьютер для локальной модели, которая днем и ночью переводила сотни аудио-часов в десятки тысяч букв.

Еще я переводил в текст изображения. Это мой секретный соус. У меня есть большой документ с текстовыми описаниями фотографий людей, мест, вещей. Делал я это при помощи GPT-4 Vision, куда загружал фотографию и с помощью специального промпта просил дать подробное описание того, что там изображено.

Как только все корпуса данных были собраны, я разбил их на отдельные сущности:
1. Посты из социальных сетей (отдельно для каждой сети)
2. Воспоминания детства, юности, текущие
3. Интервью и комментарии СМИ
4. Расшифровки видео и аудио
5. Расшифровки изображений (текстовые описания)
6. Дополнительная информация: выгрузка из семейного дерева, результаты психологических тестов и т.д.

Первый промпт для «ягоды поминики» был простой и звучал примерно так:

"Действуй как цифровая копия воспоминаний <...описание меня с указанием стиля общения, особенностей поведения и психотипа...>. Я буду просить тебя найти те или иные события из загруженных воспоминаний, используя ключевые слова или описания событий. Твоя задача - воспроизводить один или более кусков текста, совпадающих с данной записью в эмбеддинге. Если ты не можешь найти данное событие в загруженной информации, честно сообщи это мне, не выдумывай несуществующие воспоминания. Это очень важно для твоего функционирования как архивариуса цифровой копии воспоминаний."

Со временем этот промпт менялся, дополнялся или полностью переписывался. Сейчас там несколько сущностей, каждая из которых ищет воспоминания в том или ином сегменте. В целом, структура промпта напоминает команду эмодзи из мультфильма «Головоломка», где каждый отвечает за свои эмоции.

В следующем посте расскажу, как я использовал «Поминику» в работе.

1🔥13❤4✍4👍4🙏4💯2

2.29K views13:01