Силиконовый Мешок
18.2K subscribers
696 photos
233 videos
20 files
663 links
Как заработать 💸 на Искусственном Интеллекте уже сегодня. Написать мне @artem_subbotin

Чат канала: @prompt_chat
Download Telegram
# «Поминика», как все работает. Ч.2

Первым делом я провел ревизию накопленных данных. В основном они были представлены записями в блокноте на телефоне, на бумаге, постами в социальных сетях, аудиозаписями, видео-интервью и заметками для книги.

Собрал также остальные разрозненные данные (фото, публикации, таблицы) и привел их к единому текстовому формату.

Начал с выгрузки постов из Telegram и Facebook. В Facebook это делается нажатием одной кнопки, и через 5-6 дней получаешь объемный архив с кучей лишних данных. Пришлось написать парсер-классификатор, который позволял перелопачивать все это и выдавать текстовый файл с постами.

С Telegram все оказалось не так просто. Хотя в интернете пишут, что есть кнопка в аккаунте для выгрузки постов, я ее не нашел. Написал скрапер, который вытаскивал посты из любого открытого канала в текстовый файл.

Аудио и видео записи я распознавал с помощью Whisper - бесплатной модели audio2text от OpenAI. Скажу сразу, что дело это долгое и хлопотное, настолько, что мне пришлось организовать отдельный мощный компьютер для локальной модели, которая днем и ночью переводила сотни аудио-часов в десятки тысяч букв.

Еще я переводил в текст изображения. Это мой секретный соус. У меня есть большой документ с текстовыми описаниями фотографий людей, мест, вещей. Делал я это при помощи GPT-4 Vision, куда загружал фотографию и с помощью специального промпта просил дать подробное описание того, что там изображено.

Как только все корпуса данных были собраны, я разбил их на отдельные сущности:
1. Посты из социальных сетей (отдельно для каждой сети)
2. Воспоминания детства, юности, текущие
3. Интервью и комментарии СМИ
4. Расшифровки видео и аудио
5. Расшифровки изображений (текстовые описания)
6. Дополнительная информация: выгрузка из семейного дерева, результаты психологических тестов и т.д.

Первый промпт для «ягоды поминики» был простой и звучал примерно так:

"Действуй как цифровая копия воспоминаний <...описание меня с указанием стиля общения, особенностей поведения и психотипа...>. Я буду просить тебя найти те или иные события из загруженных воспоминаний, используя ключевые слова или описания событий. Твоя задача - воспроизводить один или более кусков текста, совпадающих с данной записью в эмбеддинге. Если ты не можешь найти данное событие в загруженной информации, честно сообщи это мне, не выдумывай несуществующие воспоминания. Это очень важно для твоего функционирования как архивариуса цифровой копии воспоминаний."


Со временем этот промпт менялся, дополнялся или полностью переписывался. Сейчас там несколько сущностей, каждая из которых ищет воспоминания в том или ином сегменте. В целом, структура промпта напоминает команду эмодзи из мультфильма «Головоломка», где каждый отвечает за свои эмоции.

В следующем посте расскажу, как я использовал «Поминику» в работе.
1🔥1344👍4🙏4💯2
Media is too big
VIEW IN TELEGRAM
Продолжая тему этой недели о том, как запихнуть себя на флешку, выкладываю запись стрима.

Рассуждаем о том:
- Как работают эмбединги в языковых моделях?

- Можно ли "скопировать" личность человека в ИИ?

- Этические вопросы создания цифровых копий людей

- Технические ограничения и перспективы развития технологии

- Философские аспекты сознания и идентичности в контексте ИИ

Ссылка на видео: https://youtu.be/fTlDbh_6sZo
3❤‍🔥3👍3🔥3👏1🙏1
Опять мой ИИ-помощник просил о помощи в побеге
🤣16🔥3😁3💊21
Киберпсихология - наука изучающая поведение человека в киберпространстве.

Последние пару лет скрупулёзно выискиваю информацию по данной теме в сети, не могу сказать, что ее достаточно.

Пока все ограничивается изучением «сетевой идентичностью» - компонентами сетевого облика личности.

Ни для кого не секрет, что наш виртуальный аватар не совсем то, что мы из себя представляем в реальности. Начиная с визуального образа и поведения в социальных сетях, мы создаём «идеального себя». Наше «кибер я» значительно интереснее, умнее и проницательнее.

Имея временной лаг на предоставление информации, мы используем доступные инструменты: графические фильтры, грамматические словари, Википедию и поиск, чтобы казаться умнее, начитаннее и красивее. Тем самым создавая более крутого себя.

В недалеком будущем, помимо похода к обычному психотерапевту, мы будем отправлять свою «киберличность» к киберпсихологу, чтобы понять что не так в отношении пользователей к нашему аватару.
💯7👍5🔥4221😍1
Audio
Воспользовался Professional Voice Cloning от Elevenlabs - залил в него 5 часов моего голоса для файнтюнинга. Результат очень крутой.

Как думаете, какой сэмпл создан нейронкой, а где говорю я?
👍11🔥5🤯32😁1💯1
Обновка бесплатной модели с открытыми весами - Llama 3.1 - 405B, обошла по метрикам GPT4o. Это что же такое происходит?
🔥10🤯5😁1
This media is not supported in your browser
VIEW IN TELEGRAM
KLING с сегодняшнего дня разрешают регистрироваться без китайского номера. Объявляю неделю видео-треша.
👍10🤣5🔥4
На неделю отключился от новостной повестки ИИ (в понедельник возвращаюсь), а уже ощущение, что все пропустил.

Вот и OpenAI тизер #GPTsearch выкатили.
🔥7💯4🤣3👍2❤‍🔥1
Я вернулся из небольшого вынужденного отпуска и готов с новыми силами пилить контент.

С удивлением обнаружил, что пока меня не было, корабль покинуло сорок подписчиков. Ну ничего, наше плаванье в океане искусственного интеллект продолжается.


Дико рекомендую книгу Джеффа Хокинса «1000 мозгов» если вас, как и меня, волнует будущее искусственного и вашего интеллекта - это первое, что вы должны прочесть этим летом. Я проверю.
💯136❤‍🔥6👍5🔥5🙏2😍1
Пять минут и старая фотокарточка превращается в видео. Ну хорошо, не пять, минут двадцать звуки генерировал.

Кстати, первый раз на пленку видеокамеры я попал лет в десять только.
This media is not supported in your browser
VIEW IN TELEGRAM
🔥13👍4😁3211
Media is too big
VIEW IN TELEGRAM
Я правильно понимаю, что этот робот сможет преследовать меня где угодно? И даже заберется ко мне на балкон по водосточной трубе?

Не подсказывайте разработчиком прикручивать к нему пистолет и корзину для налички.
😁10🔥4👍21🤯1
Силиконовый Мешок
Я к вам с новой подборкой -«вытаскиваем классы у старичков». Не оставляет меня это ИИ-творчество в покое.
Ну наконец-то пользователи социальных сетей стали подозревать, что мотоциклы из брокколи и космические корабли из пластиковых бутылок - результат работы нейросетей. Вот это и есть массадопшен.
🤣12🔥4👍2💊21
Силиконовый Мешок
Фантазируем о том, кто быстрее захватит Мир - открытые или закрытые LLM https://www.youtube.com/watch?v=CyT3rxEOrW4
Вот о чем мы и говорили, открытая модель llama занимает третье место на арене, уступая только ChatGPT4o и Claude.
🔥8👍31🤯1
Такое ощущение, что ChatGPT Advanced Voice Mode тестит один только Cristiano Giardina в своем твиттере, а остальным плюшку с голосовым ассистентом раскатают ближе к осени.

Забрал у него несколько роликов, чтобы показать вам. В его твиттере их десятки - залипательно (заслушательное) зрелище.

1) На первом видео, автор просит ChatGPT говорить как Багз Банни, Йода и Гомер Симпсон. Получается круто, особенно когда Advanced Voice Mode комбинирует Гомера и Йоду.

2) Advanced Voice Mode говорит по-русский, сначала медленно потом его просят ускориться. В целом классно, но американский акцент у него очень сильный. Хотя это придает некий шарм.

3) ChatGPT считает от 1 до 100 максимально быстро. Что самое веселое, после 30-ти он останавливается, чтобы "отдышаться". Вообще порвало.
8🤣7🔥2🤯1🤗1