Разобрался сегодня с нейронкой, которая позволяет создавать дипфейки -
FaceFusion.
За пару часов #ChatGPT научила меня разворачивать проект из докера и настраивать среду разработки.
Еще раз напоминаю - я не программист, не знаю ни одного языка программирования.
FaceFusion.
За пару часов #ChatGPT научила меня разворачивать проект из докера и настраивать среду разработки.
Еще раз напоминаю - я не программист, не знаю ни одного языка программирования.
🔥12❤3👍3👏2🤯2😱1💯1
Рассказать, как такие дипфейки с изменением лица и голоса, делать бесплатно?
Давайте соберем 100🔥 - а я пока подготовлю материал.
Давайте соберем 100
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥132👍2👏2💯2🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
#KreaAi сделали прикольный апскейл, можно апгрейдить свою Лару с PS1
🔥7❤2😁1🌭1💯1🍌1💅1
Силиконовый Мешок
#KreaAi сделали прикольный апскейл, можно апгрейдить свою Лару с PS1
This media is not supported in your browser
VIEW IN TELEGRAM
За выходные технологии немного улучшились. Скоро так везде будет, в пятницу у тебя был просто орущий кот, а в понедельник при помощи "нейропереводчика" ты узнаешь от него много неприятных деталей о себе.
😁14🔥5❤2❤🔥1👍1💯1
Силиконовый Мешок
Рассказать, как такие дипфейки с изменением лица и голоса, делать бесплатно? Давайте соберем 100 🔥 - а я пока подготовлю материал.
Вы набрали сто реакций, с меня инструкция, как делать дипфейки:
Что нам понадобится:
1. Whisper - модель от #OpenAI для перевода голоса в текст, хотя можно и руками если немного
2. Elevenlabs - для клонирования голоса и озвучивания. Можете и бесплатную модель использовать
3. FaceFusion - для дипфейка лица.
4. CapCut или любой другой видеоредактор.
Первым делом нужно раздобыть образцы голоса и фото лица. Хорошо если личность известная, как Сергей, хватит одного интервью. Качаем ролик из YouTube, отделяем звуковую дорожку и нарезаем ее кусками по 10 мегабайт - больше в Elevenlabs не влазит.
Ну и самый сложный для меня, как не программиста, этап - установка FaceFusion. Но оказалось, что все не так уж и страшно. Если у вас нет терминала, то нужно поставить его и запустить следующую команду:
Дальше открываем https://127.0.0.1 и видим удобный и интуитивный интерфейс для создания дипфейков. Если не понятны предназначения каких-то кнопок, советую воспользоваться: https://docs.facefusion.io/ - там очень подробная документация.
Теперь у нас есть видео и голос. Совмещаем все это в видеоредакторе, если есть желание можете заморочиться с липсинком, например использовать эту модель https://huggingface.co/spaces/manavisrani07/gradio-lipsync-wav2lip
А для чего же был нужен Whisper? Его можно использовать для расшифровки речи, чтобы не набирать руками текст для синтезированного голоса в Elevenlabs’е.
Что нам понадобится:
1. Whisper - модель от #OpenAI для перевода голоса в текст, хотя можно и руками если немного
2. Elevenlabs - для клонирования голоса и озвучивания. Можете и бесплатную модель использовать
3. FaceFusion - для дипфейка лица.
4. CapCut или любой другой видеоредактор.
Первым делом нужно раздобыть образцы голоса и фото лица. Хорошо если личность известная, как Сергей, хватит одного интервью. Качаем ролик из YouTube, отделяем звуковую дорожку и нарезаем ее кусками по 10 мегабайт - больше в Elevenlabs не влазит.
Ну и самый сложный для меня, как не программиста, этап - установка FaceFusion. Но оказалось, что все не так уж и страшно. Если у вас нет терминала, то нужно поставить его и запустить следующую команду:
git clone https://github.com/facefusion/facefusion.git
cd facefusion
python -m venv venv
venv\Scripts\activate.bat
python install.py
python run.py
Дальше открываем https://127.0.0.1 и видим удобный и интуитивный интерфейс для создания дипфейков. Если не понятны предназначения каких-то кнопок, советую воспользоваться: https://docs.facefusion.io/ - там очень подробная документация.
Теперь у нас есть видео и голос. Совмещаем все это в видеоредакторе, если есть желание можете заморочиться с липсинком, например использовать эту модель https://huggingface.co/spaces/manavisrani07/gradio-lipsync-wav2lip
А для чего же был нужен Whisper? Его можно использовать для расшифровки речи, чтобы не набирать руками текст для синтезированного голоса в Elevenlabs’е.
🔥7👍5✍2❤2🙏2
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера не постил ничего, весь день писал сервис, который позволяет наполнять телеграм канал тематическим контентом.
Все работает, осталось поработать с #промпт'ами и источниками.
Рассказывать подробности? 🔥- кидайте, если да.
Все работает, осталось поработать с #промпт'ами и источниками.
Рассказывать подробности? 🔥- кидайте, если да.
🔥91❤4👍4
Силиконовый Мешок
Вчера не постил ничего, весь день писал сервис, который позволяет наполнять телеграм канал тематическим контентом. Все работает, осталось поработать с #промпт'ами и источниками. Рассказывать подробности? 🔥- кидайте, если да.
Завел тестовый канал @aimamochka - пытаюсь подобрать формат контента, который создает ИИ-Агент на основе постов с Reddit'а. Сейчас вот тестирую публикацию постов только эмодзи.
Пишите в комменты ваши мысли.
Пишите в комменты ваши мысли.
👍2✍1🙏1💯1💋1👀1👾1
#Google зарелизили свою модель - #Gemini - го, тестить!
Заходите в свой аккаунт и переключайтесь на английский язык. Заходим в Бард и проверяем.
Что добавилось?
⁃ Мультимодальность - распознает текст, изображения, понимает голос и может говорить.
⁃ Умеет генерировать интерфейсы прямо в чате.
⁃ По техническим тестам Gemini лучше ChatGPT 4, но на 3-4% по каждому пункту.
⁃ 13 декабря запустят API.
Заходите в свой аккаунт и переключайтесь на английский язык. Заходим в Бард и проверяем.
Что добавилось?
⁃ Мультимодальность - распознает текст, изображения, понимает голос и может говорить.
⁃ Умеет генерировать интерфейсы прямо в чате.
⁃ По техническим тестам Gemini лучше ChatGPT 4, но на 3-4% по каждому пункту.
⁃ 13 декабря запустят API.
❤🔥10🔥3✍1👍1🙏1💯1👀1
Если бы кто-то пару месяцев назад мне сказал, что я буду писать код - рассмеялся бы ему в лицо.
А сегодня, уже второй день без сна, пишу ИИ-Агента, который сам ведет телеграм канал. Взрыв мозга!
Магическая штука, этот #ChatGPT!
Что уже умеет скрипт:
⁃ забирает информацию с разных площадок
⁃ переосмысливает ее
⁃ публикует свои мысли в телеграм канале
⁃ анализирует то что опубликовал и удаляет непонравившиеся
⁃ анализирует посты за неделю и пишет дайджест с хэштегами
А сегодня, уже второй день без сна, пишу ИИ-Агента, который сам ведет телеграм канал. Взрыв мозга!
Магическая штука, этот #ChatGPT!
Что уже умеет скрипт:
⁃ забирает информацию с разных площадок
⁃ переосмысливает ее
⁃ публикует свои мысли в телеграм канале
⁃ анализирует то что опубликовал и удаляет непонравившиеся
⁃ анализирует посты за неделю и пишет дайджест с хэштегами
👍14🔥11❤3🤯3⚡1✍1❤🔥1👏1💯1💋1💘1
Интересное движение началось. Опенсорсные проекты, такие как Mistral анонсируют свои модели, которые в моментах бьют #GPT4 по показателям.
#Mistral-medium можно использовать по API. А Mistral-small скачать со всеми весами.
Правда, языки в основном европейские поддерживаются.
#Mistral-medium можно использовать по API. А Mistral-small скачать со всеми весами.
Правда, языки в основном европейские поддерживаются.
✍5🔥3❤🔥2❤1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь будем апскейлить все что двигается. Например при помощи #KreaAi удалось узнать как выглядели и чем занимались инопланетяне посетившие Землю.
😁15🤣7🔥3😱3👏1💯1
Я же правда выпал на неделю из реальности. Кодил, разбирался со всякими штуками, типа настройки сервера, запуск приложений, скрипты, пайтон... и знаете, я кайфанул.
#ChaGPT - мой лучший учитель и коуч.
#ChaGPT - мой лучший учитель и коуч.
🔥12👍3💯3❤2🤣2🤓2⚡1❤🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
#Tesla выкатала новую версию своего робота Optimus, Gen 2. На 10 килограмм легче, на 30% быстрее… APPLE, что ты сделал с маркетологами.
Но главная киллерфича, это сенсоры на кончиках пальцев. Его манипуляторы нежнее рук твоей бывшей.
Но главная киллерфича, это сенсоры на кончиках пальцев. Его манипуляторы нежнее рук твоей бывшей.
🔥16😱3⚡2😁2❤1👍1🍾1
Сэм отписал, что все вернули как было. Можно опять регистрироваться в #ChatGPT Plus. Уффф, я так боялся проспать день оплаты.
🔥5👍2❤🔥1❤1😁1
В твиттере вирусится слив возможного апдейта #GPT4.5 - очень похоже на правду.
Интересно, что основная ставка на мультимодальность: видео, 3д и звук. Но про расширение контекстного окна - ничего.
Ну что, будем подождать.
Интересно, что основная ставка на мультимодальность: видео, 3д и звук. Но про расширение контекстного окна - ничего.
Ну что, будем подождать.
🔥5👍3⚡1👏1