Силиконовый Мешок
18.4K subscribers
703 photos
235 videos
20 files
670 links
Как заработать 💸 на Искусственном Интеллекте уже сегодня. Написать мне @artem_subbotin

Чат канала: @prompt_chat
Download Telegram
Разобрался сегодня с нейронкой, которая позволяет создавать дипфейки -
FaceFusion.

За пару часов #ChatGPT научила меня разворачивать проект из докера и настраивать среду разработки.

Еще раз напоминаю - я не программист, не знаю ни одного языка программирования.
🔥123👍3👏2🤯2😱1💯1
Рассказать, как такие дипфейки с изменением лица и голоса, делать бесплатно?

Давайте соберем 100 🔥- а я пока подготовлю материал.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥132👍2👏2💯2🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
#KreaAi сделали прикольный апскейл, можно апгрейдить свою Лару с PS1
🔥72😁1🌭1💯1🍌1💅1
Силиконовый Мешок
#KreaAi сделали прикольный апскейл, можно апгрейдить свою Лару с PS1
This media is not supported in your browser
VIEW IN TELEGRAM
За выходные технологии немного улучшились. Скоро так везде будет, в пятницу у тебя был просто орущий кот, а в понедельник при помощи "нейропереводчика" ты узнаешь от него много неприятных деталей о себе.
😁14🔥52❤‍🔥1👍1💯1
Силиконовый Мешок
Рассказать, как такие дипфейки с изменением лица и голоса, делать бесплатно? Давайте соберем 100 🔥- а я пока подготовлю материал.
Вы набрали сто реакций, с меня инструкция, как делать дипфейки:

Что нам понадобится:
1. Whisper - модель от #OpenAI для перевода голоса в текст, хотя можно и руками если немного
2. Elevenlabs - для клонирования голоса и озвучивания. Можете и бесплатную модель использовать
3. FaceFusion - для дипфейка лица.
4. CapCut или любой другой видеоредактор.

Первым делом нужно раздобыть образцы голоса и фото лица. Хорошо если личность известная, как Сергей, хватит одного интервью. Качаем ролик из YouTube, отделяем звуковую дорожку и нарезаем ее кусками по 10 мегабайт - больше в Elevenlabs не влазит.

Ну и самый сложный для меня, как не программиста, этап - установка FaceFusion. Но оказалось, что все не так уж и страшно. Если у вас нет терминала, то нужно поставить его и запустить следующую команду:


git clone https://github.com/facefusion/facefusion.git

cd facefusion

python -m venv venv

venv\Scripts\activate.bat

python install.py

python run.py


Дальше открываем https://127.0.0.1 и видим удобный и интуитивный интерфейс для создания дипфейков. Если не понятны предназначения каких-то кнопок, советую воспользоваться: https://docs.facefusion.io/ - там очень подробная документация.

Теперь у нас есть видео и голос. Совмещаем все это в видеоредакторе, если есть желание можете заморочиться с липсинком, например использовать эту модель https://huggingface.co/spaces/manavisrani07/gradio-lipsync-wav2lip

А для чего же был нужен Whisper? Его можно использовать для расшифровки речи, чтобы не набирать руками текст для синтезированного голоса в Elevenlabs’е.
🔥7👍522🙏2
Как развивались нейросети "text-to-image" за последние десять лет:

- 2014: "Это никогда не заработает"
- 2021: "По-прежнему совершенно бесполезно"
- 2023: "Я зарабатываю 10 тысяч в месяц на OnlyFans"
😁8👍2💯2🤯1🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера не постил ничего, весь день писал сервис, который позволяет наполнять телеграм канал тематическим контентом.

Все работает, осталось поработать с #промпт'ами и источниками.

Рассказывать подробности? 🔥- кидайте, если да.
🔥914👍4
Силиконовый Мешок
Вчера не постил ничего, весь день писал сервис, который позволяет наполнять телеграм канал тематическим контентом. Все работает, осталось поработать с #промпт'ами и источниками. Рассказывать подробности? 🔥- кидайте, если да.
Завел тестовый канал @aimamochka - пытаюсь подобрать формат контента, который создает ИИ-Агент на основе постов с Reddit'а. Сейчас вот тестирую публикацию постов только эмодзи.

Пишите в комменты ваши мысли.
👍21🙏1💯1💋1👀1👾1
#Google зарелизили свою модель - #Gemini - го, тестить!


Заходите в свой аккаунт и переключайтесь на английский язык. Заходим в Бард и проверяем.

Что добавилось?
⁃ Мультимодальность - распознает текст, изображения, понимает голос и может говорить.
⁃ Умеет генерировать интерфейсы прямо в чате.
⁃ По техническим тестам Gemini лучше ChatGPT 4, но на 3-4% по каждому пункту.
⁃ 13 декабря запустят API.
❤‍🔥10🔥31👍1🙏1💯1👀1
Если бы кто-то пару месяцев назад мне сказал, что я буду писать код - рассмеялся бы ему в лицо.

А сегодня, уже второй день без сна, пишу ИИ-Агента, который сам ведет телеграм канал. Взрыв мозга!

Магическая штука, этот #ChatGPT!

Что уже умеет скрипт:
⁃ забирает информацию с разных площадок
⁃ переосмысливает ее
⁃ публикует свои мысли в телеграм канале
⁃ анализирует то что опубликовал и удаляет непонравившиеся
⁃ анализирует посты за неделю и пишет дайджест с хэштегами
👍14🔥113🤯311❤‍🔥1👏1💯1💋1💘1
Интересное движение началось. Опенсорсные проекты, такие как Mistral анонсируют свои модели, которые в моментах бьют #GPT4 по показателям.

#Mistral-medium можно использовать по API. А Mistral-small скачать со всеми весами.

Правда, языки в основном европейские поддерживаются.
5🔥3❤‍🔥21🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь будем апскейлить все что двигается. Например при помощи #KreaAi удалось узнать как выглядели и чем занимались инопланетяне посетившие Землю.
😁15🤣7🔥3😱3👏1💯1
Я же правда выпал на неделю из реальности. Кодил, разбирался со всякими штуками, типа настройки сервера, запуск приложений, скрипты, пайтон... и знаете, я кайфанул.

#ChaGPT - мой лучший учитель и коуч.
🔥12👍3💯32🤣2🤓21❤‍🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
#Tesla выкатала новую версию своего робота Optimus, Gen 2. На 10 килограмм легче, на 30% быстрее… APPLE, что ты сделал с маркетологами.

Но главная киллерфича, это сенсоры на кончиках пальцев. Его манипуляторы нежнее рук твоей бывшей.
🔥16😱32😁21👍1🍾1
Сэм отписал, что все вернули как было. Можно опять регистрироваться в #ChatGPT Plus. Уффф, я так боялся проспать день оплаты.
🔥5👍2❤‍🔥11😁1
Самый важный вопрос дня. Да что там дня, года!
🤣11🔥5❤‍🔥1👍1😁1🤡1💯1🎅1🤪1
В твиттере вирусится слив возможного апдейта #GPT4.5 - очень похоже на правду.

Интересно, что основная ставка на мультимодальность: видео, 3д и звук. Но про расширение контекстного окна - ничего.

Ну что, будем подождать.
🔥5👍31👏1