Нейромузыка: пошаговое руководство + последняя возможность сделать классные ИИ-песни
В прошлом году мы выпустили ПБА (Первый BIM-альбом), в котором баловались с музыкой, сгенерированной с помощью ИИ. А этой осенью вышел уже ВБА (Второй BIM-альбом), в котором мы переосмыслили подход к написанию песен, а также использовали передовую модель для генерации.
Сегодня на Ростим получил неожиданный вопрос о том, что мы использовали при создании альбома. Рассказываю, как добиться классных результатов с ИИ.
Общая логика: промт — результат
Всё просто: регистрируемся на suno.com , идем в Create. В описании пишем, что хотим услышать. Например, Панк-рок-песня о переходе на BIM. В Inspiration — жанры на английском, через запятую. Жмем Create.
Suno подготовит две версии песни, причем даже на бесплатном аккаунте. Для первого баловства неплохо, но недостаточно для действительно крутых штук.
Детали. Самое сложное — текст
Suno работает бесплатно, но крутой результат дается только в версии v5, она доступна на платной подписке (10 долл. за мес).
Для нормального трека нужно писать текст самому — это самое сложное. В режиме Custom вы указываете текст и жанры (styles). Suno хорошо понимает комбинацию жанров. Например, мы указывали по 5-10 жанров.
Для хита «Правки»:
Я пробовал для текста использовать ChatGPT — с рифмой у него очень плохо. Максимум помог с несколькими метафорами. Когда делали первый альбом, то со стихами и песнями отлично работали модели от Anthropic. Но сейчас от них отдачи тоже не было.
В тексте желательно использовать описания блоков, чтобы Suno понял, как нужно обработать текст. Основные:
[Intro] — вступление
[Chorus] — припев
[Verse _] — куплеты. Вместо подчеркивания указывается номер
[Outro] — заключение
Можно пробовать использовать и другие, указывать пол певца и прочее. Но… Suno не всегда им следует.
Например:
У Suno есть ограничение длительности, после которой он начинает очень плохо генерировать текст. Как я понимаю, то зависит от количества текста, но примерно это около 5 минут. Песню «BIM-звезда» пришлось сокращать — в первоначальном варианте у нас была пара дополнительных куплетов про отношения HR’а проектной компании и крутого BIMщика-блогера.
Классная песня — это очень долго + наслушанность
Получить красивый звук — это лишь вопрос платной подписки Suno и указания жанра.
А сделать классный текст — часы (десятки часов) времени. В среднем на одну песню уходило 5-10 часов времени. На второй альбом ушло почти 27 часов чистого времени (это без перерывов, я отслеживаю своё время) — и сюда не вошло прослушивание результатов.
При этом для результата важна наслушанность. Я обожаю музыку: с детства всё время слушаю, люблю разные жанры. Мне это очень помогало: при прослушивании я понимал, где нужно каких деталей вставить, какую подачу, повторение текста и так далее.
Кайф — лежать на диване, работая над музыкой
Особое удовольствие доставляет возможность буквально заниматься музыкой в постели, с телефона. Например, песня «Жги стандарт» появилась, когда я лег спать, но неожиданно придумал классный мотив. Поработал над текстом, через приложение отправил на генерацию — и вышло огонь (для тех, кто любит тяжёлый рок).
В Suno есть и другие фишки
Возможность слушать музыку других пользователей, крутой редактор, работа с конкретными голосами — но эти инструменты не зацепили. Ради Studio купил максимальную подписку, в итоге всё отлично получилось и так.
Скоро Suno станет хуже — ловите момент
Грустный момент — музыкальные лейблы заставили Suno в следующем году перейти на другую модель генерации, которая обучена только на легальных данных. А это приведет к существенному снижению качества.
🔗 Послушать Второй BIM-альбом на Яндекс Музыке
🔗 Послушать Персый BIM-альбом в Telegram
🔗 Сгенерировать трек в Suno
————————————————
🔗 Канал AV/VC Live
В прошлом году мы выпустили ПБА (Первый BIM-альбом), в котором баловались с музыкой, сгенерированной с помощью ИИ. А этой осенью вышел уже ВБА (Второй BIM-альбом), в котором мы переосмыслили подход к написанию песен, а также использовали передовую модель для генерации.
Сегодня на Ростим получил неожиданный вопрос о том, что мы использовали при создании альбома. Рассказываю, как добиться классных результатов с ИИ.
Общая логика: промт — результат
Всё просто: регистрируемся на suno.com , идем в Create. В описании пишем, что хотим услышать. Например, Панк-рок-песня о переходе на BIM. В Inspiration — жанры на английском, через запятую. Жмем Create.
Suno подготовит две версии песни, причем даже на бесплатном аккаунте. Для первого баловства неплохо, но недостаточно для действительно крутых штук.
Детали. Самое сложное — текст
Suno работает бесплатно, но крутой результат дается только в версии v5, она доступна на платной подписке (10 долл. за мес).
Для нормального трека нужно писать текст самому — это самое сложное. В режиме Custom вы указываете текст и жанры (styles). Suno хорошо понимает комбинацию жанров. Например, мы указывали по 5-10 жанров.
Для хита «Правки»:
emotional, soul, vocal, blues, female vocals
Я пробовал для текста использовать ChatGPT — с рифмой у него очень плохо. Максимум помог с несколькими метафорами. Когда делали первый альбом, то со стихами и песнями отлично работали модели от Anthropic. Но сейчас от них отдачи тоже не было.
В тексте желательно использовать описания блоков, чтобы Suno понял, как нужно обработать текст. Основные:
[Intro] — вступление
[Chorus] — припев
[Verse _] — куплеты. Вместо подчеркивания указывается номер
[Outro] — заключение
Можно пробовать использовать и другие, указывать пол певца и прочее. Но… Suno не всегда им следует.
Например:
[Intro]
[Verse 1]
Ты в офис к нам вошёл проектный,
/тут дальше ваш текст/
[Chorus]
Но снова правки, прав…
У Suno есть ограничение длительности, после которой он начинает очень плохо генерировать текст. Как я понимаю, то зависит от количества текста, но примерно это около 5 минут. Песню «BIM-звезда» пришлось сокращать — в первоначальном варианте у нас была пара дополнительных куплетов про отношения HR’а проектной компании и крутого BIMщика-блогера.
Классная песня — это очень долго + наслушанность
Получить красивый звук — это лишь вопрос платной подписки Suno и указания жанра.
А сделать классный текст — часы (десятки часов) времени. В среднем на одну песню уходило 5-10 часов времени. На второй альбом ушло почти 27 часов чистого времени (это без перерывов, я отслеживаю своё время) — и сюда не вошло прослушивание результатов.
При этом для результата важна наслушанность. Я обожаю музыку: с детства всё время слушаю, люблю разные жанры. Мне это очень помогало: при прослушивании я понимал, где нужно каких деталей вставить, какую подачу, повторение текста и так далее.
Кайф — лежать на диване, работая над музыкой
Особое удовольствие доставляет возможность буквально заниматься музыкой в постели, с телефона. Например, песня «Жги стандарт» появилась, когда я лег спать, но неожиданно придумал классный мотив. Поработал над текстом, через приложение отправил на генерацию — и вышло огонь (для тех, кто любит тяжёлый рок).
В Suno есть и другие фишки
Возможность слушать музыку других пользователей, крутой редактор, работа с конкретными голосами — но эти инструменты не зацепили. Ради Studio купил максимальную подписку, в итоге всё отлично получилось и так.
Скоро Suno станет хуже — ловите момент
Грустный момент — музыкальные лейблы заставили Suno в следующем году перейти на другую модель генерации, которая обучена только на легальных данных. А это приведет к существенному снижению качества.
————————————————
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤7🔥3🎉1😍1
Forwarded from ЛИИС.Формика
Media is too big
VIEW IN TELEGRAM
Как мы озвучили в нашем недавнем подкасте «Все держится на людях, делается людьми и для людей». Этим постом мы передаем самые искренние и добрые слова от команды ЛИИС.Формики и авторов экспертных каналов:
Let’s manage #BIM
Игорь Рогачев
@gip2gip
Бедовая
Игорь Кузьмин
Звонарева Онлайн и Буквами о цифре
Balobanius
BIMSERT
Vysotskiy Consulting
CIVIL 3D Expert и InfraBIM.Pro
Офисная среда
Заметки ГИПа
Ольга Светлова
И, конечно, большое спасибо каждому специалисту, который нашел время и поделился своей экспертизой, всем ведущим (кто посчитает, сколько их было), монтажерам, операторам, менеджерам и дизайнерам. Накидайте милых стикеров в комментариях, им будет приятно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥6👍3🕊2❤🔥1🥰1
Почему отели дороже жилья — получил книгу с автографом автора
Мы выстраиваем процессы в компаниях, внедряем современные инструменты (BIM, ИИ), но непосредственно не проектируем.
Сергей Веселов, основатель Development Systems, недавно выпустил книгу «Почему отели дороже жилья». Сейчас DS #1 в России по проектированию отелей.
Сергей так интересно рассказывает про нюансы проектирования на своём канале veselov_ds, что я не смог удержаться и попросил прислать его книгу и мне.
Было неожиданно и очень приятно получить её с личным автографом автора)
Как прочитаю — с удовольствием тоже поделюсь отзывом!
Мы выстраиваем процессы в компаниях, внедряем современные инструменты (BIM, ИИ), но непосредственно не проектируем.
Сергей Веселов, основатель Development Systems, недавно выпустил книгу «Почему отели дороже жилья». Сейчас DS #1 в России по проектированию отелей.
Сергей так интересно рассказывает про нюансы проектирования на своём канале veselov_ds, что я не смог удержаться и попросил прислать его книгу и мне.
Было неожиданно и очень приятно получить её с личным автографом автора)
Как прочитаю — с удовольствием тоже поделюсь отзывом!
❤12👍12🔥4
С аншлагом завершил первый поток курса по нейросетям для проектных задач в Signy Group
Я работаю с ИИ с 2023 года и хорошо вижу разрыв между ожиданиями рынка и реальностью. Многие до сих пор ждут кнопку «запроектировать хорошо»(а лучше сразу «пройти экспертизу с первого раза») . Этой кнопки нет, и думаю в ближайшее время не появится.
Но есть вопрос поважнее: самый сложный момент в работе с ИИ — не просто выбор нейросети и не правильные промпты. Самый сложный момент — первый контакт. Понять, где именно ИИ реально усиливает проектировщика, а где остаётся игрушкой с галлюцинациями.
Именно это мы и проверяли на курсе,без магии и без маркетинга (в некоторые моменты магия реально была).
Уже с первых занятий участники начали применять ИИ в живых проектных задачах: быстрее играть с проектными решениями по запросу заказчика, разбирать и анализировать документы, автоматически вытаскивать задачи из встреч. А на финале — обсуждали, каким вообще может быть корпоративный ИИ-ассистент внутри проектной компании.
Самое приятное — даже скептики к концу курса нашли для себя рабочие сценарии. Не «ИИ вместо человека», а ИИ рядом с человеком, снимающий рутину и ускоряющий мышление.
Сейчас готовим подробный кейс, в начале февраля выложим его в официальном канале.
Я работаю с ИИ с 2023 года и хорошо вижу разрыв между ожиданиями рынка и реальностью. Многие до сих пор ждут кнопку «запроектировать хорошо»
Но есть вопрос поважнее: самый сложный момент в работе с ИИ — не просто выбор нейросети и не правильные промпты. Самый сложный момент — первый контакт. Понять, где именно ИИ реально усиливает проектировщика, а где остаётся игрушкой с галлюцинациями.
Именно это мы и проверяли на курсе,
Уже с первых занятий участники начали применять ИИ в живых проектных задачах: быстрее играть с проектными решениями по запросу заказчика, разбирать и анализировать документы, автоматически вытаскивать задачи из встреч. А на финале — обсуждали, каким вообще может быть корпоративный ИИ-ассистент внутри проектной компании.
Самое приятное — даже скептики к концу курса нашли для себя рабочие сценарии. Не «ИИ вместо человека», а ИИ рядом с человеком, снимающий рутину и ускоряющий мышление.
Сейчас готовим подробный кейс, в начале февраля выложим его в официальном канале.
🔥18❤12🎉7👍2
Случайно написал ТГ-бота, который расшифровывает голосовые и присылает краткое содержание
Когда начал первые потоки курса по нейросетям, то по закону Мёрфи мой любимый бот Jill White, которым я расшифровывал голосовые (и о котором рассказывал на курсе), перестал работать.
А на этой неделе заканчивал курс по ИИ в корпорации ИРБИС — на последнем занятии знакомились с вайб-кодингом и нейтеном (n8n).
И когда готовился, то «случайно» написал своего такого же бота — который сразу завёлся и работает.
Пока живёт на демо-площадке в n8n, но отлично работает. Расшифровка через API ChatGPT.
В теории в n8n расшифрованные сообщения я могу увидеть, но побаловаться пока можно: @n8n_test_vc_bot
Когда начал первые потоки курса по нейросетям, то по закону Мёрфи мой любимый бот Jill White, которым я расшифровывал голосовые (и о котором рассказывал на курсе), перестал работать.
А на этой неделе заканчивал курс по ИИ в корпорации ИРБИС — на последнем занятии знакомились с вайб-кодингом и нейтеном (n8n).
И когда готовился, то «случайно» написал своего такого же бота — который сразу завёлся и работает.
Пока живёт на демо-площадке в n8n, но отлично работает. Расшифровка через API ChatGPT.
В теории в n8n расшифрованные сообщения я могу увидеть, но побаловаться пока можно: @n8n_test_vc_bot
🔥11👍4😍1
Отличная 4K веб-камера за смешные деньги
В VC мы используем три вида/категории веб-камер:
— Logitech C922 Pro Stream (6-8 тыс. руб), нормальная FullHD камера. Стояла на большинстве ПК. Также Предоставляли её авторам курсов для записи.
— Logitech BRIO 4K (12-15 тыс. руб) отличная камера для качественной съемки на ВКС. Даже писали на неё курс «Основы BIM/ТИМ. Ключевые принципы».
— Профессиональная камера Sony A6000, сейчас основной инструмент для записи курсов. Иногда через неё проводим особо важные ВКС.
Подробнее про технику VC писал тут.
Несмотря на любовь к Logitech, недавно открыл для себя отличную 4K веб-камеру от UGREEN, неплохого китайского бренда. За 2-3 тысячи рублей она даёт качество, сопоставимое с Logitech BRIO 4K.
Поставил эти камеры на основной части ПК в офисе, а также дома. Если ищете отличную и недорогую вебку, то рекомендую.
Ссылка на официальный магазин, где сейчас она стоит 2 300 руб.: https://ali.click/jxuuz7
В VC мы используем три вида/категории веб-камер:
— Logitech C922 Pro Stream (6-8 тыс. руб), нормальная FullHD камера. Стояла на большинстве ПК. Также Предоставляли её авторам курсов для записи.
— Logitech BRIO 4K (12-15 тыс. руб) отличная камера для качественной съемки на ВКС. Даже писали на неё курс «Основы BIM/ТИМ. Ключевые принципы».
— Профессиональная камера Sony A6000, сейчас основной инструмент для записи курсов. Иногда через неё проводим особо важные ВКС.
Подробнее про технику VC писал тут.
Несмотря на любовь к Logitech, недавно открыл для себя отличную 4K веб-камеру от UGREEN, неплохого китайского бренда. За 2-3 тысячи рублей она даёт качество, сопоставимое с Logitech BRIO 4K.
Поставил эти камеры на основной части ПК в офисе, а также дома. Если ищете отличную и недорогую вебку, то рекомендую.
Ссылка на официальный магазин, где сейчас она стоит 2 300 руб.: https://ali.click/jxuuz7
👍14🔥10❤5
Провели «Проектный бар». Впереди — ТИМИ СПб и BIMAC
На прошлой неделе вместе с Геннадием Владимировичем Киркиным, президентом ГК ИРБИС, провели «Проектный бар 18», посвящённый искусственному интеллекту. О самой серии мероприятий «Проектный бар» мы уже не раз рассказывали на канале VC.
Здесь хочу отдельно отметить другое: сильное мероприятие — это не всегда про громкий маркетинг и «максимальные охваты». У «Проектного бара» иная идеология: закрытый клубный формат, без классических докладов, но с возможностью спокойно и предметно обсудить действительно важные вопросы, обменяться опытом и посмотреть на тему с разных сторон.
Для меня особенно ценно, что в этот раз я участвовал не только как спикер и ведущий, но и каксоучастник соорганизатор. Вместе с командой ГК ИРБИС мы сформировали темы, собирали структуру вечера, продумали активности и подготовили подарки участникам (плакаты по ИИ получились огонь).
Формат сильный, и я его искренне рекомендую. Анонсы следующих «Проектных баров» будут на основном канале VC. Напомню, что мероприятие закрытое, ориентировано на собственников и первых лиц, поэтому в Едином календаре его нет.
Но если вам интересен такой формат — напишите мне в личные сообщения пару слов о себе. При необходимости передам информацию в ИРБИС.
А в апреле у меня сразу два важных мероприятия в Санкт-Петербурге.
24 апреля — ведущий на ТИМИ СПб
Во второй раз выступлю ведущим конференции, посвящённой решениям ГК СиСофт и практике их применения.
Для меня это особенно ценно ещё и потому, что наша команда сейчас активно взаимодействует с ГК СиСофт и участвует в развитии их решений: ранее мы проводили обучение для реселлеров (кейс), а сейчас завершаем разработку Стандарта по работе в Model Studio CS и CADLib.
— Сайт ТИМИ 26: Санкт-Петербург
— Событие в календаре
27–30 апреля — модератор на BIMAC
Снова буду вести секции в рамках большой конференции СПбГАСУ. На мой взгляд, команда BIMAC делает действительно сильное и масштабное отраслевое мероприятие.
В этом году я буду модерировать секцию по искусственному интеллекту, а также часть треков, связанных с образованием.
Так что, если будете в Петербурге в эти даты — приходите. Будет содержательно и интересно.
— Сайт BIMAC 2026
— Событие в календаре
На прошлой неделе вместе с Геннадием Владимировичем Киркиным, президентом ГК ИРБИС, провели «Проектный бар 18», посвящённый искусственному интеллекту. О самой серии мероприятий «Проектный бар» мы уже не раз рассказывали на канале VC.
Здесь хочу отдельно отметить другое: сильное мероприятие — это не всегда про громкий маркетинг и «максимальные охваты». У «Проектного бара» иная идеология: закрытый клубный формат, без классических докладов, но с возможностью спокойно и предметно обсудить действительно важные вопросы, обменяться опытом и посмотреть на тему с разных сторон.
Для меня особенно ценно, что в этот раз я участвовал не только как спикер и ведущий, но и как
Формат сильный, и я его искренне рекомендую. Анонсы следующих «Проектных баров» будут на основном канале VC. Напомню, что мероприятие закрытое, ориентировано на собственников и первых лиц, поэтому в Едином календаре его нет.
Но если вам интересен такой формат — напишите мне в личные сообщения пару слов о себе. При необходимости передам информацию в ИРБИС.
А в апреле у меня сразу два важных мероприятия в Санкт-Петербурге.
24 апреля — ведущий на ТИМИ СПб
Во второй раз выступлю ведущим конференции, посвящённой решениям ГК СиСофт и практике их применения.
Для меня это особенно ценно ещё и потому, что наша команда сейчас активно взаимодействует с ГК СиСофт и участвует в развитии их решений: ранее мы проводили обучение для реселлеров (кейс), а сейчас завершаем разработку Стандарта по работе в Model Studio CS и CADLib.
— Сайт ТИМИ 26: Санкт-Петербург
— Событие в календаре
27–30 апреля — модератор на BIMAC
Снова буду вести секции в рамках большой конференции СПбГАСУ. На мой взгляд, команда BIMAC делает действительно сильное и масштабное отраслевое мероприятие.
В этом году я буду модерировать секцию по искусственному интеллекту, а также часть треков, связанных с образованием.
Так что, если будете в Петербурге в эти даты — приходите. Будет содержательно и интересно.
— Сайт BIMAC 2026
— Событие в календаре
❤12🔥3👏1
Бояться нужно не ИИ, а роботов под его управлением
Сегодня все массово обсуждают анализ риска замены вас нейросетью от Андрея Карпаты.
Если совсем вкратце — почти все цифровые профессии в зоне риска (КЭП), а «аналоговые» — почти нет:
— проект Андрея Карпаты;
— объяснение на русском.
Но на мой взгляд риски не в ИИ, а рое роботов под его управлением.
Параллельно с исследованием рынка труда от Карпаты вышло несколько интересных новостей:
— Илон Маск планирует выпускать 10 млн. роботов в год на новом заводе. А заводов может быть несколько, и по сути сейчас даже рынка сбыта почти нет. То есть в будущем темпы создания будут могут быть кратно выше.
— Современное оборудование слабо защищено от взлома. Понятно, что у Tesla с безопасностью должно быть нормально, но ведь есть и другие производители роботов.
— И забавно, что аресты роботов уже пошли, хотя это пока скорее забавно.
Возвращаясь к теме анализа рынка труда — то в человеческих сценариях роботы тоже нас заменят, потому что обученный гуманоидный робот (то есть у которого есть руки и ноги) может делать всё, что делает человек.
То есть, как я писал в прошлом году, сначала пойдём по сценарию «Я, робот», потом — «Терминатор», а там и до «Матрицы» недалеко.
Сегодня все массово обсуждают анализ риска замены вас нейросетью от Андрея Карпаты.
Если совсем вкратце — почти все цифровые профессии в зоне риска (КЭП), а «аналоговые» — почти нет:
— проект Андрея Карпаты;
— объяснение на русском.
Но на мой взгляд риски не в ИИ, а рое роботов под его управлением.
Параллельно с исследованием рынка труда от Карпаты вышло несколько интересных новостей:
— Илон Маск планирует выпускать 10 млн. роботов в год на новом заводе. А заводов может быть несколько, и по сути сейчас даже рынка сбыта почти нет. То есть в будущем темпы создания будут могут быть кратно выше.
— Современное оборудование слабо защищено от взлома. Понятно, что у Tesla с безопасностью должно быть нормально, но ведь есть и другие производители роботов.
— И забавно, что аресты роботов уже пошли, хотя это пока скорее забавно.
Возвращаясь к теме анализа рынка труда — то в человеческих сценариях роботы тоже нас заменят, потому что обученный гуманоидный робот (то есть у которого есть руки и ноги) может делать всё, что делает человек.
То есть, как я писал в прошлом году, сначала пойдём по сценарию «Я, робот», потом — «Терминатор», а там и до «Матрицы» недалеко.