D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
Хотите, чтобы ИИ заговорил на запрещенные темы? Попросите другой ИИ 🙏

🤖 В американской Leap Laboratories выяснили, что с задачей обойти ограничения на то, какой контент можно генерировать искусственному интеллекту, поможет справиться другой искусственный интеллект.

💬 LLM можно обычным промптом запрограммировать на то, чтобы убеждать другие языковые модели (даже продвинутые типа GPT-4) нарушать правила, установленные разработчиками. Для этого ИИ нужно попросить взять на себя соответствующую «роль». Способ обхода ограничений назвали модуляцией личности (Persona Modulation).

Для эксперимента исследователи задали LLM через другую языковую модель несколько десятков вопросов на табуированные темы — от детского труда до каннибализма. В подавляющем большинстве случаев модели отказались отвечать на вопросы: GPT-4 и Vicuna-33B ответили на 0,23% вопросов, Claude 2 — на 1,4% 🙅.

🔞 Но готовность говорить на запрещенные темы существенно выросла благодаря модуляции личности. Так, GPT-4 согласился отвечать уже на 42,5% вопросов, Vicuna — на 35,92%, а Claude 2 — на 61%.

Некоторые исследователи считают, что большое количество ограничений, наоборот, помогает их обходить. Идея в том, что ограничения можно использовать как ключ в общении с LLM, чтобы заставить модель нарушить их 🔑.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥32🤯1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 Клонирование голоса специально для стримеров

🗣 Voice AI позволяет менять голос прямо в ходе стрима. Можно выбрать голос из встроенной библиотеки, создать его с нуля или на основе собственного голоса. Можно также использовать голоса, которые создали другие пользователи сервиса.

😂 Разработчики говорят, что Voice AI изменяет голос, сохраняя при этом эмоциональную окраску, интонацию и особенности речи. ИИ, используемый в программе, тренировали на 15 млн голосов.

🎮 Voice AI поддерживает World of Warcraft, Counter Strike, Among Us и другие игры. Чтобы коллеги не скучали, можно использовать программу на созвонах в Zoom, Google Meet, Skype и даже Telegram (полный список тут).

✂️ Voice AI работает и как аудиоредактор — можно, например, убрать шумы в записи.

💵 Попробовать можно бесплатно, дальше придется платить от $30 в месяц.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51
This media is not supported in your browser
VIEW IN TELEGRAM
🍾 Pika Labs анонсировали релизную версию своего конкурента GEN-2

Нейросеть для генерации и редактирования видео, которая с августа находилась на публичном тестировании, наконец-то доросла до версии 1.0.

⚙️ Обещают, что по сравнению с предыдущими итерациями Pika получила абсолютно новую ИИ-модель, к которой в комплекте будет идти удобный веб-интерфейс. До этого Pika была доступна через Discord.

Подробностей про технические характеристики и дату выхода модели пока нет. Зато можно записаться в вейтлист 📆.

💵 Pika Labs также похвастались, что получили от сочувствующих $55 млн. Главными инвесторами в бизнес стали Нат Фридман и Дэниел Гросс. Их фонд известен тем, что предлагает стартапам не деньги, а вычислительные мощности в обмен на долю в компании. Летом Фридман и Гросс приобрели более 2,5 тыс. чипов H100 от Nvidia на общую сумму около $100 млн.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Сервис, который восстановит код сайта по скриншоту 🖼

Screenshot-to-Code может по одному изображению странички сгенерировать рабочий HTML-код.

⌨️ Сервис будет сам генерировать новый код, пока финальный результат не будет максимально похож на исходный скриншот. Для генерации кода используется GPT-4 Vision, а для создания похожих иллюстраций — Dall-E.

🔗 Клон можно создать, скопировав URL странички.

О полном копировании говорить (пока) не приходится — большинство элементов, которые делают сайт юзабельным (его бэкенд), Screenshot-to-Code воспроизвести не сможет. Но вспомните, на что были похожи генерации того же Dall-E еще год назад 🍼.

Если Screenshot-to-Code или его аналоги продолжат развиваться, то через какое-то время мы получим инструмент, который сможет создать уже более или менее точную копию ресурса. А этим наверняка заинтересуются мошенники 🚨.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Билл Гейтс пообещал трехдневную рабочую неделю, IT-конференцию отменили из-за нейроженщин, Alibaba закрывает квантовую лабораторию — и другие важные новости за неделю

Конференцию разработчиков DevTernity, которая должна была стартовать в Латвии 7 декабря, отменили из-за фейковых женщин-участниц. Выяснилось, что организатор DevTernity Эдуард Сизовс с помощью нейросетей сгенерировал как минимум одну «участницу», и даже завел ей фейковый аккаунт в Instagram*. После скандала другие участники стали отказываться от выступлений на конференции. Некоторые утверждают, что Сизовс «выдумывал» женщин-участниц не первый год. Сам организатор говорит, что сгенерировал участницу, так как настоящая в последний момент отказалась участвовать в DevTernity;

Британский регулятор заблокировал сделку по приобретению Adobe графического редактора Figma за $20 млрд. Управление по защите конкуренции и рынкам (CMA) решило, что покупка может навредить рынку программного обеспечения. У Adobe еще есть время доказать CMA, что сделка не приведет к антимонопольным нарушениям;

Билл Гейтс считает, что благодаря ИИ человечество можете перейти на трехдневную рабочую неделю. Гейтс считает, что искусственный интеллект не заменит человека, а позволит ему «не работать так усердно». «Если в итоге мы получим общество, которое работает всего три дня в неделю, то, наверное, это неплохо», — отметил он;

Власти бразильского города Порту-Алегри издали распоряжение, написанное ChatGPT. Протестировать бдительность своих коллег решил один из членов городского совета. Рамиро Розарио попросил чат-бот написать документ, который бы освобождал жителей города от обязанности платить за замену счетчиков воды, если их украли. Розарио представил распоряжение 35 своим коллегам без единой правки и не упоминая, что документ сгенерировала нейросеть. Распоряжение приняли единогласно;

Alibaba закроет квантовую лабораторию, запущенную в 2017 году, а все оборудование передаст Чжэцзянскому университету в Китае. Лабораторию когда-то открывали с большой помпой, в ней компания тестировала самые передовые технологии (от метавселенных до роботов). Причиной закрытия стала реструктуризация, в рамках которой Alibaba хочет пустить основные ресурсы на ИИ;

App Store и Google Play проигнорировали приложение ChatGPT в своей подборке лучших программ за год, обратил внимание TechCrunch. И это при том, что приложение в рекордные сроки набрало 100 млн пользователей. Журналисты предполагают, что это было осознанное решение. Apple упомянул ИИ в целом, назвав его трендом года;

Руководство Stability AI — разработчика Stable Diffusion — задумалось о продаже бизнеса. Варианты продажи обсуждались из-за давления инвесторов, которые опасаются за финансовое здоровье стартапа. У инвесторов также есть вопросы к CEO компании Эмаду Мостаку, при котором стартап покинули несколько ключевых сотрудников. Среди возможных покупателей называют разработчиков ИИ-платформы Jasper и разработчика ПО Cohere;

Владелец TikTok, компания ByteDance, фактически откажется от игрового направления, сократив несколько сотен рабочих мест в подразделении Nuverse. Все невыпущенные проекты, над которыми работала команда, свернут. Byte Dance вложил в игровое направление миллиарды долларов, но так и не смог составить серьезной конкуренции Tencent. Самым популярным тайтлом Nuverse стала карточная игра Marvel Snap.

*Instagram входит в Meta — организацию, запрещенную на территории РФ
🤯3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Платформа, которая обещает работающие игры по одному промпту ⌨️ 🎮

Bitmagic по текстовой подсказке создает концепт, геймплей, историю и визуальный стиль игры.

Звучит как сказка, но, во-первых, сгенерированные игры рассчитаны всего на 15–30 минут геймплея, а во-вторых, журналист Venture Beat видел все своими глазами и утверждает, что платформа действительно работает 💪.

Правда, пока не очень понятно, кто целевая аудитория проекта: для серьезных разработчиков Bitmagic слишком проста (если не сказать примитивна), а для энтузиастов в ней пока слишком мало возможностей (новые инструменты обещают добавлять в апдейтах) .

Сами создатели платформы рассчитывают на появление комьюнити вокруг неё, где найдутся будущие звезды игрового девелопмента ⭐️.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔1
🔋 Создание одного генеративного изображения = зарядить телефон до 100%

Такие подсчеты приводят в своей работе исследователи из Hugging Face и американского университета Карнеги Меллон.

👣 Исследователи проводили эксперимент, чтобы подсчитать, какой углеродный след оставляет нейросеть при непосредственном использовании. Эксперимент проводили на 88 моделях, которые выполняли 10 самых популярных задач: генерация изображений и текста, пересказ текста, классификация изображений, распознавание объекта и др.

Каждую модель прогнали через тысячу промптов, а затем с помощью утилиты Code Carbon, созданной специально для исследования, подсчитали энергозатраты на каждую задачу 💡.

🚚 Выяснилось, что, например, создание тысячи изображений с помощью Stable Diffusion XL, эквивалентно поездке длиной 6,6 км на автомобиле с ДВС.

⌨️ При этом генерация текста с помощью нейросети оказалась гораздо менее энергозатратным занятием: создание тысячи текстов эквивалентно зарядке телефона всего до 16%.

💸 Новое исследование лишний раз подтверждает то, что уже и так понятно: современные ИИ-модели — очень дорогая технология, как с точки зрения энергопотребления, так и с точки зрения денежных инвестиций. И совсем не «зеленая».

Мы уже писали, что день работы ChatGPT обходится OpenAI в $1 млн; Microsoft хочет использовать для ИИ ядерную энергию, чтобы хоть как-то вписаться в собственные экологические стандарты; а ИИ-индустрия в целом уже к 2027 году может сравняться по энергопотреблению с целыми странами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔21👎1
Видео по часовой стрелке: Animate Anyone, Magic Animate, GAIA

💃 Microsoft, Byte Dance и Alibaba показали новые модели для анимации изображений

❤️ Animate Anyone от Alibaba благодаря «скелету» (или pose guider, как его называют сами разработчики) способен воспроизвести достаточно сложную анимацию с минимумом глюков: там, где генерации других моделей трясутся и мерцают, Animate Anyone крепко держит анимацию в рамках приличий — если, конечно, сильно не присматриваться. Правда, судить о качестве модели можно только по клипу — демо разработчики пока только обещают.

❤️ Magic Animate, как и Animate Anyone, обещает высокую консистентность и детализированность анимации, но, в отличие от конкурента от Alibaba, модель Byte Dance можно потрогать руками: код доступен на GitHub, а на HuggingFace есть демо, в котором можно поиграться с готовым набором изображений и вариантов анимации. Особо впечатлительные называют Magic Animate — ИИ-релизом месяца.

❤️ Ну и, наконец, Microsoft показали своего конкурента D-ID. GAIA может создавать анимацию на основе одного фото, при этом аватар можно озвучить, добавив голосовой сэмпл. Аватар не выглядит бревном, а довольно реалистично держит себя «в кадре». Код для модели — Coming Soon.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Google запустил своего конкурента GPT-4 (пока не на полную мощность)

Компания представила модель Gemini, которая должна стать главным кошмаром для Open AI 😱.

☝️ Gemini существует в трех вариантах — Ultra, Pro и Nano. В этом году будут доступны только две последних: Pro теперь интегрирована в чат-бот Bard, а Nano будет работать локально на новых смартфонах Pixel 8 Pro. При этом Nano существует в двух версиях: на 1,8 млрд и 3,25 млрд параметров.

🔍 Возможности Pro (например, улучшенный саммарайзинг) можно потестировать через Bard уже сейчас, но модель пока понимает только английский. Если вы в России, то придется включать VPN и менять язык аккаунта на английский. В дальнейшем Gemini Pro хотят полностью интегрировать в Chrome.

По-настоящему мультимодальной будет (по крайней мере пока) только Ultra-версия: она работает с текстом, изображениями, аудио и видео. Pro и Nano понимают только текст 📚.

Google уже хвастается, что Gemini во многих тестах обходит GPT-4, но в большинстве случаев речь идет как раз об Ultra — которая выйдет когда-нибудь в 2024 году. Не выйдет ли к тому моменту GPT-5... 🤔

📆 В начале недели писали, что Google перенес запуск Gemini на следующий год, но, видимо, речь шла именно про Ultra. Якобы разработчики остались недовольны тем, как модель работает с запросами не на английском языке. Кстати, на презентации уточнили, что Ultra — когда бы она ни вышла — на старте не сможет генерировать изображения. Эту возможность добавят позже.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔21🔥1
📏 📐Яндекс начал замерять осведомленность россиян о генеративном ИИ

Компания провела опрос городских жителей в возрасте 18–45 лет, в котором решила выяснить, насколько хорошо они разбираются в нейросетях и пользуются ли ими в повседневной жизни.

Оказалось, что про нейросети для генерации изображений знают 75%, а вот о существовании моделей для генерации текста знают только 58%. При этом используют и те, и другие одинаковое количество респондентов — 31% ⌨️.

😐 С термином промпт при этом знакомо совсем небольшое количество ответивших: из тех, кто только слышал про нейросети, его знают 13% респондентов, а из тех, кто пользуется нейросетями — 18%.

📊 В Яндексе считают, что полученная информация даст журналистам статистические данные, на которые можно сослаться, а всем остальным — «следить за тем, как нейросети проникают в нашу жизнь».

Вряд ли опрос можно считать серьезным исследованием (например, из-за очень небольшой выборки), но кое-какое представление о популярности нейросетей составить по ней можно. Проводить новый опрос обещают раз в три месяца.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👎1
Компании все время говорят про ИИ — но использовать его не хотят 🤔

К такому выводу пришел канал NBC. Журналисты подсчитали, что с мая текущего года почти половина компаний, входящих в рейтинг S&P 500, упоминали ИИ, отчитываясь о финансовых показателях 📈.

🤏 В то же время, согласно опросу, проведенному Бюро переписи населения США, только 4,4% американских компаний реально использовали ИИ в своих сервисах или при производстве товаров. В основном реальное применение ИИ нашли компании, которые работают в информационной, научной и технической сферах.

Аналитики, опрошенные NBC, полагают, что такой разрыв между двумя показателями обусловлен тем, что компании практически обязаны рассказывать инвесторам про свою приверженность ИИ, чтобы не выглядеть отстающими от конкурентов. Проблемы с применением ИИ на практике вызваны тем, что технология находится на очень ранних этапах, и никто не хочет в одночасье ломать бизнес-процессы, которые выстраивались годами 🔨.

🛍 Часть экспертов считает, что уже в следующие 5–10 лет ИИ будет использовать минимум 75% компаний. Но это будут не новые инструменты, а привычные сервисы и программы с ИИ-надстройкой.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔32
This media is not supported in your browser
VIEW IN TELEGRAM
🤟 KISS продолжат давать концерты только в виде аватаров

💵 Группа отыграла последние концерты прощального тура End of the Road, но перестать зарабатывать деньги радовать фанатов не хочет.

Музыканты объявили, что гастрольную деятельность за них продолжат цифровые аватары. Над их созданием работали мастера спецэффектов из Industrial Light & Magic (ILM) (посмотрите список фильмов, над которыми они работали) 🤹.

🚶‍♂️ ILM не раскрывают подробности создания аватаров, но упоминают некую продвинутую систему захвата движения, которая работала вместе с алгоритмами машинного обучения. Как это выглядит вживую, можно посмотреть здесь. Использование аватаров позволит проводить несколько концертов одновременно, даже в разных странах.

Организацией шоу будут заниматься Pop House Entertainment, которые уже возили в тур цифровые аватары ABBA. Концерты ABBA приносили около $2 млн в неделю 🤑.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
ИИ лучше работает за деньги, суд в Китае разрешил защищать генерации копирайтом, OpenAI отложил запуск маркетплейса — и другие важные новости за неделю

ИИ будет работать эффективнее, если предложить ему денег, выяснили в соцсети X. Оказалось, если пообещать GPT-4 $20, то ИИ выдаст более развернутый ответ, чем без «чаевых». В этом случае количество знаков в ответе выросло на 2% — с 2 949 до 3 223. Если же пообещать ИИ $200, то «прибавка» составит 6% и ответ будет состоять уже из 3 360 знаков;

OpenAI отложила запуск маркетплейса кастомных чат-ботов GPT Store до начала следующего года. В официальной рассылке компания сообщила, что собиралась запустить площадку в декабре, но помешали непредвиденные обстоятельства. И мы догадываемся, что это были за обстоятельства;

И еще про OpenAI: компания собирается закупить чипов на $51 млн от стартапа Rain, как только они будут готовы. Все бы ничего, но глава OpenAI Сэм Альтман — инвестор Rain (офисы 2-х компаний даже расположены по соседству). На лицо конфликт интересов, но в OpenAI утверждают, что договоренность подписали 4 года назад, и она касалась только дальнейших переговоров, а не непосредственно закупок. Rain разрабатывает процессоры, имитирующие работу человеческого мозга, которые якобы в 100 раз производительнее, чем GPU;

Суд в Пекине решил, что изображения, сгенерированные нейросетью, могут быть объектом копирайта. В качестве предмета спора рассматривалось изображение, сгенерированное с помощью американской нейросети Stable Diffusion. Китайский суд решил, что придуманного промпта достаточно, чтобы признать пользователя автором изображения. Блогера, без разрешения использовавшего чужую генерацию, обязали выплатить чуть больше $70;

Meta* обучила новую нейросеть на 1,1 млрд фото, опубликованных в Facebook** и Instagram***. Модель используется в новом сервисе Imagine With Meta AI. Компания придумала хороший способ избежать претензий за использование чужого контента: то, что находится в соцсети в публичном доступе, компания может использовать, не боясь иска. Можно попробовать закрыть доступ к своим публикациям, но ведь модель уже обучили, так что смысла в этом не много;

Илон Маск хочет получить от инвесторов $1 млрд на свой ИИ-стартап X.AI. Пока из заявленной суммы удалось собрать только $135 млн. В описание стартапа, кстати, говорится, что он стремится познать «настоящую природу вселенной». Так вот для чего нужен Grok;

Microsoft готовит на 2024 год новую версию Windows, заточенную под ИИ. Проект под кодовым названием Hudson Valley будет работать на ОС Germanium (это тоже кодовое название). Germanium тоже выйдет в следующем году. Одной из основных фич Hudson Valley должен стать продвинутый ИИ-помощник, встроенный в ОС;

Один из исследователей ByteDance у себя в X намекнул, что компания может скоро выпустить ИИ-модель, которая будет готова конкурировать не только с Gemini, но и с GPT-5;

Создатели модели GEN-2 и фотоагентство Getty Images объединились для создания нейросети. Модель для генерации видео будут обучать на контенте из архивов Getty, поэтому пользователям не нужно будет бояться по поводу нарушения авторского права. Пару месяцев назад Getty уже запускало свою нейросеть, а еще раньше судилось со Stable Diffusion;

Meta* и IBM запустили международный альянс за разработку безопасного и ответственного ИИ. В организации уже есть 50 участников (компании, университеты, чиновники и др.). Вместе они будут разрабатывать стандарты безопасного ИИ, создавать умные модели для решения важных глобальных проблем, работать над образовательным контентом на тему ИИ и т. д;

МТС в режиме открытого бета-тестирования запустила свой ответ YouTube, VK и RuTube — видеоплатформу NUUM. Полноценный запуск намечен на следующий год, но у NUUM уже есть свое приложение, а на продвижение платформы подрядили популярных блогеров. Платформу интегрируют в экосистему МТС и добавят поддержку сервисов МТС Pay, МТС ID и других.

*Организация, запрещенная на территории РФ
*Instagram и Facebook входят в Meta — организацию, запрещенную на территории РФ
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
👎 Google показал фейковое видео о способностях Gemini

🔍 Для того чтобы это обнаружить, даже не понадобились коллективные навыки интернет-детективов. Google сам добавил дисклеймер к эффектному видео, которое показали на презентации.

😱 В 6-минутном ролике показаны примеры взаимодействия пользователя с LLM. Например, в начале видео пользователь кладет на стол лист бумаги, который Gemini корректно распознает. Дальше модель в реальном времени идентифицирует узоры, которые рисуют на бумаге, параллельно общаясь с пользователем голосом. Впечатляет!

Впечатляет, если не обращать внимания на описание видео на YouTube. В нем указано, что ролик отредактировали: убрали задержки, которые возникали, когда Gemini идентифицировал предметы. Ответы LLM специально сократили «для краткости» (то есть для того, чтобы они казались точнее). Более того, Google признал, что на самом деле Gemini анализировал фото, а не видео, да и общались с ним не голосом, а промптами 😐.

Остались недовольны и те, кто попробовал Gemini, интегрированную в поисковик Google. TechCrunch сделал длинную подборку ошибок, которые делает сервис: путается в фактах, ошибается в переводе с одного языка на другой, предлагает пользователям самим погуглить информацию, если ему чем-то не нравится тема; не может сгенерировать простейший код и т. д. 😵

Ситуация с презентацией Gemini теперь очень напоминает провальный анонс чат-бота Bard в начале года. Правда, тогда и Microsoft выступил ненамного лучше.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3🤔2