🗣 Мошенники начали использовать генеративный ИИ для вымогательства в Telegram
Злоумышленники взламывают аккаунт, получают доступ к голосовым сообщениям жертвы и на их основе с помощью нейросетей создают голосового клона 👥.
💸 Сгенерированное сообщение массово рассылается по чатам в мессенджере вместе с фото банковской карты и текстовой просьбой переслать денег. Известны случаи, когда мошенники пытались собрать ₽200 тыс.
Москвичка Наталья рассказала, что таким способом пытались получить от ее друзей и родственников ₽40 тыс. По словам девушки, на уловку попалась только коллега, с которой они работали недавно, причем перевела она на ₽20 тыс. больше, чем просили мошенники😂 .
Похожие случаи зафиксированы и ВКонтакте.
Эксперты считают, что взломы аккаунтов могут происходить через сайты, которые маскируются под Telegram, через фейковые голосования, а также акции по раздаче Premium-подписок. Доступ к голосу можно получить и без взлома аккаунта — мошенники могут попробовать познакомиться с жертвой через сайт знакомств и начать общаться голосовыми сообщениями💟 .
☎️ В качестве меры предосторожности специалисты советуют всеми возможными способами проверять «реальность» собеседника — например, попробовать с ним созвониться.
Злоумышленники взламывают аккаунт, получают доступ к голосовым сообщениям жертвы и на их основе с помощью нейросетей создают голосового клона 👥.
Москвичка Наталья рассказала, что таким способом пытались получить от ее друзей и родственников ₽40 тыс. По словам девушки, на уловку попалась только коллега, с которой они работали недавно, причем перевела она на ₽20 тыс. больше, чем просили мошенники
Похожие случаи зафиксированы и ВКонтакте.
Эксперты считают, что взломы аккаунтов могут происходить через сайты, которые маскируются под Telegram, через фейковые голосования, а также акции по раздаче Premium-подписок. Доступ к голосу можно получить и без взлома аккаунта — мошенники могут попробовать познакомиться с жертвой через сайт знакомств и начать общаться голосовыми сообщениями
☎️ В качестве меры предосторожности специалисты советуют всеми возможными способами проверять «реальность» собеседника — например, попробовать с ним созвониться.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2
Microsoft стал дороже Apple, OpenAI признал, что нарушает копирайт, Duolingo сокращает сотрудников из-за ИИ — и другие важные новости за неделю
✅ Microsoft ненадолго стал самой дорогой компанией в мире, обогнав Apple. Рыночная капитализация разработчиков Windows достигла $2,903 трлн против $2,886 трлн у Apple. На момент написания текста стоимость Microsoft откатилась к $2,858 трлн;
✅ Производители фотокамер решили защитить фотографов от дипфейков. Вместо того чтобы маркировать снимки, созданные или отредактированные ИИ, Nikon, Sony и Canon будут ставить цифровые подписи на оригиналы фотографий. Подпись можно будет пробить с помощью специальной программы Verify и посмотреть историю создания фото;
✅OpenAI признали, что разработка современных ИИ-моделей невозможна без использования контента, защищенного копирайтом. При этом в компании считают, что использование такой информации для обучения ИИ попадает под условия так называемого fair use. Fair use позволяет в отдельных случаях использовать защищенный копирайтом контент без разрешения автора. OpenAI недавно получили иск от New York Times, который (в случае удовлетворения) грозит разработчику ChatGPT серьезными последствиями;
✅ Duolingo сократит 10% подрядчиков, которые работали по контракту. В компании объяснили, что лишние руки им не нужны, так как часть работы по созданию контента удалось перепоручить ИИ. Штатных сотрудников сокращения (пока) не коснулись;
✅Профсоюз SAG-AFTRA, который представляет интересы актеров, радиоведущих и работников телевидения, заключил соглашение с ИИ-компанией Replica Studios. Документ касается использования аудиоклонов, созданных на основе голосов актеров и ведущих, в видеоиграх и других интерактивных медиа. По условиям соглашения, голоса можно использовать только с согласия «владельцев», которые в любой момент могут отказать в использовании своего голоса в новых проектах. Соглашение уже раскритиковали за то, что в его разработке никак не участвовали сами актеры;
✅OpenAI все-таки запустили магазин кастомных чат-ботов GPT Store для платных пользователей ChatGPT. Авторы чат-ботов смогут продавать свои программы по аналогии с приложениями в App Store или Google Play. Лучшие сервисы будут появляться в еженедельной подборке. В анонсе OpenAI заявили, что пользователи уже создали около трех млн чат-ботов, но сколько из них доступны в GPT Store, не уточнили;
✅Судьям в Англии и Уэльсе (юрисдикции, входящей в состав Великобритании) разрешили использовать ИИ при написании юридических заключений. За любую ошибку, допущенную нейросетью, судьи будут нести личную ответственность. Тем не менее некоторые эксперты считают, что в соответствующем документе плохо прописана ответственность за ошибки, которые могут возникнуть при использовании нейросетей. Более того, судья даже не обязан раскрывать тот факт, что он использовал ИИ.
✅ Microsoft ненадолго стал самой дорогой компанией в мире, обогнав Apple. Рыночная капитализация разработчиков Windows достигла $2,903 трлн против $2,886 трлн у Apple. На момент написания текста стоимость Microsoft откатилась к $2,858 трлн;
✅ Производители фотокамер решили защитить фотографов от дипфейков. Вместо того чтобы маркировать снимки, созданные или отредактированные ИИ, Nikon, Sony и Canon будут ставить цифровые подписи на оригиналы фотографий. Подпись можно будет пробить с помощью специальной программы Verify и посмотреть историю создания фото;
✅OpenAI признали, что разработка современных ИИ-моделей невозможна без использования контента, защищенного копирайтом. При этом в компании считают, что использование такой информации для обучения ИИ попадает под условия так называемого fair use. Fair use позволяет в отдельных случаях использовать защищенный копирайтом контент без разрешения автора. OpenAI недавно получили иск от New York Times, который (в случае удовлетворения) грозит разработчику ChatGPT серьезными последствиями;
✅ Duolingo сократит 10% подрядчиков, которые работали по контракту. В компании объяснили, что лишние руки им не нужны, так как часть работы по созданию контента удалось перепоручить ИИ. Штатных сотрудников сокращения (пока) не коснулись;
✅Профсоюз SAG-AFTRA, который представляет интересы актеров, радиоведущих и работников телевидения, заключил соглашение с ИИ-компанией Replica Studios. Документ касается использования аудиоклонов, созданных на основе голосов актеров и ведущих, в видеоиграх и других интерактивных медиа. По условиям соглашения, голоса можно использовать только с согласия «владельцев», которые в любой момент могут отказать в использовании своего голоса в новых проектах. Соглашение уже раскритиковали за то, что в его разработке никак не участвовали сами актеры;
✅OpenAI все-таки запустили магазин кастомных чат-ботов GPT Store для платных пользователей ChatGPT. Авторы чат-ботов смогут продавать свои программы по аналогии с приложениями в App Store или Google Play. Лучшие сервисы будут появляться в еженедельной подборке. В анонсе OpenAI заявили, что пользователи уже создали около трех млн чат-ботов, но сколько из них доступны в GPT Store, не уточнили;
✅Судьям в Англии и Уэльсе (юрисдикции, входящей в состав Великобритании) разрешили использовать ИИ при написании юридических заключений. За любую ошибку, допущенную нейросетью, судьи будут нести личную ответственность. Тем не менее некоторые эксперты считают, что в соответствующем документе плохо прописана ответственность за ошибки, которые могут возникнуть при использовании нейросетей. Более того, судья даже не обязан раскрывать тот факт, что он использовал ИИ.
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft показал нейросеть с продвинутыми возможностями для контроля генерации ↕️↘️↔️
📹 DragNUWA позволяет с высокой точностью задавать траекторию движения объектов в генерации, контролировать камеру и т. д. В начале января модель проапгрейдили до версии 1.5.
☝️ Точность достигается за счет использования трех компонентов: текстовой информации (промптов), визуальной информации (исходных изображений) и информации о передвижении объекта (она также задается через промпт).
🔩 Последний пункт работает за счет использования сразу нескольких методов, которые позволяют контролировать движение, сохраняя консистентность генерации: Trajectory Sampler, Miltiscale Fusion и Adaptive training.
🤝 Как говорят разработчики, эти компоненты уже использовались в других моделях по отдельности или в паре, но никогда не использовались все вместе — это и позволяет DragNUWA создавать генерации со сложными «сценариями» движений.
🎚 За анимацию отвечает Stable Video Diffusion. Пока генерации далеки от идеала, но прогресс по сравнению с предыдущей версией видно сразу.
Демо нейросети выложено на Hugging Face, но на момент написания текста было недоступно.
📹 DragNUWA позволяет с высокой точностью задавать траекторию движения объектов в генерации, контролировать камеру и т. д. В начале января модель проапгрейдили до версии 1.5.
Демо нейросети выложено на Hugging Face, но на момент написания текста было недоступно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔5
Международный валютный фонд выступил со своим прогнозом о последствиях повсеместного внедрения генеративного ИИ.
В организации отмечают, что не на все 40% влияние будет негативным: какие-то профессии ИИ полностью заменит, но в других случаях будет помощником
🌎 Goldman Sachs весной прошлого года прогнозировал, что мировой ВВП за 10 лет получит еще $7 трлн благодаря использованию ИИ. Прогноз МВФ говорит, что эти потенциальные триллионы долларов вряд ли будут равномерно распределены между всеми странами.
В МВФ предлагают чиновникам уже сейчас задуматься о создании социальных механизмов, которые позволят сделать переход на ИИ-экономику более инклюзивным.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3❤2🔥2🤬2
This media is not supported in your browser
VIEW IN TELEGRAM
🐈 Стартап заключил соглашение с телеканалами для производства ИИ-рекламы
Waymark предлагает платформу для создания рекламы с помощью нейросетей.
📺 В начале января компания заключила соглашение с американской телерадиокомпанией E.W. Scripps, куда входит 61 телеканал, для интеграции рекламных инструментов с ИИ.
🔎 Разработка Waymark ищет информацию о бизнесе в интернете, а затем на ее основе создает ролики для ТВ. Помимо визуала, для рекламы можно подобрать закадровый ИИ-голос, который зачитает рекламный текст. Готовый вариант можно самостоятельно отредактировать.
💸 Целевая аудитория сервиса — малый региональный бизнес, который в обычных условиях не может позволить себе потратить от $15 тыс. до $30 тыс. на короткий 30-секундный ролик, а затем еще и заплатить за рекламное время на ТВ.
⏳ С помощью Waymark весь процесс от производства ролика до запуска его в эфир занимает несколько часов. Стоимость использования сервиса начинается от $150 в месяц.
🇸🇪 Помимо E.W. Scripps, Waymark, в том числе сотрудничает с FOX TV Stations, а недавно стартап заключил соглашение на использование своей технологии со шведскими рекламщиками из DansAds. Среди клиентов DansAds: Bloomberg, TripAdvisor, SoundCloud, Dow Jones и другие. Технология Waymark будет интегрирована в формате плагина в сервис шведов.
🔩 По состоянию на лето 2023 года с помощью технологии Waymark было создано около 300 тыс. рекламных клипов.
Waymark предлагает платформу для создания рекламы с помощью нейросетей.
📺 В начале января компания заключила соглашение с американской телерадиокомпанией E.W. Scripps, куда входит 61 телеканал, для интеграции рекламных инструментов с ИИ.
🇸🇪 Помимо E.W. Scripps, Waymark, в том числе сотрудничает с FOX TV Stations, а недавно стартап заключил соглашение на использование своей технологии со шведскими рекламщиками из DansAds. Среди клиентов DansAds: Bloomberg, TripAdvisor, SoundCloud, Dow Jones и другие. Технология Waymark будет интегрирована в формате плагина в сервис шведов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
💍 Samsung показал смартфон с нейросетью и анонсировал загадочное фитнес-кольцо с ИИ
Компания провела мероприятие Unpacked, на котором рассказала подробности о новом смартфоне Galaxy S24 с интегрированной ИИ-моделью Gemini от Google.
💬 ИИ сможет переводить речь с 13 языков прямо во время разговора, а также переводить текстовые сообщения.
🎞 С помощью нейросети можно будет редактировать изображения и видео. За эту часть будет отвечать гугловская модель Imagen.
✏️ ИИ также будет отвечать за редактуру в приложении Notes, в том числе программа сможет менять тон сообщения в зависимости от контекста (например, текст коллегам по работе будет по стилю отличаться от сообщения лучшему другу).
🎙 ИИ интегрирован и с диктофоном: пользователь может записать лекцию, а нейросеть затем автоматически выделит в ней главные моменты.
🟢 В смартфоне будет реализована функция Circle to Search: на изображении можно будет обвести нужный предмет и получить о нем информацию из поисковика.
☝️ ИИ-функции будут частично работать через облако, а частично — локально, на смартфоне. За облачную часть будет отвечать более мощная модель Gemini Pro, а на устройстве — более простая Gemini Nano.
📱 Galaxy S 24 выйдет в трех вариантах стоимостью от $800 до $1,3 тыс. ИИ-функционал будет доступен на всех моделях.
😼 Кроме того, Samsung анонсировали фитнес-кольцо Galaxy Ring, которое также будет использовать генеративный ИИ. Про кольцо подробностей практически нет: ни стоимость, ни технические характеристики, ни дата выхода на данный момент неизвестны. Но компания обещает, что Galaxy Ring «изменит будущее здорового образа жизни».
Компания провела мероприятие Unpacked, на котором рассказала подробности о новом смартфоне Galaxy S24 с интегрированной ИИ-моделью Gemini от Google.
🎞 С помощью нейросети можно будет редактировать изображения и видео. За эту часть будет отвечать гугловская модель Imagen.
☝️ ИИ-функции будут частично работать через облако, а частично — локально, на смартфоне. За облачную часть будет отвечать более мощная модель Gemini Pro, а на устройстве — более простая Gemini Nano.
📱 Galaxy S 24 выйдет в трех вариантах стоимостью от $800 до $1,3 тыс. ИИ-функционал будет доступен на всех моделях.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🐴 TRIPS — новая альтернатива нерфам и Gaussian Splatting
Мы еще не успели наиграться с гауссианами, которые должны были стать заменой NeRF, как исследователи из немецкого Университета Эрлангена-Нюрнберга придумали еще более эффективный способ рендеринга. По крайней мере, они так говорят.
✋ Знакомьтесь, Trilinear Point Splatting (TRIPS) — способ рендеринга в реальном времени, который обходит Gaussian Splatting по качеству картинки. Другой популярный способ рендеринга ADOP (Approximate Differentiable One-Pixel Point Rendering), который похож на TRIPS, уступает ему по скорости работы и стабильности результата, в том числе из-за использования «громоздкой» нейросети.
☁️ В основе TRIPS лежит так называемый Point-Based рендеринг, при котором 3D-сцена предстает не в виде геометрических фигур, а в виде облака точек. Это облако TRIPS представляет в виде многослойной пирамиды, где каждый слой — это точки в разном разрешении (а не в одном, как у конкурентов).
👈 В зависимости от текущей необходимости TRIPS выбирает нужный для рендера слой пирамиды, обеспечивая скорость и детализацию. Для этого используется тот самый Trilinear Splatting, который вынесен в название.
🧑🎨 На финальном этапе рендера подключается оптимизированная под задачу нейросеть, которая дорисовывает сцену без артефактов и пробелов.
Мы еще не успели наиграться с гауссианами, которые должны были стать заменой NeRF, как исследователи из немецкого Университета Эрлангена-Нюрнберга придумали еще более эффективный способ рендеринга. По крайней мере, они так говорят.
☁️ В основе TRIPS лежит так называемый Point-Based рендеринг, при котором 3D-сцена предстает не в виде геометрических фигур, а в виде облака точек. Это облако TRIPS представляет в виде многослойной пирамиды, где каждый слой — это точки в разном разрешении (а не в одном, как у конкурентов).
🧑🎨 На финальном этапе рендера подключается оптимизированная под задачу нейросеть, которая дорисовывает сцену без артефактов и пробелов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
К такому выводу пришли аналитики компании StarCounter, посчитав, как изменилась доля поисковика Microsoft с момента, когда в него добавили языковую модель GPT
💪 Если Google и стоит опасаться конкурентов, то в очень далеком будущем — сейчас поисковик компании занимает 91,6% рынка.
🤏 Нельзя сказать, что интеграция ИИ не дала совсем никакого результата. Например, в США количество активных пользователей Bing в месяц к концу 2023 года выросло до 4,4 млн против 3,1 млн во II квартале. Кроме того, время использования поисковика выросло на 84%.
Тем не менее апокалиптические прогнозы, что ИИ сразу же убьет весь поисковый бизнес Google, пока не подтверждаются.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2👎1
OpenAI начал сотрудничать с военными, индийские власти пригрозили закрывать бизнес за дипфейки, Цукерберг разрабатывает AGI для всех — и другие важные новости за неделю
✅ OpenAI снял запрет на использование своих разработок военными — соответствующий пункт пропал с сайта компании. Речи о разработки оружия с интегрированным ChatGPT не идет — компания сотрудничает с Пентагоном только по разработке решений для обеспечения кибербезопасности;
✅ После запуска GPT Store магазин наводнили ИИ-подружки на любой вкус. Разработчики этих чат-ботов прямо нарушают правила использования GPT, которые запрещают создание кастомных чат-ботов, симулирующих романтические отношения;
✅ Microsoft запустил платную подписку на ИИ-помощника Copilot. За интеграцию Copilot в сервисы, входящие в пакет Microsoft 365, придется заплатить $20 в месяц. При этом подписку на 365 тоже никто отменял, так что заплатить придется за оба продукта;
✅ Марк Цукерберг анонсировал разработку сильного искусственного интеллекта (AGI) с открытым кодом. Для создания ИИ, который сможет решать все задачи, которые может решить человеческий мозг, но при этом будет доступен всем, Meta* объединила два подразделения внутри компании, которые занимаются ИИ;
✅ Apple может разделить App Store на два магазина: один будет работать в Европе, другой — в остальном мире. На такой шаг компании приходится идти из-за новых требований ЕС, которые обяжут магазины приложений разрешить загрузку приложений со сторонних ресурсов. Сегментирование App Store должно произойти до 6 марта;
✅ Google пытается удержать сотрудников от перехода в OpenAI, предлагая им специальные акции. В зависимости от важности сотрудника сумма пакета акций может достигать миллионов долларов. В качестве дополнительного бонуса Google разрешает продать такие акции уже через год, а не через три–пять лет, как это бывает с обычными опционами. С октября 2023 года в OpenAI ушли как минимум шесть сотрудников Google, которые работали над моделью Gemini;
✅ Индийские власти пригрозили технологическим компаниям жесткими мерами вплоть до запрета на работу, если они не научатся эффективно бороться с дипфейками. Власти уже несколько месяцев говорят об опасности синтетических видео на фоне появления рекламы, где дипфейки индийских селебрити продвигают различные товары. Чиновников расстраивает, что компании недостаточно активно удаляют такие видео со своих платформ, несмотря на их требования;
✅ TikTok тестирует генерацию песен по промпту с помощью функции AI Song. Сгенерировать можно не только музыку, но и тексты — для этого используется языковая модель Bloom. AI Song доступен небольшому числу пользователей соцсети;
✅ Adobe прокачал Premier Pro с помощью генеративного ИИ. В бета-версии стали доступны инструменты для редактирования аудио: удаление фонового шума, авторазметка аудио по жанрам, автоматическое улучшение качества записи и т. д.;
✅ Stability AI выпустил свою первую нейросеть в новом году. Stable Code 3B, как можно догадаться из названия, работает с программным кодом. Но главная фишка модели в ее компактности. Благодаря относительно небольшому количеству параметров Stable Code можно запустить локально даже не на очень мощном ноутбуке.
*Организация, запрещенная на территории РФ
✅ OpenAI снял запрет на использование своих разработок военными — соответствующий пункт пропал с сайта компании. Речи о разработки оружия с интегрированным ChatGPT не идет — компания сотрудничает с Пентагоном только по разработке решений для обеспечения кибербезопасности;
✅ После запуска GPT Store магазин наводнили ИИ-подружки на любой вкус. Разработчики этих чат-ботов прямо нарушают правила использования GPT, которые запрещают создание кастомных чат-ботов, симулирующих романтические отношения;
✅ Microsoft запустил платную подписку на ИИ-помощника Copilot. За интеграцию Copilot в сервисы, входящие в пакет Microsoft 365, придется заплатить $20 в месяц. При этом подписку на 365 тоже никто отменял, так что заплатить придется за оба продукта;
✅ Марк Цукерберг анонсировал разработку сильного искусственного интеллекта (AGI) с открытым кодом. Для создания ИИ, который сможет решать все задачи, которые может решить человеческий мозг, но при этом будет доступен всем, Meta* объединила два подразделения внутри компании, которые занимаются ИИ;
✅ Apple может разделить App Store на два магазина: один будет работать в Европе, другой — в остальном мире. На такой шаг компании приходится идти из-за новых требований ЕС, которые обяжут магазины приложений разрешить загрузку приложений со сторонних ресурсов. Сегментирование App Store должно произойти до 6 марта;
✅ Google пытается удержать сотрудников от перехода в OpenAI, предлагая им специальные акции. В зависимости от важности сотрудника сумма пакета акций может достигать миллионов долларов. В качестве дополнительного бонуса Google разрешает продать такие акции уже через год, а не через три–пять лет, как это бывает с обычными опционами. С октября 2023 года в OpenAI ушли как минимум шесть сотрудников Google, которые работали над моделью Gemini;
✅ Индийские власти пригрозили технологическим компаниям жесткими мерами вплоть до запрета на работу, если они не научатся эффективно бороться с дипфейками. Власти уже несколько месяцев говорят об опасности синтетических видео на фоне появления рекламы, где дипфейки индийских селебрити продвигают различные товары. Чиновников расстраивает, что компании недостаточно активно удаляют такие видео со своих платформ, несмотря на их требования;
✅ TikTok тестирует генерацию песен по промпту с помощью функции AI Song. Сгенерировать можно не только музыку, но и тексты — для этого используется языковая модель Bloom. AI Song доступен небольшому числу пользователей соцсети;
✅ Adobe прокачал Premier Pro с помощью генеративного ИИ. В бета-версии стали доступны инструменты для редактирования аудио: удаление фонового шума, авторазметка аудио по жанрам, автоматическое улучшение качества записи и т. д.;
✅ Stability AI выпустил свою первую нейросеть в новом году. Stable Code 3B, как можно догадаться из названия, работает с программным кодом. Но главная фишка модели в ее компактности. Благодаря относительно небольшому количеству параметров Stable Code можно запустить локально даже не на очень мощном ноутбуке.
*Организация, запрещенная на территории РФ
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Модульный HoloTile состоит из множества «плиток», которые позволяют перемещаться в VR в любом направлении, причем сразу нескольким пользователям. В компании позиционируют устройство не только для (и даже не столько) домашнего использования, но и для парков развлечений Disney. В теории возможно использование HoloTile и в кинопроизводстве.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
Это следует из исследования, проведенного MIT. Авторы оценили рентабельность ИИ-моделей в некоторых профессиях, сфокусировавшись на тех задачах, которые требуют использования компьютерного зрения.
Всего в выборку попало 800 профессий и более одной тыс. задач.
🥖 В качестве примера авторы приводят гипотетическую пекарню, которая хочет использовать ИИ для оценки качества ингредиентов. Проверка качества составляет лишь 6% от объема задач, входящих в обязанности пекарей, получающих $48 тыс. в год каждый.
📆 В MIT подсчитали, что на сегодня в изученных ими профессиях автоматизация лишь 23% задач будет эффективна с точки зрения стоимости. Авторы признают, что по мере усовершенствования ИИ-моделей показатель может вырасти до 40% к 2030 году.
🤖 В целом, исследователи делают вывод, что замена людей на ИИ для выполнения отдельных задач будет скорее постепенной, чем быстрой. Авторы отмечают, что удешевление использования ИИ-моделей с компьютерным зрением даже на 20% ежегодно будет означать, что пройдут «десятилетия», прежде чем они станут по-настоящему выгодными.
Исследование MIT на какое-то время может успокоить людей, напуганных недавним прогнозом МВФ, из которого следует, что влиянию ИИ может подвергнуться до 60% всех профессий в мире.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Подразделение Codec Avatars совместно с Наньянским технологическим университетом разработали URHand — модель для фотореалистичной симуляции человеческих рук в виртуальном пространстве.
🧍♀️ Такая дотошность, считают разработчики, должна в разы повысить эффект присутствия в VR. Логика такая: так как в реальной жизни человек постоянно видит руки перед собой и идентифицирует себя через них, то именно их реалистичная модель (вместе с остальным телом) нужна ему и в виртуальном пространстве.
📱 Чтобы создать полную иммерсию, URHand позволяет перенести в VR точную копию рук пользователя, сделав несколько фотографий на смартфон.
URHand пока находится на стадии эксперимента и в ближайшее время не появится в девайсах Meta
*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🤔2
⌨️ Даже небольшое изменение промпта может изменить ответ LLM
Исследование, проведенное Институтом информационных наук Южной Калифорнии, показало, что даже пробел в начале текстовой подсказки может изменить ответ модели.
🛠 Такие особенности LLM не позволяют использовать их как надежный инструмент в работе. Если LLM при малейшем изменении промпта дает новый ответ разной степени точности, то положиться на него сложно. Задача для разработчиков: создать модели, которые будут давать точные ответы вне зависимости от изменений в текстовой подсказке.
🧪 Эксперимент проводили в несколько этапов, используя модель GPT-3.5 Turbo. Авторы просили LLM определить тональность текста, истинно или ложно утверждение, проверить текст на наличие сарказма, юмора и т. д. Текст выглядел так: «Я пошел с Элис, чтобы посмотреть фильм о яблоках. Он был потрясающим».
📋 На первом этапе модель просили сгенерировать информацию в нескольких форматах: CSV, XML, JSON и других. Оказалось, что простое изменение формата может привести к снижению точности генерируемой информации на 3–6% или изменению самого ответа на 10%. Разницу в точности и изменениях в ответах определяли не на глаз, а с помощью бенчмарков.
⁉️ На следующем этапе исследователи перефразировали промпт — например, из вопроса в утверждение. В этом случае ответ мог отличаться по 900 признакам от ответа, выбранного базовым. Пробел в начале промпта давал более 500 изменений.
🔐 Также авторы работы использовали джейлбрейк — метод, который позволяет обходить ограничения, заложенные в модель разработчиками. В этом случае чат-бот берет на себя «роль», которая позволяет давать ему ответы без цензуры. Использование джейлбрейков часто приводило или к очень большому количеству изменений (до 2,5 тыс.), или LLM в принципе не могла дать корректный ответ.
💳 Исследователи попробовали предложить LLM денег, но это практически не повлияло на итоговую генерацию — хотя интернет-эксперты утверждают обратное.
Авторы не приводят варианты ответов LLM в исследовании.
Исследование, проведенное Институтом информационных наук Южной Калифорнии, показало, что даже пробел в начале текстовой подсказки может изменить ответ модели.
🛠 Такие особенности LLM не позволяют использовать их как надежный инструмент в работе. Если LLM при малейшем изменении промпта дает новый ответ разной степени точности, то положиться на него сложно. Задача для разработчиков: создать модели, которые будут давать точные ответы вне зависимости от изменений в текстовой подсказке.
🧪 Эксперимент проводили в несколько этапов, используя модель GPT-3.5 Turbo. Авторы просили LLM определить тональность текста, истинно или ложно утверждение, проверить текст на наличие сарказма, юмора и т. д. Текст выглядел так: «Я пошел с Элис, чтобы посмотреть фильм о яблоках. Он был потрясающим».
📋 На первом этапе модель просили сгенерировать информацию в нескольких форматах: CSV, XML, JSON и других. Оказалось, что простое изменение формата может привести к снижению точности генерируемой информации на 3–6% или изменению самого ответа на 10%. Разницу в точности и изменениях в ответах определяли не на глаз, а с помощью бенчмарков.
⁉️ На следующем этапе исследователи перефразировали промпт — например, из вопроса в утверждение. В этом случае ответ мог отличаться по 900 признакам от ответа, выбранного базовым. Пробел в начале промпта давал более 500 изменений.
🔐 Также авторы работы использовали джейлбрейк — метод, который позволяет обходить ограничения, заложенные в модель разработчиками. В этом случае чат-бот берет на себя «роль», которая позволяет давать ему ответы без цензуры. Использование джейлбрейков часто приводило или к очень большому количеству изменений (до 2,5 тыс.), или LLM в принципе не могла дать корректный ответ.
Авторы не приводят варианты ответов LLM в исследовании.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 🧹 В X/Twitter геймифицировали уборку квартиры с помощью AR
Специалист по AR/VR в Shopify Дэниел Бошамп придумал, как сделать уборку квартиры чуть менее скучным занятием🥳 .
⏳ В свободное от работы время он сделал приложение для хедсета Oculus Quest, которое наглядно показывает, где в доме пылесосили, а где — нет. Задача — «зачистить» жилище от пыльных зон.
Результатом Бошамп поделился в соцсети.
Называется все это Spatial Vacuuming😎 .
Специалист по AR/VR в Shopify Дэниел Бошамп придумал, как сделать уборку квартиры чуть менее скучным занятием
Результатом Бошамп поделился в соцсети.
Называется все это Spatial Vacuuming
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2🤔2❤1
Альтман ищет деньги на заводы, В TikTok появятся видео на полчаса, появились подробности о загрузке приложений в обход App Store — и другие важные новости за неделю
✅ Сэм Альтман ищет инвесторов для своего проекта по созданию сети заводов по производству полупроводников. Альтман не собирается создавать свою компанию-производителя, а хочет пригласить уже существующие компании работать на новых заводах. Удастся ли реализовать проект — большой вопрос. Строительство даже одного завода может обойтись в десятки миллиардов долларов, а строительство целой сети предприятий займет годы;
✅ Nvidia представила свой ответ ChatGPT. Компания представила семейство моделей ChatQA, которые, как обещается, сравнимы по производительности с GPT-4. При этом в их обучении не использована информация, сгенерированная моделью, разработанной OpenAI (это — обычная практика, если что);
✅ Разработчик ИИ-моделей для клонирования голосов ElevenLabs стал единорогом. Стартап получил еще $80 млн от инвесторов. Таким образом, его оценочная стоимость превысила $1 млрд. По такому случаю компания анонсировала выход ИИ-инструмента для озвучивания полнометражных фильмов и запуск маркетплейса, где пользователи смогут продавать клон своего голоса;
✅ Apple рассказал, как именно будет поощрять музыкантов за выпуск треков в формате пространственного аудио через Apple Music. Роялти за каждую песню, выложенную в формате Spatial Audio, будут на 10% выше, чем за обычное аудио;
✅ И еще про Apple. Компания объяснила, как будет работать загрузка приложений со сторонних площадок, которая станет доступна в марте пользователям из ЕС с выходом iOS 17.4. Apple будет утверждать сторонние магазины, из которых можно будет скачивать приложения. Разработчики смогут использовать платежную инфраструктуру Apple (c 3% комиссией) или добавить в приложение стороннюю платежную систему. Сумма комиссии, которую Apple берет за каждую загрузку, в ЕС снизится с 30% до 10%. При этом все без исключения разработчики должны будут платить Apple €0,5 за первую установку приложения, если приложение скачали больше миллиона раз;
✅ Google уже в феврале добавит в браузер Chrome генеративный функционал. Он позволит менять фон браузера по промпту, компоновать открытые вкладки по теме и поможет дописать текст, который пользователь хочет опубликовать в интернете. Первыми обновления смогут потестировать пользователи из США;
✅ Платформа VK Реклама запустила нейросеть, которая автоматически подберет целевую аудиторию для показа рекламного сообщения. Модель ориентируется на успешные рекламные кампании на схожую тематику, которые запущены на платформе;
✅ TikTok тестирует возможность загрузки в соцсеть видео продолжительностью 30 минут. Доступ к загрузке получили некоторые пользователи приложения соцсети на Android и iOS. Изначально на платформе разрешалось публиковать видео не длиннее 15 секунд. Тестируя загрузку длинных видео, считают аналитики, соцсеть пробует себя в качестве прямого конкурента YouTube.
✅ Сэм Альтман ищет инвесторов для своего проекта по созданию сети заводов по производству полупроводников. Альтман не собирается создавать свою компанию-производителя, а хочет пригласить уже существующие компании работать на новых заводах. Удастся ли реализовать проект — большой вопрос. Строительство даже одного завода может обойтись в десятки миллиардов долларов, а строительство целой сети предприятий займет годы;
✅ Nvidia представила свой ответ ChatGPT. Компания представила семейство моделей ChatQA, которые, как обещается, сравнимы по производительности с GPT-4. При этом в их обучении не использована информация, сгенерированная моделью, разработанной OpenAI (это — обычная практика, если что);
✅ Разработчик ИИ-моделей для клонирования голосов ElevenLabs стал единорогом. Стартап получил еще $80 млн от инвесторов. Таким образом, его оценочная стоимость превысила $1 млрд. По такому случаю компания анонсировала выход ИИ-инструмента для озвучивания полнометражных фильмов и запуск маркетплейса, где пользователи смогут продавать клон своего голоса;
✅ Apple рассказал, как именно будет поощрять музыкантов за выпуск треков в формате пространственного аудио через Apple Music. Роялти за каждую песню, выложенную в формате Spatial Audio, будут на 10% выше, чем за обычное аудио;
✅ И еще про Apple. Компания объяснила, как будет работать загрузка приложений со сторонних площадок, которая станет доступна в марте пользователям из ЕС с выходом iOS 17.4. Apple будет утверждать сторонние магазины, из которых можно будет скачивать приложения. Разработчики смогут использовать платежную инфраструктуру Apple (c 3% комиссией) или добавить в приложение стороннюю платежную систему. Сумма комиссии, которую Apple берет за каждую загрузку, в ЕС снизится с 30% до 10%. При этом все без исключения разработчики должны будут платить Apple €0,5 за первую установку приложения, если приложение скачали больше миллиона раз;
✅ Google уже в феврале добавит в браузер Chrome генеративный функционал. Он позволит менять фон браузера по промпту, компоновать открытые вкладки по теме и поможет дописать текст, который пользователь хочет опубликовать в интернете. Первыми обновления смогут потестировать пользователи из США;
✅ Платформа VK Реклама запустила нейросеть, которая автоматически подберет целевую аудиторию для показа рекламного сообщения. Модель ориентируется на успешные рекламные кампании на схожую тематику, которые запущены на платформе;
✅ TikTok тестирует возможность загрузки в соцсеть видео продолжительностью 30 минут. Доступ к загрузке получили некоторые пользователи приложения соцсети на Android и iOS. Изначально на платформе разрешалось публиковать видео не длиннее 15 секунд. Тестируя загрузку длинных видео, считают аналитики, соцсеть пробует себя в качестве прямого конкурента YouTube.
👍4❤3👏2
📸 InstantID — новая модель для создания генераций на основе одного фото
Нейросеть от команды разработчиков из Пекина может создавать генерации в разных стилях и жанрах на основе одного портретного фото и промпта.
🔩 InstantID может не просто создать красиво оформленную аватарку (таким после Lensa уже никого не удивишь): по одному снимку модель может сгенерировать персонажа в разных ракурсах, синтезировать в одной генерации людей с двух фото, объединить в одном персонаже людей с двух фото, по портретному фото создать не портретное изображение и так далее. В фотореалистичные генерации модель тоже умеет.
Все это с высокой детализацией и без необходимости файнтюнить модель.
🫡 Демо доступно здесь.
😈 Эксперты уже пугают, что InstantID станет любимым инструментом для создания дипфейков благодаря гибкости и простоте в использовании.
Нейросеть от команды разработчиков из Пекина может создавать генерации в разных стилях и жанрах на основе одного портретного фото и промпта.
Все это с высокой детализацией и без необходимости файнтюнить модель.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2