🗣 OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках.
Разработчики использовали 680 000 часов многоязычных и мультизадачных данных, собранных из интернета. Благодаря этому система распознает уникальные акценты, фоновый шум и технический жаргон.
☝️ Исследователи признали, что из-за использования «зашумленных» данных в наборе для обучения модель имеет свои ограничения, особенно в области предсказания текста. Также Whisper не одинаково хорошо работает на разных языках.
https://forklog.com/news/openai-predstavila-sistemu-raspoznavaniya-rechi-whisper/
#OpenAI #NLP
Разработчики использовали 680 000 часов многоязычных и мультизадачных данных, собранных из интернета. Благодаря этому система распознает уникальные акценты, фоновый шум и технический жаргон.
☝️ Исследователи признали, что из-за использования «зашумленных» данных в наборе для обучения модель имеет свои ограничения, особенно в области предсказания текста. Также Whisper не одинаково хорошо работает на разных языках.
https://forklog.com/news/openai-predstavila-sistemu-raspoznavaniya-rechi-whisper/
#OpenAI #NLP
ForkLog
OpenAI представила систему распознавания речи Whisper
Организация OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках.
🚧 YouTube-блогер под ником TechRax специально разбил свою машину, чтобы проверить работоспособность функции распознавания ДТП в iPhone 14 Pro.
Вместе с командой он соорудил полигон с обломками транспортных средств, в которые врезался настоящий автомобиль. Смартфон закрепили скотчем на одном из пассажирских сидений.
✅ В результате эксперимента iPhone распознал ДТП и запустил обратный отсчет для звонка в службу спасения. Блогер отметил, что при столкновении на низкой и высокой скоростях задержка срабатывания функции составила около 10 секунд.
#Apple
Вместе с командой он соорудил полигон с обломками транспортных средств, в которые врезался настоящий автомобиль. Смартфон закрепили скотчем на одном из пассажирских сидений.
✅ В результате эксперимента iPhone распознал ДТП и запустил обратный отсчет для звонка в службу спасения. Блогер отметил, что при столкновении на низкой и высокой скоростях задержка срабатывания функции составила около 10 секунд.
#Apple
YouTube
Does the iPhone 14 Pro Crash Detection Actually Work? - Car Accident Experiment
Time to test out the iPhone 14 Pro's new crash detection feature. Does it actually work? Video was filmed in a safe and controlled environment.
FACEBOOK:
https://www.facebook.com/techrax
TWITTER:
https://twitter.com/techrax
INSTAGRAM:
https://instagram.com/techrax
FACEBOOK:
https://www.facebook.com/techrax
TWITTER:
https://twitter.com/techrax
INSTAGRAM:
https://instagram.com/techrax
🗣 Исследователи разработали метод обнаружения аудиодипфейков, измеряющий различия между образцами органического и синтетического голоса.
Для этого они смоделировали речевой тракт для реальной и искусственной речи. Выяснилось, что дипфейковые записи не ограничены анатомией органов дыхания человека и генерируют такие формы, которых нет у людей.
📈 По словам исследователей, точность метода на тестовом наборе данных достигла 99%.
https://forklog.com/news/uchenye-nauchilis-raspoznavat-audiodipfejki/
#исследование #дипфейк
Для этого они смоделировали речевой тракт для реальной и искусственной речи. Выяснилось, что дипфейковые записи не ограничены анатомией органов дыхания человека и генерируют такие формы, которых нет у людей.
📈 По словам исследователей, точность метода на тестовом наборе данных достигла 99%.
https://forklog.com/news/uchenye-nauchilis-raspoznavat-audiodipfejki/
#исследование #дипфейк
ForkLog
Ученые научились распознавать аудиодипфейки
Исследователи Университета Флориды разработали метод обнаружения аудиодипфейков, измеряющий различия между образцами органической и синтетической речи.
ForkLog AI
🗑 Фотобанк Shutterstock удалил коллекцию изображений, созданную ИИ-системой Midjourney. По данным Motherboard, вместо работ алгоритма система находит стоковые фотографии логотипа проекта. Ранее по запросу Midjourney сервис выдавал изображения, на которых…
❌ Getty Images запретила загрузку и продажу изображений, созданных генераторами вроде DALL-E или Midjourney.
По словам главы компании Крейга Питерса, ограничения связаны с предотвращением возможных нарушений авторских прав. Он не уточнил, получал ли сервис судебные иски, связанные с ИИ-изображениями.
🤔 Ранее аналогичные решения приняли платформы для распространения графического контента Newgrounds, PurplePort, и FurAffinity.
#GAN
По словам главы компании Крейга Питерса, ограничения связаны с предотвращением возможных нарушений авторских прав. Он не уточнил, получал ли сервис судебные иски, связанные с ИИ-изображениями.
🤔 Ранее аналогичные решения приняли платформы для распространения графического контента Newgrounds, PurplePort, и FurAffinity.
#GAN
🚀 Nvidia представила профессиональную видеокарту RTX 6000 на архитектуре Ada Lovelace.
Новинка оснащена 18 176 ядрами CUDA и 48 ГБ памяти. Также RTX 6000 содержит 568 тензорных ядер и 142 RT-ядер. По сравнению с RTX A6000, новый ускоритель может обеспечить в 2—4 раза большую производительность.
По словам представителя Nvidia, RTX 6000 предназначена для создания контента, рендеринга, искусственного интеллекта, моделирования и создания миров в метавселенной.
🌍 Ускоритель поступит в продажу в декабре 2022 года.
#Nvidia #чипы
Новинка оснащена 18 176 ядрами CUDA и 48 ГБ памяти. Также RTX 6000 содержит 568 тензорных ядер и 142 RT-ядер. По сравнению с RTX A6000, новый ускоритель может обеспечить в 2—4 раза большую производительность.
По словам представителя Nvidia, RTX 6000 предназначена для создания контента, рендеринга, искусственного интеллекта, моделирования и создания миров в метавселенной.
🌍 Ускоритель поступит в продажу в декабре 2022 года.
#Nvidia #чипы
Компания Spawning AI создала сервис Have I Been Trained? для поиска картинок, применяемых в обучении популярных художественных моделей ИИ.
Инструмент основан на датасете LAION-5B, состоящего из 5,85 млрд пар тест-изображение. Именно его чаще всего используют разработчики генераторов рисунков, в частности Stable Diffusion.
Пользователи Have I Been Trained? могут находить картинки как по текстовому запросу, так и по изображению.
#GAN
Инструмент основан на датасете LAION-5B, состоящего из 5,85 млрд пар тест-изображение. Именно его чаще всего используют разработчики генераторов рисунков, в частности Stable Diffusion.
Пользователи Have I Been Trained? могут находить картинки как по текстовому запросу, так и по изображению.
#GAN
🦅 Правительство Германии установит на ветряных электростанциях камеры с искусственным интеллектом, чтобы предотвратить столкновение редких видов орлов с турбинами.
Оборудование и ПО установит американский стартап IdentiFlight, развернувший такие же проекты в США, Австралии и Европе. Система состоит из восьми широкоугольных камер, которые распознают птиц в радиусе 1 км. При обнаружении орла, программа автоматически замедлит лопасти турбины, чтобы уменьшить риск смертельного столкновения.
📆 Стоимость развертывания инфраструктуры неизвестна. Систему планируют запустить в 2023 году.
#Германия #экология
Оборудование и ПО установит американский стартап IdentiFlight, развернувший такие же проекты в США, Австралии и Европе. Система состоит из восьми широкоугольных камер, которые распознают птиц в радиусе 1 км. При обнаружении орла, программа автоматически замедлит лопасти турбины, чтобы уменьшить риск смертельного столкновения.
📆 Стоимость развертывания инфраструктуры неизвестна. Систему планируют запустить в 2023 году.
#Германия #экология
🔞 Meta приступила к разработке системы распознавания наготы на фото, отправленных в личные сообщения в Instagram.
По словам представителей компании, технология должна защитить пользователей от обнаженных фотографий или других нежелательных сообщений. В Meta подчеркнули, что не смогут просматривать изображения или делиться ими с третьими лицами.
☝️ Представители компании пообещали поделиться подробной информацией о функции в ближайшие несколько недель, когда начнется тестирование.
https://forklog.com/news/v-instagram-poyavitsya-detektor-nagoty-v-privatnyh-chatah/
#Instagram #отслеживание
По словам представителей компании, технология должна защитить пользователей от обнаженных фотографий или других нежелательных сообщений. В Meta подчеркнули, что не смогут просматривать изображения или делиться ими с третьими лицами.
☝️ Представители компании пообещали поделиться подробной информацией о функции в ближайшие несколько недель, когда начнется тестирование.
https://forklog.com/news/v-instagram-poyavitsya-detektor-nagoty-v-privatnyh-chatah/
#Instagram #отслеживание
ForkLog
В Instagram появится детектор наготы в приватных чатах
Компания Meta приступила к разработке системы распознавания наготы на фотография, отправленных в личные сообщения в Instagram.
🏀 Словенский баскетболист Лука Дончич запустил свое цифровое альтер эго Luk.AI.
Виртуальную версию звезды НБА создали с помощью инструмента Unreal Engine 5 MetaHuman. Также аватара дополнили технологиями нейронных сетей, обученных анимациям лица из реального мира на основе захвата производительности спортсмена.
🤖 Luk.AI будет управлять TikTok-аккаунтом Дончича. Аватара также планируют задействовать в ряде проектов для детей.
https://forklog.com/news/zvezdu-nba-prevratili-v-metacheloveka/
#метавселенные #НБА
Виртуальную версию звезды НБА создали с помощью инструмента Unreal Engine 5 MetaHuman. Также аватара дополнили технологиями нейронных сетей, обученных анимациям лица из реального мира на основе захвата производительности спортсмена.
🤖 Luk.AI будет управлять TikTok-аккаунтом Дончича. Аватара также планируют задействовать в ряде проектов для детей.
https://forklog.com/news/zvezdu-nba-prevratili-v-metacheloveka/
#метавселенные #НБА
ForkLog
Звезду НБА превратили в метачеловека
Словенский баскетболист Лука Дончич запустил свое цифровое альтер эго Luk.AI, созданное с использованием технологии MetaHuman от компании Epic Games.
🕶 Pico, дочерняя компания ByteDance, представила гарнитуру виртуальной реальности Pico 4.
Устройство оборудовано процессором Qualcomm XR2 с графическим чипом Adreno 650 и 8 ГБ ОЗУ. Установленные экраны поддерживают работу с контентом в 4К-разрешении и частотой обновления 90 Гц. Также в шлем установлены батареи для автономной работы.
🌍 Сперва Pico 4 появится в продаже в Японии, Южной Корее и 13 европейских странах в октябре 2022 года по цене $420. Позже устройство станет доступным и на других рынках.
#VR #ByteDance
Устройство оборудовано процессором Qualcomm XR2 с графическим чипом Adreno 650 и 8 ГБ ОЗУ. Установленные экраны поддерживают работу с контентом в 4К-разрешении и частотой обновления 90 Гц. Также в шлем установлены батареи для автономной работы.
🌍 Сперва Pico 4 появится в продаже в Японии, Южной Корее и 13 европейских странах в октябре 2022 года по цене $420. Позже устройство станет доступным и на других рынках.
#VR #ByteDance
🏛 Бывшая сотрудница Facebook Фрэнсис Хауген объявила о создании некоммерческой организации Beyond the Screen с целью сделать социальные сети более безопасными.
Эксперты группы планируют создать базу данных с открытым исходным кодом о том, как «техгиганты не выполняют юридические и этические обязательства перед обществом». Затем организация предоставит практические рекомендации по решению поднятых проблем.
🫵 Ранее Хауген обвинила Facebook в намеренном использовании алгоритмов для разжигания ненависти ради прибыли
#Facebook
Эксперты группы планируют создать базу данных с открытым исходным кодом о том, как «техгиганты не выполняют юридические и этические обязательства перед обществом». Затем организация предоставит практические рекомендации по решению поднятых проблем.
🫵 Ранее Хауген обвинила Facebook в намеренном использовании алгоритмов для разжигания ненависти ради прибыли
🤖 DeepMind разработала ИИ-чат-бота Sparrow, обученного на большой языковой модели Chinchilla.
Система предназначена для общения с людьми и ответов на вопросы, используя поиск Google. На основе отзывов от пользователей, Sparrow учится генерировать более полезные диалоги, заявили разработчики.
📝 Чтобы предотвратить опасные или оскорбительные сообщения, инженеры собрали экспериментальную группу и попросили участников выбрать несколько ответов модели на один и тот же вопрос. На основе полученных данных исследователи сформировали 23 правила, которых придерживались при доработке чат-бота.
В итоге Sparrow не дает финансовых советов, ведет себя дружелюбно и не притворяется личностью.
👾 Однако модель все еще допускает ошибки, отметили в DeepMind. Время от времени Sparrow уходит от темы или выдумывает случайные ответы. Некоторые участники также смогли обойти ограничения чат-бота.
#DeepMind #NLP
Система предназначена для общения с людьми и ответов на вопросы, используя поиск Google. На основе отзывов от пользователей, Sparrow учится генерировать более полезные диалоги, заявили разработчики.
📝 Чтобы предотвратить опасные или оскорбительные сообщения, инженеры собрали экспериментальную группу и попросили участников выбрать несколько ответов модели на один и тот же вопрос. На основе полученных данных исследователи сформировали 23 правила, которых придерживались при доработке чат-бота.
В итоге Sparrow не дает финансовых советов, ведет себя дружелюбно и не притворяется личностью.
👾 Однако модель все еще допускает ошибки, отметили в DeepMind. Время от времени Sparrow уходит от темы или выдумывает случайные ответы. Некоторые участники также смогли обойти ограничения чат-бота.
#DeepMind #NLP
💵 Наиболее важные инвестиционные сделки в сфере искусственного интеллекта за последнюю неделю.
✔️ Стартап Zartico получил $20 млн на развитие платформы для туроператоров, продвигающих местный туризм.
✔️ Создатель роботизированных наноцентров для офлайн-ритейлеров 1MRobotics привлек $16,5 млн.
✔️ Federato получил $15 млн на создание платформы для управления рисками страховых компаний.
✔️ Компания Motion, автоматизирующая планирование задач с помощью ИИ, собрала $13 млн.
✔️ Стартап в области компьютерного зрения Voxel51 привлек $12,5 млн.
✔️ Разработчик ИИ-решений для защиты конфиденциальности DynamoFL получил $4,15 млн.
#дайджест
✔️ Стартап Zartico получил $20 млн на развитие платформы для туроператоров, продвигающих местный туризм.
✔️ Создатель роботизированных наноцентров для офлайн-ритейлеров 1MRobotics привлек $16,5 млн.
✔️ Federato получил $15 млн на создание платформы для управления рисками страховых компаний.
✔️ Компания Motion, автоматизирующая планирование задач с помощью ИИ, собрала $13 млн.
✔️ Стартап в области компьютерного зрения Voxel51 привлек $12,5 млн.
✔️ Разработчик ИИ-решений для защиты конфиденциальности DynamoFL получил $4,15 млн.
#дайджест
🤖 Мы собрали наиболее важные новости из мира ИИ за прошедшую неделю.
✔️ Президент США распорядился ограничить иностранные инвестиции в критически важные технологии.
✔️ Nvidia представила профессиональную видеокарту RTX 6000.
✔️ Создатель PyTorch раскритиковал производителей оборудования за оптимизацию чипов для моделей-трансформеров.
✔️ Фотобанки ограничили загрузку и продажу изображений, сгенерированных искусственным интеллектом.
✔️ Блогер намеренно разбил автомобиль, чтобы проверить работоспособность функции определения ДТП в iPhone 14 Pro.
https://forklog.com/?p=185742
#дайджест
✔️ Президент США распорядился ограничить иностранные инвестиции в критически важные технологии.
✔️ Nvidia представила профессиональную видеокарту RTX 6000.
✔️ Создатель PyTorch раскритиковал производителей оборудования за оптимизацию чипов для моделей-трансформеров.
✔️ Фотобанки ограничили загрузку и продажу изображений, сгенерированных искусственным интеллектом.
✔️ Блогер намеренно разбил автомобиль, чтобы проверить работоспособность функции определения ДТП в iPhone 14 Pro.
https://forklog.com/?p=185742
#дайджест
🤝 В SoftBank заявили о намерении создать «стратегический альянс» между производителем микросхем ARM и Samsung.
Для этого генеральный директор холдинга Масаеси Сон намерен посетить Южную Корею и обсудить детали с техгигантом. Других подробностей он не сообщил.
💬 Вице-председатель Samsung Ли Чжэ Ен подтвердил предстоящую встречу. Он предположил, что Сон может выступить с предложением, однако с каким именно он «не имеет понятия».
#ARM #Samsung
Для этого генеральный директор холдинга Масаеси Сон намерен посетить Южную Корею и обсудить детали с техгигантом. Других подробностей он не сообщил.
💬 Вице-председатель Samsung Ли Чжэ Ен подтвердил предстоящую встречу. Он предположил, что Сон может выступить с предложением, однако с каким именно он «не имеет понятия».
#ARM #Samsung
☁️ Британский регулятор проверит Amazon, Microsoft и Google на предмет злоупотреблений на рынке облачных вычислений. Власти определят, создают ли они какие-либо барьеры для конкуренции.
Согласно заявлению, расследование сосредоточится на так называемых «гиперскейлерах» вроде Amazon Web Services, Microsoft Azure и Google Cloud.
👀 В случае обнаружения антиконкурентного поведения регулятор может принять дополнительные меры. Отчет о проверке и рекомендации планируют подготовить в течение 12 месяцев.
#Великобритания #регулирование
Согласно заявлению, расследование сосредоточится на так называемых «гиперскейлерах» вроде Amazon Web Services, Microsoft Azure и Google Cloud.
👀 В случае обнаружения антиконкурентного поведения регулятор может принять дополнительные меры. Отчет о проверке и рекомендации планируют подготовить в течение 12 месяцев.
#Великобритания #регулирование
This media is not supported in your browser
VIEW IN TELEGRAM
👀 Ученые из Meta разработали ИИ-алгоритм QuestSim для отслеживания тела по данным с датчиков VR-гарнитуры и двух контроллеров.
Исследователи обучили систему на искусственно сгенерированной сенсорной информации. Они смоделировали движения гарнитуры и контроллеров на основе восьми часов записи захватов движения 172 человек. Видео включает ходьбу, бег, беседы с жестикуляцией, обсуждения на доске и балансирование.
👤 В результате ИИ натренировался распознавать движения пользователя и предсказывать изменение положения тех частей тела, к которым не прикреплены датчики. Также сгенерированные аватары подчиняются законам физики в симуляторе.
#Meta #исследование
Исследователи обучили систему на искусственно сгенерированной сенсорной информации. Они смоделировали движения гарнитуры и контроллеров на основе восьми часов записи захватов движения 172 человек. Видео включает ходьбу, бег, беседы с жестикуляцией, обсуждения на доске и балансирование.
👤 В результате ИИ натренировался распознавать движения пользователя и предсказывать изменение положения тех частей тела, к которым не прикреплены датчики. Также сгенерированные аватары подчиняются законам физики в симуляторе.
#Meta #исследование
💬 Respeecher с помощью ИИ воссоздала речь Дарта Вейдера в сериале «Оби-Ван Кеноби» 2022 года.
Актер Джеймс Эрл Джонс, озвучивавший лорда-ситха 45 лет, принял решение отказаться от персонажа и передал права на использование своего голоса киностудии Lucasfilm. Та поручила компании сделать так, чтобы Вейдер звучал как «злодей Темной стороны Силы 45-летней давности».
👤 Актер курировал работу кинематографистов и остался доволен результатом.
https://forklog.com/news/ii-ozvuchil-darta-vejdera-v-seriale-po-zvezdnym-vojnam
#дипфейк
Актер Джеймс Эрл Джонс, озвучивавший лорда-ситха 45 лет, принял решение отказаться от персонажа и передал права на использование своего голоса киностудии Lucasfilm. Та поручила компании сделать так, чтобы Вейдер звучал как «злодей Темной стороны Силы 45-летней давности».
👤 Актер курировал работу кинематографистов и остался доволен результатом.
https://forklog.com/news/ii-ozvuchil-darta-vejdera-v-seriale-po-zvezdnym-vojnam
#дипфейк
ForkLog
ИИ озвучил Дарта Вейдера в сериале по «Звездным войнам»
Джеймс Эрл Джонс, являющийся основным голосом Дарта Вейдера в киносаге «Звездные войны», разрешил стартапу Respeecher использовать ИИ для озвучивания персонажа.
🪑 Nvidia представила ИИ-модель GET3D, которая генерирует персонажей, здания, транспортные средства и другие трехмерные объекты.
По словам разработчиков, система создает около 20 предметов в секунду с использованием одного графического процессора. Ее обучили на наборе данных из 2D-изображений объектов, снятых под разными углами.
⚙️ Пользователи могут быстро импортировать трехмерные модели в игровые движки и средства визуализации для редактирования. GET3D создает их в совместимых форматах, отметили в компании.
https://forklog.com/news/nvidia-nauchila-ii-generirovat-trehmernye-obekty/
#Nvidia
По словам разработчиков, система создает около 20 предметов в секунду с использованием одного графического процессора. Ее обучили на наборе данных из 2D-изображений объектов, снятых под разными углами.
⚙️ Пользователи могут быстро импортировать трехмерные модели в игровые движки и средства визуализации для редактирования. GET3D создает их в совместимых форматах, отметили в компании.
https://forklog.com/news/nvidia-nauchila-ii-generirovat-trehmernye-obekty/
#Nvidia
ForkLog
Nvidia научила ИИ генерировать трехмерные объекты
Компания Nvidia представила модель искусственного интеллекта GET3D, которая генерирует персонажей, здания, транспортные средства и другие трехмерные объекты.
🎦 Городской совет Сан-Франциско проголосовал за предоставление доступа полиции к частным камерам видеонаблюдения в режиме реального времени.
В течение 15-месячного эксперимента правоохранители смогут использовать записи с согласия владельцев устройств. Полиции не предоставят постоянный доступ к камерам, однако позволят подключаться к ним при расследовании преступлений. Также правоохранителям разрешат мониторить обстановку во время публичных мероприятий, включая протестов.
🙅♂️ Группы гражданских свобод раскритиковали новые правила. Мэр Сан-Франциско Лондон Брид назвала инициативу необходимой мерой для борьбы с преступностью.
https://forklog.com/news/politsiya-san-frantsisko-poluchit-dostup-k-chastnym-kameram-nablyudeniya/
#США #отслеживание
В течение 15-месячного эксперимента правоохранители смогут использовать записи с согласия владельцев устройств. Полиции не предоставят постоянный доступ к камерам, однако позволят подключаться к ним при расследовании преступлений. Также правоохранителям разрешат мониторить обстановку во время публичных мероприятий, включая протестов.
🙅♂️ Группы гражданских свобод раскритиковали новые правила. Мэр Сан-Франциско Лондон Брид назвала инициативу необходимой мерой для борьбы с преступностью.
https://forklog.com/news/politsiya-san-frantsisko-poluchit-dostup-k-chastnym-kameram-nablyudeniya/
#США #отслеживание
ForkLog
Полиция Сан-Франциско получит доступ к частным камерам наблюдения
Городской совет Сан-Франциско проголосовал за предоставление доступа полиции к частным камерам видеонаблюдения в режиме реального времени.
🧠 В 2023 году OpenBCI выпустит VR-шлем Galea нового поколения, позволяющий управлять игровыми персонажами силой мысли и мимикой.
Гарнитура считывает сигналы мозга, а также движения лицевых мышц и глаз, а затем преобразует их в команды для компьютерного манипулятора. Журналистка Bloomberg Сара Макбрайд смогла управлять котом в VR-игре с помощью сокращения щек, заставляя его идти направо или налево.
По данным компании, шлем виртуальной реальности предназначен для исследователей.
💰 Стоимость текущей версии OpenBCI Galea с необходимым ПО составляет $25 000.
#VR
Гарнитура считывает сигналы мозга, а также движения лицевых мышц и глаз, а затем преобразует их в команды для компьютерного манипулятора. Журналистка Bloomberg Сара Макбрайд смогла управлять котом в VR-игре с помощью сокращения щек, заставляя его идти направо или налево.
По данным компании, шлем виртуальной реальности предназначен для исследователей.
💰 Стоимость текущей версии OpenBCI Galea с необходимым ПО составляет $25 000.
#VR