Транскрипция аудио средствами OpenAI бесплатно
Бесплатный сервис транскрипции и перевода аудиофайлов writeout.ai анонсировали 8 марта. Работает с десятью языками, в том числе русским и клингонским 😳
Сервис использует продукты OpenAI: API Whisper для расшифровки видео и API ChatGPT для перевода фрагментов расшифровки. Доступ к этим инструментам официально открыли как раз 1 марта 2023 года. В документации Whisper написано, что сервис поддерживает русский язык, нам выдало ошибку, возможно дело в географии доступа.
Размер загружаемого файла не должен превышать 25 Мб, фоорматы m4a, mp3, webm, mp4, mpga, wav, mpeg. В дополнительном окне можно ввести подсказки для нейросети, что обеспечит более точный результат.
В твиттере у разработчика интрига, он вынужден платить за API, но сервис предоставляет бесплатно и планов по монетизации у него нет 🤔
Бесплатный сервис транскрипции и перевода аудиофайлов writeout.ai анонсировали 8 марта. Работает с десятью языками, в том числе русским и клингонским 😳
Сервис использует продукты OpenAI: API Whisper для расшифровки видео и API ChatGPT для перевода фрагментов расшифровки. Доступ к этим инструментам официально открыли как раз 1 марта 2023 года. В документации Whisper написано, что сервис поддерживает русский язык, нам выдало ошибку, возможно дело в географии доступа.
Размер загружаемого файла не должен превышать 25 Мб, фоорматы m4a, mp3, webm, mp4, mpga, wav, mpeg. В дополнительном окне можно ввести подсказки для нейросети, что обеспечит более точный результат.
В твиттере у разработчика интрига, он вынужден платить за API, но сервис предоставляет бесплатно и планов по монетизации у него нет 🤔
This media is not supported in your browser
VIEW IN TELEGRAM
Администраторы теперь могут добавлять в Google Meet специальные фоны для применения сотрудниками. Это может быть брендированное изображение или интерьер, не дискредитирующий корпоративную культуру и ценности компании-работодателя.
В настройках нужно разрешить специально сформированной группе пользователей загружать с диска ваши изображения. Эти фоны смогут устанавливать и гости, которых пригласили на встречу ваши сотрудники.
Развертывание опции началось 14 марта 2023 года. Доступно всем клиентам Google Workspace, а также устаревшим клиентам G Suite Basic и Business.
В настройках нужно разрешить специально сформированной группе пользователей загружать с диска ваши изображения. Эти фоны смогут устанавливать и гости, которых пригласили на встречу ваши сотрудники.
Развертывание опции началось 14 марта 2023 года. Доступно всем клиентам Google Workspace, а также устаревшим клиентам G Suite Basic и Business.
Совместное предприятие Ростелекома и VK "Цифровое образование" удалило мобильное приложение образовательной коммуникационной платформы Сферум из магазинов приложений Google Play и AppStore, теперь все общение учителей, школьников и родителей будет в учебном профиле Сферум в VK мессенджере и в десктопной версии платформы — ТАСС
_________
_________
TACC
Совместное предприятие VK и "Ростелекома" удалило "Сферум" из Google Play и AppStore
"Цифровое образование" перенесло функции информационно-коммуникационной платформы в "VK мессенджер"
ClearOne CHAT 150 BT — это новый спикерфон с фирменными технологиями обработки звука и шумоподавлением. Прямое продолжение известной многим USB-модели CHAT 150
Теперь есть и беспроводное подключение. Благодаря поддержке Bluetooth и NFC можно использовать спикерфон с мобильным устройством.
Улучшили качество звука. Спикерфон заранее определяет, с какой стороны находится говорящий, и активирует ближайший к нему микрофон. Остальные микрофоны остаются отключенными, чтобы избежать захвата посторонних шумов.
Мощность динамика 85 дБ. Управлять можно с помощью сенсорного интерфейса на корпусе. Спикерфон традиционно совместим с популярными приложениями для видеосвязи: Microsoft Teams, Zoom, Webex, Google Meet и многими другими.
Ориентировочная стоимость в сети — $425.
Теперь есть и беспроводное подключение. Благодаря поддержке Bluetooth и NFC можно использовать спикерфон с мобильным устройством.
Улучшили качество звука. Спикерфон заранее определяет, с какой стороны находится говорящий, и активирует ближайший к нему микрофон. Остальные микрофоны остаются отключенными, чтобы избежать захвата посторонних шумов.
Мощность динамика 85 дБ. Управлять можно с помощью сенсорного интерфейса на корпусе. Спикерфон традиционно совместим с популярными приложениями для видеосвязи: Microsoft Teams, Zoom, Webex, Google Meet и многими другими.
Ориентировочная стоимость в сети — $425.
Streamplify — это линейка устройств для стриминга от крупного игрового комьюнити Pro Gamers Group, начала активно пиариться в России.
Streamplify CAM — веб-камера 2Мп с разрешением 1080p60. Угол обзора 90°, поворачивается на 360°. Есть автофокусировка и автоматический баланс освещения, встроены два микрофона.
Streamplify MIC ARM — кардиоидный микрофон. Есть два режима шумоподавления: первый для стримов и игр, второй для общения.
HUB CTRL 7 — USB-хаб с шестью портами 3.0 и одним для быстрой зарядки (2 А). Каждый разъем оснащен собственной кнопкой со световой индикацией, которая показывает статус работы.
Ring Light — кольцевая подсветка яркостью 480 люмен. Поддерживается три настройки цветовой температуры в пределах от 3000 до 6000К. В центре — крепление для камеры или смартфона. На выбор две модели — диаметром 26 и 36 см.
Streamplify CAM — веб-камера 2Мп с разрешением 1080p60. Угол обзора 90°, поворачивается на 360°. Есть автофокусировка и автоматический баланс освещения, встроены два микрофона.
Streamplify MIC ARM — кардиоидный микрофон. Есть два режима шумоподавления: первый для стримов и игр, второй для общения.
HUB CTRL 7 — USB-хаб с шестью портами 3.0 и одним для быстрой зарядки (2 А). Каждый разъем оснащен собственной кнопкой со световой индикацией, которая показывает статус работы.
Ring Light — кольцевая подсветка яркостью 480 люмен. Поддерживается три настройки цветовой температуры в пределах от 3000 до 6000К. В центре — крепление для камеры или смартфона. На выбор две модели — диаметром 26 и 36 см.
Стриминг видео из Microsoft Teams
Новый облачный сервис Epiphan Connect позволяет захватывать несколько окон участников конференции Teams без элементов интерфейса, а затем транслировать их на внешние площадки. При этом разрешение видеопотоков низкого качества может быть увеличено до 1080p. Сейчас доступен групповой тариф: можно захватывать до 4 участников, 15 минут бесплатно, потом $25 в час.
Новый облачный сервис Epiphan Connect позволяет захватывать несколько окон участников конференции Teams без элементов интерфейса, а затем транслировать их на внешние площадки. При этом разрешение видеопотоков низкого качества может быть увеличено до 1080p. Сейчас доступен групповой тариф: можно захватывать до 4 участников, 15 минут бесплатно, потом $25 в час.
This media is not supported in your browser
VIEW IN TELEGRAM
"Второй пилот" для Microsoft Teams
Microsoft 365 Copilot — это новый AI-помощник для приложений Word, Excel, PowerPoint и Teams. Причем, говорят, это не просто интеграция с ChatGPT, а системный инструмент, объединивший возможности нового GPT-4 и базы знаний вашего бизнеса в Microsoft Graph.
Copilot сможет подготовить вас к совещанию: выдать краткий пересказ предыдущих серий по теме или чего-то важного, что вы могли пропустить. Напишет черновик ответа на сообщение, предложит ответственных за выполнение той или иной задачи, выдаст организационные обновления — кто вышел из отпуска, кто заболел, у кого первый рабочий день, а также предложит удобное время для проведения следующей встречи.
Кроме того, AI-помощник сделает за вас презентацию в PowerPoint, проанализирует и отформатирует данные в Excel, сгенерирует текст в Word и поможет с письмами в Outlook. Сейчас Copilot тестируется 20 избранными клиентами, однако Microsoft обещает в ближайшие месяцы расширить аудиторию и озвучить цены.
Microsoft 365 Copilot — это новый AI-помощник для приложений Word, Excel, PowerPoint и Teams. Причем, говорят, это не просто интеграция с ChatGPT, а системный инструмент, объединивший возможности нового GPT-4 и базы знаний вашего бизнеса в Microsoft Graph.
Copilot сможет подготовить вас к совещанию: выдать краткий пересказ предыдущих серий по теме или чего-то важного, что вы могли пропустить. Напишет черновик ответа на сообщение, предложит ответственных за выполнение той или иной задачи, выдаст организационные обновления — кто вышел из отпуска, кто заболел, у кого первый рабочий день, а также предложит удобное время для проведения следующей встречи.
Кроме того, AI-помощник сделает за вас презентацию в PowerPoint, проанализирует и отформатирует данные в Excel, сгенерирует текст в Word и поможет с письмами в Outlook. Сейчас Copilot тестируется 20 избранными клиентами, однако Microsoft обещает в ближайшие месяцы расширить аудиторию и озвучить цены.
В Discord появилась возможность настраивать темы для своих чатов. Всего на выбор 17 готовых цветовых схем, в том числе и размытие фона, но только для подписчиков самого дорогого тарифа Discord Nitro за $9,99, в Nitro Basic они отсутствуют.
Те кто не хочет платить, могут воспользоваться приложением BetterDiscord, но придется немного повозиться с кодом. Зато можно конструировать полностью собственные темы, а не только выбирать из предложенных.
Те кто не хочет платить, могут воспользоваться приложением BetterDiscord, но придется немного повозиться с кодом. Зато можно конструировать полностью собственные темы, а не только выбирать из предложенных.
Forwarded from Цифровая эстетика (aka цифровой "колхоз") (Роман Комаров)
В честь приезда Си Цзиньпина в Москву решил попробовать китайский аналог гибрида Zoom|Teams по имени Lark.
Общее впечатление: весьма достойно. Есть всё, что необходимо для джентельменского набора. Чат, правда, реализован странно: не фиксируется отдельной панелью. По UI очередная калька с Zoom, зато ценник в сравнении с последним на платном тарифе куда привлекательнее по соотношению цена/возможности.
Например, за 12 баксов в месяц вместо зумовских 300 участников можно собирать до 500. И вместо жлобских 5 Гб у Zoom аж целый терабайт хранилища в Lark.
Беглый вердикт — весьма достойно. На MS Teams не тянет, но Zoom подвинуть вполне в силу.
Так выпьем же за развитие российско-китайской дружбы ради мира во всем мире
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Про анализ эмоций на видео
"Психологи МГУ им. Ломоносова создали компьютерную программу, которая лучше специалистов-профайлеров считывает микродвижения на лице человека, не задействуя при анализе эмоции.
..."Мы не ищем эмоции. Мы ищем сдвиг бровей, сморщивание носа, растяжение рта по вертикали, горизонтали. Мы научились измерять 22 базовых двигательных единицы, из которых можно составить любое выражение лица, в том числе и выражения эмоций", — объясняет один из разработчиков цифрового профайлера Михаил Баев, психотерапевт, специалист по анализу выражения лица.
..."Движения лица могут быть очень быстрыми – от 200 до 500 миллисекунд. Не каждый человек это может заметить. А нейросети, от использования которых мы отказались, тоже заметить это не могут, потому что их обучают на выборках, которые разметили эксперты. А эксперты, в свою очередь, работают только по фотографиям, на которых вообще нет микродвижений", — подчеркнул профессор Гусев.
...Только для того, чтобы определить одну эмоцию злости, нужно примерно 500 тысяч размеченных сэмплов видео. Кроме этого, в мире не так много экспертов, которые разбираются в мимике, а скорость их работы довольно низка. Самый лучший эксперт оценивает запись одной минуты видео за десять минут работы. Получается, собрать такой датасет будет очень затратным, как по деньгам, так и по времени.
...Информацию о скрытых эмоциях специалисты пытаются извлечь и из звуковой дорожки. Анализ голоса осуществляется по изменению более чем 80-ти физических параметров. Применяется многоуровневый анализ голоса Layered Voice Analysis — технологии, разработанной израильской компанией Nemesysco. Эту технологию называют голосовым детектором лжи", — Газета.Ru
_________
"Психологи МГУ им. Ломоносова создали компьютерную программу, которая лучше специалистов-профайлеров считывает микродвижения на лице человека, не задействуя при анализе эмоции.
..."Мы не ищем эмоции. Мы ищем сдвиг бровей, сморщивание носа, растяжение рта по вертикали, горизонтали. Мы научились измерять 22 базовых двигательных единицы, из которых можно составить любое выражение лица, в том числе и выражения эмоций", — объясняет один из разработчиков цифрового профайлера Михаил Баев, психотерапевт, специалист по анализу выражения лица.
..."Движения лица могут быть очень быстрыми – от 200 до 500 миллисекунд. Не каждый человек это может заметить. А нейросети, от использования которых мы отказались, тоже заметить это не могут, потому что их обучают на выборках, которые разметили эксперты. А эксперты, в свою очередь, работают только по фотографиям, на которых вообще нет микродвижений", — подчеркнул профессор Гусев.
...Только для того, чтобы определить одну эмоцию злости, нужно примерно 500 тысяч размеченных сэмплов видео. Кроме этого, в мире не так много экспертов, которые разбираются в мимике, а скорость их работы довольно низка. Самый лучший эксперт оценивает запись одной минуты видео за десять минут работы. Получается, собрать такой датасет будет очень затратным, как по деньгам, так и по времени.
...Информацию о скрытых эмоциях специалисты пытаются извлечь и из звуковой дорожки. Анализ голоса осуществляется по изменению более чем 80-ти физических параметров. Применяется многоуровневый анализ голоса Layered Voice Analysis — технологии, разработанной израильской компанией Nemesysco. Эту технологию называют голосовым детектором лжи", — Газета.Ru
_________
Газета.Ru
Lie to me. В МГУ создали программу, которая лучше специалистов считывает микродвижения лица
Почему ученые передовых стран решили отказаться от анализа эмоций и использования нейросетей для анализа поведения людей? В чем нейросети ошибаются, когда пытаются «прочесть» выражение лица человека и предположить, о чем он думает? Как работает созданная…
Apple пока не будет выпускать HomePod с 7-дюймовым дисплеем, про который недавно ходили слухи
_________
_________
iXBT.com
Apple отложила выпуск HomePod с экраном
Компания Apple приняла решение отложить выпуск гаджета, который ожидался в следующем году. Умная колонка HomePod с экраном теперь задерживается, самое раннее, до следующего года.
Google Glass всё
Google с 15 марта официально прекратил продажу своих AR-очков Glass Enterprise Edition. Поддерживать устройства будут до 15 сентября 2023 года. Дальше ими можно будет пользоваться, однако компания предупредила, что за корректную работу запущенного около года назад приложения для видеозвонков Meet on Glass она отвечать не будет.
Google с 15 марта официально прекратил продажу своих AR-очков Glass Enterprise Edition. Поддерживать устройства будут до 15 сентября 2023 года. Дальше ими можно будет пользоваться, однако компания предупредила, что за корректную работу запущенного около года назад приложения для видеозвонков Meet on Glass она отвечать не будет.