ForkLog AI
11K subscribers
1.47K photos
247 videos
12 files
4.93K links
Культовый журнал об искусственном интеллекте, нейронках и машинном обучении.


Наши эксперименты с нейронными сетями: https://www.tiktok.com/@forklogai.

Реклама на ForkLog: https://forklog.com/advertisement/
Download Telegram
📰 Информационный портал CNET почти 75 раз использовал искусственный интеллект для написания серии статей на финансовую тематику.

Статьи выходили под именем CNET Money Staff. При переходе на страницу автора указано, что материал создан с использованием искусственного интеллекта. Биография также утверждает, что каждая статья тщательно проверена и отредактирована сотрудниками издания.

🙅‍♂️ После обнародования портал изменил информацию об авторе и удалил слово Staff из его имени. Представители CNET ситуацию не прокомментировали.

https://forklog.com/news/ai/ii-tri-mesyatsa-pisal-stati-dlya-populyarnogo-internet-izdaniya

#NLP
👀 Исследователи Google научили ИИ расшифровывать клинические сокращения и аббревиатуры.

Они натренировали алгоритм на общедоступных медицинских данных без привязки к пациентам. Также ученые использовали словарь, состоящий из тысяч клинических сокращений и их расшифровок.

Исследователи взяли текстовые заметки из интернета, включающие предложения с расширенными версиями аббревиатур. Затем переписали их, используя сокращения.

📝 В результате ИИ научился правильно расширять аббревиатуры в 98% случаев. Для сравнения, неспециалисты расшифровывали сокращения с точностью 30%, а студенты-медики и квалифицированные врачи — 90%.

#Google #NLP
📰 Интернет-издание CNET продолжит использовать искусственный интеллект для написания статей, заявила главная редакторка журнала Конни Гульельмо.

По ее словам, журнал хочет идти в ногу со временем. Каждая ИИ-статья тщательно проверяется редакторами перед публикацией. Более того, материалы создавались языковой моделью не с нуля, а на основе черновика написанного сотрудником черновика, добавила Гульельмо.

😬 Однако после обнаруженных ошибок издание провело аудит сгенерированных статей. Сотрудники CNET выявили ряд проблем и пообещали устранить их. Также CNET начнет информировать пользователей, что они читают сгенерированный искусственным интеллектом текст.

https://forklog.com/news/ai/cnet-prodolzhit-pisat-stati-s-pomoshhyu-ii

#NLP
ElevenLabs сообщила о приостановке тестирования ИИ-сервиса клонирования голоса из-за «растущего числа случаев злоупотреблений».

Пользователи 4chan использовали продукт с целью создания дипфейков знаменитостей для распространения расистских и гомофобных высказываний. В одном из клипов голос, имитирующий актрису Эмму Уотсон, читает отрывок из «Майн кампф». В другом дипфейк политического комментатора Бена Шарпио делает расистские замечания в адрес конгрессвумен Александрии Окасио-Кортес.

☝️ Вскоре после распространения клипов в ElevenLabs признали проблему. Представители компании заявили, что изучают дополнительные меры безопасности для предотвращения злоупотреблений в будущем.

https://forklog.com/news/ai/startap-obvinili-v-rasprostranenii-rasistskih-audiodipfejkov

#дипфейк #NLP
💬 Meta выпустила большую языковую модель LLaMA для исследователей искусственного интеллекта с 13 млрд и 65 млрд параметров.

После обучения LLaMA-13B можно запустить на одном графическом процессоре Nvidia Tesla V100. По словам разработчиков, это «демократизирует» вычисления для небольших учреждений, не имеющих мощного оборудования.

🔎 В Meta считают, что LaMMA поможет ИИ-экспертам выявить проблемы языковых моделей на предмет предвзятости, токсичности и склонности выдумывать информацию. Для этого они выпустили алгоритм под некоммерческой лицензией.

https://forklog.com/news/ai/meta-predstavila-yazykovuyu-model-llama

#Meta #NLP
🗣 Журналист Motherboard Джозеф Кокс «обманул» голосовой идентификатор банка с помощью бесплатного ИИ-сервиса для синтеза речи.

Репортер использовал ПО компании ElevenLabs. Он записал около пяти минут речи, зачитав разделы европейского закона о защите данных.

Кокс позвонил в британский банк Lloyds Bank, использующий систему Voice ID для идентификации клиентов по голосу. Он вручную ввел ответы на вопросы робооператора, а затем озвучил их алгоритмом ElevenLabs. В результате репортер смог обойти ПО учреждения и узнать баланс счета.

⚙️ По словам Кокса, он протестировал несколько сервисов голосового ИИ, но у них были проблемы или ограничения с воссозданием британского акцента. Система ElevenLabs хорошо справилась с этой задачей, добавил журналист.

#исследование #NLP
☎️ Мошенники стали чаще применять технологии имитации голоса на базе искусственного интеллекта для шантажа родственников жертв.

Эксперты предупредили, что правоохранительная система не способна предотвратить наплыв ИИ-технологий клонирования речи. По их словам, сегодня уже доступны инструменты, позволяющие воссоздать голос по 30-секундному аудиофайлу.

😔 В FTC признали проблему. В 2022 году ведомство зафиксировало более 5100 случаев вымогательств по телефону.

https://forklog.com/news/ai/aferisty-vooruzhilis-ii-dlya-imitatsii-golosov-rodstvennikov-svoih-zhertv

#дипфейки #NLP
🗣 Google поделилась прогрессом в создании Universal Speech Model (USM), поддерживающей 1000 различных языков.

По данным разработчиков, модель имеет 2 млрд параметров. Ее обучили на 12 млн часов речи и 28 млрд предложений.

🌐 На сегодня USM поддерживает более 100 языков. Модель уже используют в YouTube для автоматического создания субтитров.

#Google #NLP
🚰 Большая языковая модель LLaMA компании Meta утекла в сеть. Исходный код инструмента появился на имиджборде 4chan.

Компания представила модель в конце февраля. Доступ к ней имело утвержденное число пользователей.

Техгигант не стал отрицать утечку. Также представитель Meta подтвердил приверженность к открытости моделей для исследователей.

#Meta #NLP
📰 Владелец крупнейших британских таблоидов Reach начал публиковать ИИ-статьи на одном из своих региональных новостных сайтов.

Один из таких материалов называется «Семь вещей, которые нужно сделать в Ньюпорте». В нем ИИ объединил информацию о местах и мероприятиях, доступных в одноименном валлийском городе.

💬 По словам генерального директора Reach Джима Маллена, все статьи проходят проверку. Издательство пошло на такой шаг для сокращения расходов на фоне снижения прибыли от рекламы.

#NLP
🗣 Жена покойного игрового критика Джона Бейна рассматривает возможность удалить контент мужа из интернета из-за использования его голоса для обучения ИИ.

По словам вдовы блогера Джины Бейн, люди с помощью искусственного интеллекта клонируют речь комментатора, умершего в 2018 году, и продвигают различные политические взгляды и токсичные социальные высказывания. Для обучения ИИ они используют видео из YouTube-канала TotalBiscuit с более чем 3000 роликов.

🤔 Журналисты Motherboard прослушали несколько подобных записей и подтвердили, что в них используется синтезированная речь Бейна. По данным издания, в одном аудиоматериале ИИ-критик произносит трансфобное заявление, в другом — зачитывает строчку из документального фильма What Is a Woman политического обозревателя Мэтта Уолша.

#NLP
💍 Платформа для планирования свадеб Joy запустила ИИ-помощника Wedding Writer's Block для написания связанных с торжеством текстов.

Сервис использует языковые технологии OpenAI. ИИ-ассистент предназначен для создания клятв, тостов и других «свадебных» текстов. По данным компании, инструмент поможет написать историю любви на личный сайт, благодарственные открытки и письма с вежливым отклонением приглашения на торжество.

📝 Ассистент также предлагает пользователям выбрать тон текста, чтобы создать речь в стиле кого-либо, включая Уильяма Шекспира, пирата, психотерапевта, тиктокера или астролога.

#NLP
💬 Meta представила семейство языковых ИИ-моделей Massively Multilingual Speech (MMS). Исходный код проекта доступен на GitHub.

MMS могут идентифицировать более 4000 разговорных языков, что в 40 раз превышает возможности существующих аналогов. Также алгоритмы научили синтезировать речь и преобразовывать ее в текст на около 1100 диалектах.

Для обучения моделей разработчики использовали Новый Завет, на основе которого создали два датасета. Первый содержит аудио и текст на 1107 языках. Второй включает немаркированные записи речи на 3809 диалектах.

☝️ В компании предупредили, что иногда MMS способны неправильно расшифровать определенные слова и фразы. Также в Библии много предвзятости и искажений, добавили в Meta.

#Meta #NLP