Технозаметки Малышева

Тюнинг моделей на основе больших языковых моделей (LLM) с помощью машинно сгенерированных данных

- Эксперименты на основе датасета COCO проводились с использованием GPT-4, что позволило собрать 158 тысяч уникальных образцов с тестами на уровне языка и изображений.
- Данные включали в себя более 58 тысяч разговоров, 23 тысячи подробных описаний и 77 тысяч отдельных образцов сложного мышления.

- LLaVa использует интеграцию CLIP ViT-L/14 и модели Vicuna для обучения.

- Эксперименты показали, что LLaVa достигает 85,1% относительного балла в сравнении с GPT-4.
- Новый подход может значительно повысить возможности применения машинного обучения в мультимодальных настройках.

Разработка такого подхода позволит увеличить эффективность работы с большими языковыми моделями и обучением на разнообразных типах данных.

#LLaVa #GPT4 #CLIPViT-L

17 views10:17

Обновления и продукты для разработчиков от OpenAI

- Объявлен релиз новых моделей: GPT-4 Turbo с 128K контекстом и сниженными ценами, API для взаимодействия с готовыми моделями и GPT-4 Turbo с поддержкой обработки изображений, а также DALL·E 3 API.
- GPT-4 Turbo обзавелась возможностями вызова функций приложения или сторонних API, поддержка JSON и улучшенным вызовом функций.
- Представлен Assistants API для создания приложений в стиле "агентов" с помощью инструкций, вызова функций и инструментов Code Interpreter и Retrieval.
- GPT-4 Turbo теперь может работать с изображениями через API для создания подписей, анализа изображений и чтения документов с рисунками.
- Интегрирована модель DALL·E 3 в API для генерации изображений и дизайна.
- Реализована функция конвертации текста в речь через text-to-speech API модели TTS.
- Запущена экспериментальная программа для fine-tuning модели GPT-4 и Custom Models program для обучения на особенных для организации данных.
- Снижены цены на платформу OpenAI, увеличены лимиты на количество токенов в минуту для платных пользователей GPT-4.
- Защита от авторских прав через опцию Copyright Shield.
- Осуществлено дальнейшее открытие исходного кода модели Whisper large-v3 и Consistency Decoder для улучшения визуальных моделей и распознавания речи.

Теперь разработчики получили ещё больше возможностей для создания интуитивно понятных и полезных решений на базе AI.

#OpenAI #GPT4 #API

Keynote Video

Openai

New models and developer products announced at DevDay

GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more.

250 viewsedited 18:51

Технозаметки Малышева

OpenAI запускает программу Custom Models для GPT-4

- Custom Models от OpenAI позволит компаниям тренировать персонализированные модели GPT-4.
- Процесс включает модификацию от предварительной тренировки до обучения с подкреплением.
- Участники получат эксклюзивный доступ к созданным моделям.
- Программа нацелена на организации с огромными объёмами данных.
Программа сделает AI персонализированным, открывая новые горизонты в использовании больших данных.

Ценник от $2млн.

#OpenAI #CustomModels #GPT4

Openai

OpenAI Platform

Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.

65 views06:46

Технозаметки Малышева

Vectara создал рейтинг LLM по частоте "галлюцинаций" при кратком изложении

- Платформа Vectara представила рейтинг "LLM Leaderboard".
- Оценка верности краткого изложения выполнена на основе 1000 текстов.
- GPT-4 и GPT-3.5 занимают лидирующие позиции, за ними следует модель LLaMA от Meta.

Это мы смотрим.

#Vectara #GPT4 #LLM

34 views13:55

Технозаметки Малышева

ИИ в безопасности: оценка эффективности LLM в обнаружении уязвимостей

Исследование излагает эффективность использования Large Language Models (LLM) для обнаружения уязвимостей.

LLM сопоставляют с инструментами статического анализа и классическими подходами машинного обучения.

GPT-4 в сочетании с CodeQL показывает точность в 96-97%.

Использование LLM с расширенным контекстом показывает высокий потенциал.

Обсуждение касается особенностей синтетических данных и данных из реальной жизни, но без подробных результатов.

ИИ развивается в кибербезе.

#ИБ #GPT4 #CodeQL

91 viewsedited 12:36

Технозаметки Малышева

Искусственный интеллект в праве: результаты тестирования цифровых юристов

Исследователи провели тестирование ряда AI моделей для создания цифрового юриста.
GPT4, GPT3.5, YandexGPT, GigaChat, и Saiga были вынесены на испытание.
Цель эксперимента – ответы на вопросы юридической тематики по большому корпусу текстов.
Эффективность моделей проверялась на основе адекватности ответов по мнению экспертов.
Применялись различные токенизаторы и подходы к преобразованию текста в векторы.
Лучшие результаты показал GPT4-Turbo с токенайзером ada-02.
GigaChat с токенайзером RuBert-Large признан наименее эффективным.
Выбор токенизатора оказывает значимое влияние на работу языковых моделей.
Подробные результаты испытаний ожидаются во второй части статьи.

#AI #GPT4 #LegalTech

99 views09:22

Технозаметки Малышева

😳 шустро как.

#GPT5 #GPT4.5

🔥1

101 viewsedited 15:01

Технозаметки Малышева

Copilot от Microsoft теперь доступен для любого бизнеса

Microsoft значительно расширила доступность своего AI-помощника Copilot.
Теперь без ограничений по количеству пользователей Copilot доступен для любых бизнесов.
Доступ предоставлен пользователям Office 365 E3 и E5, а также подписчикам Microsoft 365 Business Standard и Premium.
Стоимость подписки составляет $30 в месяц на пользователя.
AI Copilot, основанный на GPT-4 от OpenAI, умеет генерировать тексты, создавать презентации и помогать в Excel.
В Teams Copilot поможет с описаниями встреч и составлением писем.
Copilot предлагается в трёх версиях: бесплатной, Copilot Pro за $20 и Copilot for Microsoft 365 за $30 в месяц.
Открытие доступа ускорит интеграцию AI в повседневные рабочие задачи малого и среднего бизнеса.

AI в каждый офис.

https://youtu.be/8QXS-boCQZI?si=CtPfDSQWR5zvfvhZ

#Microsoft #Copilot #GPT4

114 viewsedited 06:10

Технозаметки Малышева

Nvidia обходит GPT-4 с моделью ChatQA

Команда Nvidia представила ChatQA, новый конкурент GPT-4.
ChatQA базируется на методике настройки инструкций, делая акцент на уменьшение 'галлюцинаций'.
Методика включает в себя плотный поиск ответов и донастройку модели без синтетических данных.
ChatQA показала лучшие результаты на тестах по сравнению с GPT-4, особенно в задачах 'unanswerable'.

В некоторых тестах. на долю процента, но успех есть.
Интересно, что NVidia выводит на рынок своего трансформера.
На фоне того как МС собирается делать свои процессоры.

#Nvidia #ChatQA #GPT4

101 viewsedited 19:11

Технозаметки Малышева

AnyTool - 16 тысяч API под контролем GPT

AnyTool - инновационный агент на базе LLM, предназначенный для работы с более чем 16,000 API от RapidAPI.
Состоит из иерархического поисковика API, решателя задач и механизма саморефлексии для постоянного самоусовершенствования.
Использует функцию вызова GPT-4, исключая необходимость во внешнем обучении.
Вводит новый бенчмарк AnyToolBench для оценки эффективности в реальных сценариях использования.
Превосходит существующие модели, включая ToolLLM и варианты GPT-4, в эффективности использования API для генерации ответов.
Интеграция иерархического поисковика API, решателя и механизма саморефлексии в единую систему - ключевое новшество AnyTool.

Интересное решение, добавить поисковик по API.

#AnyTool #GPT4 #API

🔥1

108 views07:03

Технозаметки Малышева

Microsoft Security Copilot выйдет из закрытого релиза и станет доступен всем заказчикам

С 1 апреля 2024 года выходит Microsoft Security Copilot, инновационной подписной услуги, работающей на основе ИИ.
Работает как через отдельный портал, так и в через интеграцию с продуктами Microsoft - Sentinel и Defender XDR в числе прочих.
Security Copilot, построенный на GPT-4, - ассистент инженера безопасности для обработки запросов, предоставления рекомендаций и усиления мер борьбы с цифровыми угрозами.

Оплата по модели 'pay-as-you-go' через Microsoft Azure, примерная оценка - 4 доллара в час по тарифу Security Compute Unit.

Применение Security Copilot позволяет ускорить выполнение задач на 22%, а скорость реагирования на инциденты может возрасти на 26%.

Среди других преимуществ - мультиязычность, расширенные отчеты и возможность интеграции с корпоративной базой знаний.

#Microsoft #SecurityCopilot #GPT4
-------
@tsingular

111 viewsedited 18:10

Технозаметки Малышева

Маск обещает ИИ, превосходящий человеческий ум уже к концу следующего года

Элон Маск предсказывает, что искусственный интеллект обгонит человеческий уже к концу следующего года, если будут решены вопросы с электроснабжением и оборудованием.

В следующие пять лет возможности ИИ могут превзойти возможности всех людей. (2029й)

Прогресс на пути развития ИИ, включая генерацию видео и чат-боты, идет быстрее, чем ожидалось.
Ограничения в развитии ИИ, в основном, связаны с доступностью микроэлементов и энергии.

Маск разрабатывает собственный стартап xAI, цель - создать ИИ, способный превзойти GPT-4.

Он также ищет инвестиции для конкуренции с OpenAI, ценой стартапа в $18 млрд.

2029й. точно по расписанию.

#ElonMusk #xAI #GPT4

👍1

103 views03:53

Технозаметки Малышева

OpenAI открывает офис в Японии и выпускает GPT-4 на японском

Компания нацелена сотрудничать с японским правительством, компаниями и институтами для разработки безопасных ИИ-инструментов.
Тадао Нагасаки назначен президентом OpenAI Japan для интеграции в местное сообщество.
Выпущена специальная версия GPT-4 для японского языка, работающая в 3 раза быстрее и обеспечивающая улучшенный перевод и обобщение текстов.
Японские компании Daikin, Rakuten и TOYOTA Connected уже используют ChatGPT Enterprise для автоматизации процессов и анализа данных.
Город Йокосука применяет ChatGPT для повышения эффективности госуслуг, 80% сотрудников отмечают рост производительности.
OpenAI стремится помочь решить социальные проблемы региона, такие как депопуляция сельских районов и нехватка рабочей силы.

#OpenAI #Japan #GPT4
-------
@tsingular

👍1

117 views06:24

Технозаметки Малышева

GPT-4 способен автономно эксплуатировать уязвимости

Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.

ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.

#Pentesting #GPT4 #CyberSecurity
-------
@tsingular

403 viewsedited 12:05

About

Blog

Apps

Platform