Тюнинг моделей на основе больших языковых моделей (LLM) с помощью машинно сгенерированных данных
- Эксперименты на основе датасета COCO проводились с использованием GPT-4, что позволило собрать 158 тысяч уникальных образцов с тестами на уровне языка и изображений.
- Данные включали в себя более 58 тысяч разговоров, 23 тысячи подробных описаний и 77 тысяч отдельных образцов сложного мышления.
- LLaVa использует интеграцию CLIP ViT-L/14 и модели Vicuna для обучения.
- Эксперименты показали, что LLaVa достигает 85,1% относительного балла в сравнении с GPT-4.
- Новый подход может значительно повысить возможности применения машинного обучения в мультимодальных настройках.
Разработка такого подхода позволит увеличить эффективность работы с большими языковыми моделями и обучением на разнообразных типах данных.
#LLaVa #GPT4 #CLIPViT-L
- Эксперименты на основе датасета COCO проводились с использованием GPT-4, что позволило собрать 158 тысяч уникальных образцов с тестами на уровне языка и изображений.
- Данные включали в себя более 58 тысяч разговоров, 23 тысячи подробных описаний и 77 тысяч отдельных образцов сложного мышления.
- LLaVa использует интеграцию CLIP ViT-L/14 и модели Vicuna для обучения.
- Эксперименты показали, что LLaVa достигает 85,1% относительного балла в сравнении с GPT-4.
- Новый подход может значительно повысить возможности применения машинного обучения в мультимодальных настройках.
Разработка такого подхода позволит увеличить эффективность работы с большими языковыми моделями и обучением на разнообразных типах данных.
#LLaVa #GPT4 #CLIPViT-L
Обновления и продукты для разработчиков от OpenAI
- Объявлен релиз новых моделей: GPT-4 Turbo с 128K контекстом и сниженными ценами, API для взаимодействия с готовыми моделями и GPT-4 Turbo с поддержкой обработки изображений, а также DALL·E 3 API.
- GPT-4 Turbo обзавелась возможностями вызова функций приложения или сторонних API, поддержка JSON и улучшенным вызовом функций.
- Представлен Assistants API для создания приложений в стиле "агентов" с помощью инструкций, вызова функций и инструментов Code Interpreter и Retrieval.
- GPT-4 Turbo теперь может работать с изображениями через API для создания подписей, анализа изображений и чтения документов с рисунками.
- Интегрирована модель DALL·E 3 в API для генерации изображений и дизайна.
- Реализована функция конвертации текста в речь через text-to-speech API модели TTS.
- Запущена экспериментальная программа для fine-tuning модели GPT-4 и Custom Models program для обучения на особенных для организации данных.
- Снижены цены на платформу OpenAI, увеличены лимиты на количество токенов в минуту для платных пользователей GPT-4.
- Защита от авторских прав через опцию Copyright Shield.
- Осуществлено дальнейшее открытие исходного кода модели Whisper large-v3 и Consistency Decoder для улучшения визуальных моделей и распознавания речи.
Теперь разработчики получили ещё больше возможностей для создания интуитивно понятных и полезных решений на базе AI.
#OpenAI #GPT4 #API
Keynote Video
- Объявлен релиз новых моделей: GPT-4 Turbo с 128K контекстом и сниженными ценами, API для взаимодействия с готовыми моделями и GPT-4 Turbo с поддержкой обработки изображений, а также DALL·E 3 API.
- GPT-4 Turbo обзавелась возможностями вызова функций приложения или сторонних API, поддержка JSON и улучшенным вызовом функций.
- Представлен Assistants API для создания приложений в стиле "агентов" с помощью инструкций, вызова функций и инструментов Code Interpreter и Retrieval.
- GPT-4 Turbo теперь может работать с изображениями через API для создания подписей, анализа изображений и чтения документов с рисунками.
- Интегрирована модель DALL·E 3 в API для генерации изображений и дизайна.
- Реализована функция конвертации текста в речь через text-to-speech API модели TTS.
- Запущена экспериментальная программа для fine-tuning модели GPT-4 и Custom Models program для обучения на особенных для организации данных.
- Снижены цены на платформу OpenAI, увеличены лимиты на количество токенов в минуту для платных пользователей GPT-4.
- Защита от авторских прав через опцию Copyright Shield.
- Осуществлено дальнейшее открытие исходного кода модели Whisper large-v3 и Consistency Decoder для улучшения визуальных моделей и распознавания речи.
Теперь разработчики получили ещё больше возможностей для создания интуитивно понятных и полезных решений на базе AI.
#OpenAI #GPT4 #API
Keynote Video
Openai
New models and developer products announced at DevDay
GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more.
OpenAI запускает программу Custom Models для GPT-4
- Custom Models от OpenAI позволит компаниям тренировать персонализированные модели GPT-4.
- Процесс включает модификацию от предварительной тренировки до обучения с подкреплением.
- Участники получат эксклюзивный доступ к созданным моделям.
- Программа нацелена на организации с огромными объёмами данных.
Программа сделает AI персонализированным, открывая новые горизонты в использовании больших данных.
Ценник от $2млн.
#OpenAI #CustomModels #GPT4
- Custom Models от OpenAI позволит компаниям тренировать персонализированные модели GPT-4.
- Процесс включает модификацию от предварительной тренировки до обучения с подкреплением.
- Участники получат эксклюзивный доступ к созданным моделям.
- Программа нацелена на организации с огромными объёмами данных.
Программа сделает AI персонализированным, открывая новые горизонты в использовании больших данных.
Ценник от $2млн.
#OpenAI #CustomModels #GPT4
Openai
OpenAI Platform
Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.
Vectara создал рейтинг LLM по частоте "галлюцинаций" при кратком изложении
- Платформа Vectara представила рейтинг "LLM Leaderboard".
- Оценка верности краткого изложения выполнена на основе 1000 текстов.
- GPT-4 и GPT-3.5 занимают лидирующие позиции, за ними следует модель LLaMA от Meta.
Это мы смотрим.
#Vectara #GPT4 #LLM
- Платформа Vectara представила рейтинг "LLM Leaderboard".
- Оценка верности краткого изложения выполнена на основе 1000 текстов.
- GPT-4 и GPT-3.5 занимают лидирующие позиции, за ними следует модель LLaMA от Meta.
Это мы смотрим.
#Vectara #GPT4 #LLM
ИИ в безопасности: оценка эффективности LLM в обнаружении уязвимостей
Исследование излагает эффективность использования Large Language Models (LLM) для обнаружения уязвимостей.
LLM сопоставляют с инструментами статического анализа и классическими подходами машинного обучения.
GPT-4 в сочетании с CodeQL показывает точность в 96-97%.
Использование LLM с расширенным контекстом показывает высокий потенциал.
Обсуждение касается особенностей синтетических данных и данных из реальной жизни, но без подробных результатов.
ИИ развивается в кибербезе.
#ИБ #GPT4 #CodeQL
Исследование излагает эффективность использования Large Language Models (LLM) для обнаружения уязвимостей.
LLM сопоставляют с инструментами статического анализа и классическими подходами машинного обучения.
GPT-4 в сочетании с CodeQL показывает точность в 96-97%.
Использование LLM с расширенным контекстом показывает высокий потенциал.
Обсуждение касается особенностей синтетических данных и данных из реальной жизни, но без подробных результатов.
ИИ развивается в кибербезе.
#ИБ #GPT4 #CodeQL
Искусственный интеллект в праве: результаты тестирования цифровых юристов
Исследователи провели тестирование ряда AI моделей для создания цифрового юриста.
GPT4, GPT3.5, YandexGPT, GigaChat, и Saiga были вынесены на испытание.
Цель эксперимента – ответы на вопросы юридической тематики по большому корпусу текстов.
Эффективность моделей проверялась на основе адекватности ответов по мнению экспертов.
Применялись различные токенизаторы и подходы к преобразованию текста в векторы.
Лучшие результаты показал GPT4-Turbo с токенайзером ada-02.
GigaChat с токенайзером RuBert-Large признан наименее эффективным.
Выбор токенизатора оказывает значимое влияние на работу языковых моделей.
Подробные результаты испытаний ожидаются во второй части статьи.
#AI #GPT4 #LegalTech
Исследователи провели тестирование ряда AI моделей для создания цифрового юриста.
GPT4, GPT3.5, YandexGPT, GigaChat, и Saiga были вынесены на испытание.
Цель эксперимента – ответы на вопросы юридической тематики по большому корпусу текстов.
Эффективность моделей проверялась на основе адекватности ответов по мнению экспертов.
Применялись различные токенизаторы и подходы к преобразованию текста в векторы.
Лучшие результаты показал GPT4-Turbo с токенайзером ada-02.
GigaChat с токенайзером RuBert-Large признан наименее эффективным.
Выбор токенизатора оказывает значимое влияние на работу языковых моделей.
Подробные результаты испытаний ожидаются во второй части статьи.
#AI #GPT4 #LegalTech
Copilot от Microsoft теперь доступен для любого бизнеса
Microsoft значительно расширила доступность своего AI-помощника Copilot.
Теперь без ограничений по количеству пользователей Copilot доступен для любых бизнесов.
Доступ предоставлен пользователям Office 365 E3 и E5, а также подписчикам Microsoft 365 Business Standard и Premium.
Стоимость подписки составляет $30 в месяц на пользователя.
AI Copilot, основанный на GPT-4 от OpenAI, умеет генерировать тексты, создавать презентации и помогать в Excel.
В Teams Copilot поможет с описаниями встреч и составлением писем.
Copilot предлагается в трёх версиях: бесплатной, Copilot Pro за $20 и Copilot for Microsoft 365 за $30 в месяц.
Открытие доступа ускорит интеграцию AI в повседневные рабочие задачи малого и среднего бизнеса.
AI в каждый офис.
https://youtu.be/8QXS-boCQZI?si=CtPfDSQWR5zvfvhZ
#Microsoft #Copilot #GPT4
Microsoft значительно расширила доступность своего AI-помощника Copilot.
Теперь без ограничений по количеству пользователей Copilot доступен для любых бизнесов.
Доступ предоставлен пользователям Office 365 E3 и E5, а также подписчикам Microsoft 365 Business Standard и Premium.
Стоимость подписки составляет $30 в месяц на пользователя.
AI Copilot, основанный на GPT-4 от OpenAI, умеет генерировать тексты, создавать презентации и помогать в Excel.
В Teams Copilot поможет с описаниями встреч и составлением писем.
Copilot предлагается в трёх версиях: бесплатной, Copilot Pro за $20 и Copilot for Microsoft 365 за $30 в месяц.
Открытие доступа ускорит интеграцию AI в повседневные рабочие задачи малого и среднего бизнеса.
AI в каждый офис.
https://youtu.be/8QXS-boCQZI?si=CtPfDSQWR5zvfvhZ
#Microsoft #Copilot #GPT4
Nvidia обходит GPT-4 с моделью ChatQA
Команда Nvidia представила ChatQA, новый конкурент GPT-4.
ChatQA базируется на методике настройки инструкций, делая акцент на уменьшение 'галлюцинаций'.
Методика включает в себя плотный поиск ответов и донастройку модели без синтетических данных.
ChatQA показала лучшие результаты на тестах по сравнению с GPT-4, особенно в задачах 'unanswerable'.
В некоторых тестах. на долю процента, но успех есть.
Интересно, что NVidia выводит на рынок своего трансформера.
На фоне того как МС собирается делать свои процессоры.
#Nvidia #ChatQA #GPT4
Команда Nvidia представила ChatQA, новый конкурент GPT-4.
ChatQA базируется на методике настройки инструкций, делая акцент на уменьшение 'галлюцинаций'.
Методика включает в себя плотный поиск ответов и донастройку модели без синтетических данных.
ChatQA показала лучшие результаты на тестах по сравнению с GPT-4, особенно в задачах 'unanswerable'.
В некоторых тестах. на долю процента, но успех есть.
Интересно, что NVidia выводит на рынок своего трансформера.
На фоне того как МС собирается делать свои процессоры.
#Nvidia #ChatQA #GPT4
AnyTool - 16 тысяч API под контролем GPT
AnyTool - инновационный агент на базе LLM, предназначенный для работы с более чем 16,000 API от RapidAPI.
Состоит из иерархического поисковика API, решателя задач и механизма саморефлексии для постоянного самоусовершенствования.
Использует функцию вызова GPT-4, исключая необходимость во внешнем обучении.
Вводит новый бенчмарк AnyToolBench для оценки эффективности в реальных сценариях использования.
Превосходит существующие модели, включая ToolLLM и варианты GPT-4, в эффективности использования API для генерации ответов.
Интеграция иерархического поисковика API, решателя и механизма саморефлексии в единую систему - ключевое новшество AnyTool.
Интересное решение, добавить поисковик по API.
#AnyTool #GPT4 #API
AnyTool - инновационный агент на базе LLM, предназначенный для работы с более чем 16,000 API от RapidAPI.
Состоит из иерархического поисковика API, решателя задач и механизма саморефлексии для постоянного самоусовершенствования.
Использует функцию вызова GPT-4, исключая необходимость во внешнем обучении.
Вводит новый бенчмарк AnyToolBench для оценки эффективности в реальных сценариях использования.
Превосходит существующие модели, включая ToolLLM и варианты GPT-4, в эффективности использования API для генерации ответов.
Интеграция иерархического поисковика API, решателя и механизма саморефлексии в единую систему - ключевое новшество AnyTool.
Интересное решение, добавить поисковик по API.
#AnyTool #GPT4 #API
🔥1
Microsoft Security Copilot выйдет из закрытого релиза и станет доступен всем заказчикам
С 1 апреля 2024 года выходит Microsoft Security Copilot, инновационной подписной услуги, работающей на основе ИИ.
Работает как через отдельный портал, так и в через интеграцию с продуктами Microsoft - Sentinel и Defender XDR в числе прочих.
Security Copilot, построенный на GPT-4, - ассистент инженера безопасности для обработки запросов, предоставления рекомендаций и усиления мер борьбы с цифровыми угрозами.
Оплата по модели 'pay-as-you-go' через Microsoft Azure, примерная оценка - 4 доллара в час по тарифу Security Compute Unit.
Применение Security Copilot позволяет ускорить выполнение задач на 22%, а скорость реагирования на инциденты может возрасти на 26%.
Среди других преимуществ - мультиязычность, расширенные отчеты и возможность интеграции с корпоративной базой знаний.
#Microsoft #SecurityCopilot #GPT4
-------
@tsingular
С 1 апреля 2024 года выходит Microsoft Security Copilot, инновационной подписной услуги, работающей на основе ИИ.
Работает как через отдельный портал, так и в через интеграцию с продуктами Microsoft - Sentinel и Defender XDR в числе прочих.
Security Copilot, построенный на GPT-4, - ассистент инженера безопасности для обработки запросов, предоставления рекомендаций и усиления мер борьбы с цифровыми угрозами.
Оплата по модели 'pay-as-you-go' через Microsoft Azure, примерная оценка - 4 доллара в час по тарифу Security Compute Unit.
Применение Security Copilot позволяет ускорить выполнение задач на 22%, а скорость реагирования на инциденты может возрасти на 26%.
Среди других преимуществ - мультиязычность, расширенные отчеты и возможность интеграции с корпоративной базой знаний.
#Microsoft #SecurityCopilot #GPT4
-------
@tsingular
Маск обещает ИИ, превосходящий человеческий ум уже к концу следующего года
Элон Маск предсказывает, что искусственный интеллект обгонит человеческий уже к концу следующего года, если будут решены вопросы с электроснабжением и оборудованием.
В следующие пять лет возможности ИИ могут превзойти возможности всех людей. (2029й)
Прогресс на пути развития ИИ, включая генерацию видео и чат-боты, идет быстрее, чем ожидалось.
Ограничения в развитии ИИ, в основном, связаны с доступностью микроэлементов и энергии.
Маск разрабатывает собственный стартап xAI, цель - создать ИИ, способный превзойти GPT-4.
Он также ищет инвестиции для конкуренции с OpenAI, ценой стартапа в $18 млрд.
2029й. точно по расписанию.
#ElonMusk #xAI #GPT4
Элон Маск предсказывает, что искусственный интеллект обгонит человеческий уже к концу следующего года, если будут решены вопросы с электроснабжением и оборудованием.
В следующие пять лет возможности ИИ могут превзойти возможности всех людей. (2029й)
Прогресс на пути развития ИИ, включая генерацию видео и чат-боты, идет быстрее, чем ожидалось.
Ограничения в развитии ИИ, в основном, связаны с доступностью микроэлементов и энергии.
Маск разрабатывает собственный стартап xAI, цель - создать ИИ, способный превзойти GPT-4.
Он также ищет инвестиции для конкуренции с OpenAI, ценой стартапа в $18 млрд.
2029й. точно по расписанию.
#ElonMusk #xAI #GPT4
👍1
OpenAI открывает офис в Японии и выпускает GPT-4 на японском
Компания нацелена сотрудничать с японским правительством, компаниями и институтами для разработки безопасных ИИ-инструментов.
Тадао Нагасаки назначен президентом OpenAI Japan для интеграции в местное сообщество.
Выпущена специальная версия GPT-4 для японского языка, работающая в 3 раза быстрее и обеспечивающая улучшенный перевод и обобщение текстов.
Японские компании Daikin, Rakuten и TOYOTA Connected уже используют ChatGPT Enterprise для автоматизации процессов и анализа данных.
Город Йокосука применяет ChatGPT для повышения эффективности госуслуг, 80% сотрудников отмечают рост производительности.
OpenAI стремится помочь решить социальные проблемы региона, такие как депопуляция сельских районов и нехватка рабочей силы.
#OpenAI #Japan #GPT4
-------
@tsingular
Компания нацелена сотрудничать с японским правительством, компаниями и институтами для разработки безопасных ИИ-инструментов.
Тадао Нагасаки назначен президентом OpenAI Japan для интеграции в местное сообщество.
Выпущена специальная версия GPT-4 для японского языка, работающая в 3 раза быстрее и обеспечивающая улучшенный перевод и обобщение текстов.
Японские компании Daikin, Rakuten и TOYOTA Connected уже используют ChatGPT Enterprise для автоматизации процессов и анализа данных.
Город Йокосука применяет ChatGPT для повышения эффективности госуслуг, 80% сотрудников отмечают рост производительности.
OpenAI стремится помочь решить социальные проблемы региона, такие как депопуляция сельских районов и нехватка рабочей силы.
#OpenAI #Japan #GPT4
-------
@tsingular
👍1
GPT-4 способен автономно эксплуатировать уязвимости
Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.
ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.
#Pentesting #GPT4 #CyberSecurity
-------
@tsingular
Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.
ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.
#Pentesting #GPT4 #CyberSecurity
-------
@tsingular