Graph of Thoughts Framework.
структура, которая расширяет возможности подсказок в больших языковых моделях (LLM) по сравнению с теми, которые предлагаются парадигмами, такими как цепочка мыслей или дерево мыслей (ToT). Ключевой идеей и основным преимуществом GoT является возможность моделировать информацию, генерируемую LLM, в виде произвольного графа, где единицами информации («мысли LLM») являются вершины, а ребра соответствуют зависимостям между этими вершинами. Этот подход позволяет комбинировать произвольные мысли LLM в синергетические результаты, извлекать суть целых сетей мыслей или улучшать мысли, используя петли обратной связи.
https://arxiv.org/abs/2308.09687
https://github.com/spcl/graph-of-thoughts
структура, которая расширяет возможности подсказок в больших языковых моделях (LLM) по сравнению с теми, которые предлагаются парадигмами, такими как цепочка мыслей или дерево мыслей (ToT). Ключевой идеей и основным преимуществом GoT является возможность моделировать информацию, генерируемую LLM, в виде произвольного графа, где единицами информации («мысли LLM») являются вершины, а ребра соответствуют зависимостям между этими вершинами. Этот подход позволяет комбинировать произвольные мысли LLM в синергетические результаты, извлекать суть целых сетей мыслей или улучшать мысли, используя петли обратной связи.
https://arxiv.org/abs/2308.09687
https://github.com/spcl/graph-of-thoughts
Forwarded from Deleted Account
🔥 23 модели mGPT 🌐 MIT License
Наша команда SberDevices выложила в open source 23 модели для малых языков России и стран СНГ. Модели обучены на основе mGPT 1.3B с использованием доступных открытых датасетов.
🌟 От армянского до якутского, максимально качественные моноязычные модели, теперь готовы к интеграции в ваши проекты!
👉 Статья на Хабр (поддержите плюсиком) | Huggingface
Мы открыты для коллаборации и готовы продолжать исследования в данной области и дообучение модели и на других языках. Если у вас есть идея, на каком языке еще стоит дообучить mGPT, есть данные для её дообучения, и желание с нами коллаборировать, пишите!
Делаем технологии доступными для всех, независимо от языка! 🌍🤖
Наша команда SberDevices выложила в open source 23 модели для малых языков России и стран СНГ. Модели обучены на основе mGPT 1.3B с использованием доступных открытых датасетов.
🌟 От армянского до якутского, максимально качественные моноязычные модели, теперь готовы к интеграции в ваши проекты!
👉 Статья на Хабр (поддержите плюсиком) | Huggingface
Мы открыты для коллаборации и готовы продолжать исследования в данной области и дообучение модели и на других языках. Если у вас есть идея, на каком языке еще стоит дообучить mGPT, есть данные для её дообучения, и желание с нами коллаборировать, пишите!
Делаем технологии доступными для всех, независимо от языка! 🌍
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from ml4se
OWASP Top 10 for LLM
The OWASP Top 10 for Large Language Model Applications project aims to educate developers, designers, architects, managers, and organizations about the potential security risks when deploying and managing Large Language Models (LLMs). The project provides a list of the top 10 most critical vulnerabilities often seen in LLM applications, highlighting their potential impact, ease of exploitation, and prevalence in real-world applications. Examples of vulnerabilities include prompt injections, data leakage, inadequate sandboxing, and unauthorized code execution, among others. The goal is to raise awareness of these vulnerabilities, suggest remediation strategies, and ultimately improve the security posture of LLM applications.
1 Prompt Injection
2 Insecure Output Handling
3 Training Data Poisoning
4 Model Denial of Service
5 Supply Chain Vulnerabilities
6 Sensitive Information Disclosure
7 Insecure Plugin Design
8 Excessive Agency
9 Overreliance
10 Model Theft
PDF
The OWASP Top 10 for Large Language Model Applications project aims to educate developers, designers, architects, managers, and organizations about the potential security risks when deploying and managing Large Language Models (LLMs). The project provides a list of the top 10 most critical vulnerabilities often seen in LLM applications, highlighting their potential impact, ease of exploitation, and prevalence in real-world applications. Examples of vulnerabilities include prompt injections, data leakage, inadequate sandboxing, and unauthorized code execution, among others. The goal is to raise awareness of these vulnerabilities, suggest remediation strategies, and ultimately improve the security posture of LLM applications.
1 Prompt Injection
2 Insecure Output Handling
3 Training Data Poisoning
4 Model Denial of Service
5 Supply Chain Vulnerabilities
6 Sensitive Information Disclosure
7 Insecure Plugin Design
8 Excessive Agency
9 Overreliance
10 Model Theft
VMware расширяет партнёрство с ведущими компаниями в области ИИ.
https://news.vmware.com/releases/vmware-explore-2023-private-ai-foundation
https://news.vmware.com/releases/vmware-explore-2023-private-ai-foundation
VMware News and Stories
VMware Puts the Power of Generative AI Within Reach of Any Enterprise
Unveils VMware Private AI to Accelerate New Generation of Apps Expands Collaboration with NVIDIA to Build Generative AI Platform Running on VMware Cloud Infrastructure LAS VEGAS / VMware Explore 2023 — Today at VMware Explore 2023, VMware, Inc. (NYSE: VMW)…
Meta представляет мультимодальную модель мультиязычного перевода SeamlessM4T
SeamlessM4T использует аудио, видео и текст при переводе.
https://www.artificialintelligence-news.com/2023/08/22/meta-unveils-seamlessm4t-multimodal-translation-model/
SeamlessM4T использует аудио, видео и текст при переводе.
https://www.artificialintelligence-news.com/2023/08/22/meta-unveils-seamlessm4t-multimodal-translation-model/
AI News
Meta unveils SeamlessM4T multimodal translation model
Meta researchers have unveiled SeamlessM4T, a pioneering multilingual and multitask model that facilitates seamless translation and transcription across both speech and text.
Администрация Байдена-Харрис начала двухлетний конкурс "AI Cyber Challenge" с целью использования ИИ для обеспечения безопасности критической инфраструктуры США. В конкурсе, организованном DARPA, участвуют ведущие компании в сфере искусственного интеллекта, такие как Anthropic, Google, Microsoft и OpenAI, которые предоставят свои технологии для решения задач кибербезопасности. Призовой фонд конкурса составляет 20 миллионов долларов, с дополнительными 7 миллионами, предоставляемыми малым предприятиям. Отборочный этап планируется на весну 2024 года, с полуфиналами на DEF CON 2024. Open Source Security Foundation будет советовать и обеспечивать применение победившего кода для защиты критического ПО США.
https://www.whitehouse.gov/briefing-room/statements-releases/2023/08/09/biden-harris-administration-launches-artificial-intelligence-cyber-challenge-to-protect-americas-critical-software/
https://www.whitehouse.gov/briefing-room/statements-releases/2023/08/09/biden-harris-administration-launches-artificial-intelligence-cyber-challenge-to-protect-americas-critical-software/
The White House
Biden-Harris Administration Launches Artificial Intelligence Cyber Challenge to Protect America’s Critical Software
Several leading AI companies – Anthropic, Google, Microsoft, and OpenAI – to partner with DARPA in major competition to make software more secure The Biden-Harris Administration today launched a major two-year competition that will use artificial intelligence…
Forwarded from GeekNeural: IT & Нейросети
Meta представила Code Llama, модель LLM для программистов.
Code Llama поддерживает множество языков программирования, включая Python, C++, Java, PHP, Typescript (Javascript), C#, Bash и др.
Доступны версии 7B, 13B и 34B
In aggregate, training all 9 Code Llama models required 400K GPU hours of computation on hardware of type A100-80GB (TDP of 350-400W).
https://about.fb.com/news/2023/08/code-llama-ai-for-coding/
https://github.com/facebookresearch/codellama
https://huggingface.co/meta-llama
https://huggingface.co/TheBloke
Code Llama поддерживает множество языков программирования, включая Python, C++, Java, PHP, Typescript (Javascript), C#, Bash и др.
Доступны версии 7B, 13B и 34B
In aggregate, training all 9 Code Llama models required 400K GPU hours of computation on hardware of type A100-80GB (TDP of 350-400W).
https://about.fb.com/news/2023/08/code-llama-ai-for-coding/
https://github.com/facebookresearch/codellama
https://huggingface.co/meta-llama
https://huggingface.co/TheBloke
Meta Newsroom
Introducing Code Llama, an AI Tool for Coding
We're releasing Code Llama, an AI model built on top of Llama 2 that's fine-tuned for generating and discussing code.
Hugging Face оценивается в $4,5 млрд после инвестиций от Google и Nvidia
AI-стартап Hugging Face привлек $235 миллионов в раунде D финансирования, подняв общее количество средств, привлеченных компанией, до $395,2 млн.
Среди участников финансирования - Google, Amazon, Nvidia, Intel и многие другие.
Новая оценка стартапа составляет $4,5 млрд, что в два раза больше, чем в мае 2022 года.
Hugging Face стал одним из ведущих игроков в сфере ИИ, обслуживая более 10 000 клиентов и 50 000 организаций.
База моделей компании насчитывает более миллиона репозиториев.
https://decrypt.co/153623/ai-startup-hugging-face-hits-4-5-billion-valuation-after-google-and-nvidia-backed-raise
AI-стартап Hugging Face привлек $235 миллионов в раунде D финансирования, подняв общее количество средств, привлеченных компанией, до $395,2 млн.
Среди участников финансирования - Google, Amazon, Nvidia, Intel и многие другие.
Новая оценка стартапа составляет $4,5 млрд, что в два раза больше, чем в мае 2022 года.
Hugging Face стал одним из ведущих игроков в сфере ИИ, обслуживая более 10 000 клиентов и 50 000 организаций.
База моделей компании насчитывает более миллиона репозиториев.
https://decrypt.co/153623/ai-startup-hugging-face-hits-4-5-billion-valuation-after-google-and-nvidia-backed-raise
Decrypt
AI Startup Hugging Face Hits $4.5 Billion Valuation After Google and Nvidia Backed Raise - Decrypt
AI startup Hugging Face’s latest funding round brings its total capital raised to a staggering $395.2 million.
Forwarded from Точка сингулярности💥
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 GodMode — суперполезный браузерный аддон для работы с несколькими LLM одновременно.
Вы можете выбрать #ChatGPT, Llama 2, Perplexity и прочие топовые ИИ (до 5 штук за раз). Для этого открываем меню сервиса, отмечаем нужные AI и вводим в диалоговое окно текстовую команду.
⚡️ Преимущество очевидно — теперь у вас есть сразу несколько ответов и более широкое поле для действий.🤷
🧩 #КаталогНейросетей
Вы можете выбрать #ChatGPT, Llama 2, Perplexity и прочие топовые ИИ (до 5 штук за раз). Для этого открываем меню сервиса, отмечаем нужные AI и вводим в диалоговое окно текстовую команду.
🧩 #КаталогНейросетей
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Анализ данных (Data analysis)
🦙 Lagent: A lightweight framework for building LLM-based agents
Lagent - это легковесный фреймворк с открытым исходным кодом, который позволяет легко и эффективно создавать агентов на основе больших языковых моделей (LLM). Он также предоставляет некоторые типовые инструменты для расширения возможностей LLM.
▪Github
@data_analysis_ml
Lagent - это легковесный фреймворк с открытым исходным кодом, который позволяет легко и эффективно создавать агентов на основе больших языковых моделей (LLM). Он также предоставляет некоторые типовые инструменты для расширения возможностей LLM.
pip install lagent▪Github
@data_analysis_ml
Выходцы из Гугл Дэвид Ха и Ллион Джонс запускают новый ИИ стартап Sakana AI.
В основе будут лежать эволюционные модели и принципы коллективного разума.
https://sakana.ai/
В основе будут лежать эволюционные модели и принципы коллективного разума.
https://sakana.ai/
sakana.ai
Sakana AI
We are building a world class AI research lab in Tokyo, Japan. We are creating a new kind of foundation model based on nature-inspired intelligence.
Forwarded from Точка сингулярности💥
🧬 Китайский технологический гигант Alibaba представил две языковые модели — Qwen Large Vision Language Model (Qwen-VL) и Qwen-VL-Chat — демонстрирующие расширенные возможности интерпретации изображений и ведения диалогов на естественном языке.
Учитывая растущий спрос на доступ к продвинутым ИИ-алгоритмам, появление языковых моделей Alibaba может оказаться весьма кстати.
🧩 #КаталогНейросетей
Учитывая растущий спрос на доступ к продвинутым ИИ-алгоритмам, появление языковых моделей Alibaba может оказаться весьма кстати.
🧩 #КаталогНейросетей
Исполнительный директор и председатель совета директоров IBM Арвинд Кришна высказывается в поддержку создания в Индии суверенного искусственного интелекта.
https://www.storyboard18.com/quantum-brief/ibm-ceo-arvind-krishna-says-india-must-develop-sovereign-ai-moots-national-ai-lab-12607.htm
https://www.storyboard18.com/quantum-brief/ibm-ceo-arvind-krishna-says-india-must-develop-sovereign-ai-moots-national-ai-lab-12607.htm
Storyboard18
IBM CEO Arvind Krishna says India must develop sovereign AI, moots national AI lab
The chairman and CEO of IBM further said India is poised to ride the AI wave successfully, after BPO and IT services.
Forwarded from 42 секунды
Bloomberg: Google добавляет конкурирующие модели ИИ на свою облачную платформу
– Новые модели будут доступны клиентам Google Cloud
– Google добавила модель Llama 2 и чат-бота Claude 2
– Всего через Google Cloud доступны 100+ разных LLM
– Также Google улучшила собственную модель PaLM 2
– Например, PaLM 2 теперь доступна уже на 38 языках
– PaLM 2 стала лучше анализировать большие документы
– В т.ч. исследования, юридические документы, книги и др.
@ftsec
– Новые модели будут доступны клиентам Google Cloud
– Google добавила модель Llama 2 и чат-бота Claude 2
– Всего через Google Cloud доступны 100+ разных LLM
– Также Google улучшила собственную модель PaLM 2
– Например, PaLM 2 теперь доступна уже на 38 языках
– PaLM 2 стала лучше анализировать большие документы
– В т.ч. исследования, юридические документы, книги и др.
@ftsec