Технозаметки Малышева

NuExtract: компактная модель для структурированного извлечения данных

NuExtract - специализированная модель для извлечения информации из текста в JSON-формате.
Обучена на 50 000 аннотированных примерах, созданных с помощью LLM.
Работает в режимах zero-shot и pseudo few-shot.
Версии модели: tiny (0.5B), стандартная (3.8B) и large (7B).
Практически близка по качеству к 4o OpenAI.
Применима для анализа технических, медицинских и юридических документов.
Легко адаптируется к конкретным задачам через дообучение.
Выпущена под лицензией MIT.

Может быть очень полезна не только для документов но и для локальной обработки входящих запросов на предмет "а что хотел узнать пользователь" и создания langchain потоков.

#NuExtract #StructuredExtraction #NLP
-------
@tsingular

🔥2❤‍🔥1

281 views07:54

Технозаметки Малышева

Forwarded from Точка сингулярности💥

🧬 Пишут, что в США подростки массово подсаживаются на CharacterAI — сервис, где можно общаться с нейросетевыми аналогами персонажей и реальных людей.

Там 250 млн посещений в месяц, 20 млн постоянных пользователей, 2 млрд запросов в день. Когда у сервиса падают сервера, на реддите у людей сразу истерика.

К слову, это чуть ли не второй по популярности ИИ-сервис после ChatGPT.

🧩 #AINews

⚡3🐳1🗿1

131 views08:07

Технозаметки Малышева

Forwarded from Не баг, а фича

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

0:50

This media is not supported in your browser

VIEW IN TELEGRAM

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

Пушка: теперь Gemini с 3.25 млрд параметров доступна локально на компе во вкладке Chrome! Нейронка стала полноценной заменой поисковику и даёт ответы с задержкой меньше 100 мс!

Для этой версии Gemini не нужен интернет, она бесплатна, приватна и использует меньше 2 ГБ ОЗУ, что даже меньше прожорливых вкладок. Важно: чтобы включить Gemini, достаточно всего двух строчек кода, как в третьем видео!

Почему так? Всё просто — Google тайно встроила Gemini в версию Chrome для разрабов, а твиттерские нашли, где мы можем её включить.

Больше для собственной локальной нейронки не нужны суперкомпьютеры! Юзаем.

🙂

Не баг, а фича

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1😍1👀1

132 views09:22

Технозаметки Малышева

Alibaba Cloud запускает англоязычный хаб AI-моделей

Китайский гигант Alibaba Cloud представил английскую версию ModelScope - платформы открытых AI-моделей.

Сервис реализует концепцию "Model-as-a-Service", предоставляя доступ к 5000+ передовым моделям и 1500 датасетам.
ModelScope позволяет настраивать, обучать и оценивать модели с минимальным объёмом кода.

Анонс состоялся на CVPR 2024 в Сиэтле, где компания представила 30+ научных работ.
Посетители могли оценить возможности модели Qwen по генерации изображений и видео.

Запуск англоязычной версии - важный шаг в глобальной экспансии AI-сервисов Alibaba Cloud.

Огонь!
https://www.modelscope.cn/home
Полный аналог HuggingFace.

#Alibaba #ModelScope #Qwen
-------
@tsingular

159 viewsedited 14:14

Технозаметки Малышева

Forwarded from e/acc

Только что анонсировали новый ASIC для LLM: он умеет генерировать 500,000 токенов в секунду!

Эта штука может писать по одному тому "Войны и Мира" каждую секунду. Локально и без доступа к интернету. Это в десятки раз быстрее, чем кластер из 8 профессиональных карт NVIDIA H100.

Подходит для любых приложений на основе трансформеров: Llama, Stable Diffusion, Sora, Claude, GPT и так далее.

😐1

136 views16:55

Технозаметки Малышева

OpenAI поглощает платформу удалённой работы

OpenAI приобрёл стартап Multi (ранее Remotion), специализирующийся на инструментах для совместной работы.
Сделка носит характер найма команды - около 5 специалистов вольются в ряды OpenAI. (поглотити стартап, получается)
Это приобретение укрепляет позиции компании в сегменте корпоративных решений.

Напомним, что ChatGPT Enterprise уже используют 600 000 пользователей, включая 93% компаний из Fortune 500.
OpenAI также запустила программу кастомизации AI-моделей и консалтинга для бизнеса.
Ожидаемый доход компании в этом году - свыше $3,4 млрд.

Это выходит метят в конкуренты Google Workspace.

#OpenAI #Multi #RemoteWork
-------
@tsingular

138 views17:17

Технозаметки Малышева

Amazon готовит ответный удар по ChatGPT

Гигант е-коммерции тайно (:) но вам только по секрету) разрабатывает AI-чатбот Metis, который должен составить конкуренцию ChatGPT.
Проект основан на собственной модели - Olympus и курируется CEO Энди Джасси.
Функционал в разработке - текстовые и графические ответы, генерация изображений и возможности AI-агента.

Запуск планируется на сентябрь, во время мероприятия Alexa.

Metis использует RAG для актуализации данных (куда же без неё).

Разработка ведётся под улучшенную версию Alexa.

Сири умнеет, Алиса, Гигачат, теперь вот Алекса.
OpenAI добавляет голос в чатГПТ.
Выходит скоро у нас будут сверхразумные голосовые ассистенты от ведущих корпораций.
Рой терминаторов :)

#Amazon #Metis #Olympus
-------
@tsingular

140 viewsedited 17:22

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

1:13

This media is not supported in your browser

VIEW IN TELEGRAM

Языковые модели уже куда только не встраивали, а как насчет встроить в файл ШРИФТА? ☕️

Чел собрал llama.ttf — полноценный файл шрифта, который одновременно является большой языковой моделью и движком для её выполнения. Этот файл позволяет запускать языковую модель прямо в текстовых редакторах и других приложениях, поддерживающих технологию обработки шрифтов *HarfBuzz.
То есть, вы можете использовать шрифт для генерации текста из любого софта, БЕЗ необходимости ждать, пока кто-то внедрит поддержку AI в Corel Draw (спойлер: никто), плюс — все работает локально.

Если вы технически подкованный, то:
1) Скачайте файл, и установите его как обычный шрифт
2) Выберете шрифт LlamaSans в приложении
3) Проставьте кучу «!!!» знаков, чтобы активировать режим генерации, после чего «!» отправленный после текста закончит предложение (в видео пример)

Сайт проекта:
https://fuglede.github.io/llama.ttf/

*HarfBuzz использует WebAssembly (Wasm) для выполнения произвольного кода при обработке шрифтов, что делает возможным включение в файл шрифта целого движка языковой модели

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2👻1

131 views18:58

Технозаметки Малышева

Забавный коммент на Ютубе.

Комментатора заминусили в -2 за предположение, что через несколько лет ИИ сможет генерить фотореалистичное видео.
И накидали +14 тому, кто его опроверг и сказал, что может быть только наши внуки увидят подобное.
:)
В подборку к слайдам о предсказаниях трендов.

#trend #forecast
———
@tsingular

🔥4😁1

137 views05:22

Технозаметки Малышева

ИИ модели без умножения матриц значительно снижают энергопотребление

Учёные разработали метод создания крупных языковых моделей без умножения матриц на основе предыдущей работы BitNet.
Новый подход снижает энергопотребление и повышает эффективность ИИ-систем.
Модель с 2,7 млрд параметров показывает производительность, сравнимую с обычными LLM.
Демонстрация: 1,3 млрд параметров на скорости 23,8 токенов/сек на GPU и FPGA-чипе.

При этом энергопотребление FPGA-чипа - всего 13 Вт!!!

Технология делает LLM доступнее для устройств с ограниченными ресурсами.

Суть инновации заключается в использование только тернарных значений (-1, 0, 1) вместо чисел с плавающей запятой и замену механизма внимания на более простую и эффективную единицу MLGRU.

#MatrixMultiplication #EnergyEfficiency #LanguageModels
-------
@tsingular

500 viewsedited 15:10

Технозаметки Малышева

Amazon Bedrock: ИИ-агенты для инвестиционных исследований

Amazon, как всегда, представляет прекрасные детальные руководства по созданию ИИ решений.

Сегодня рассмотрим урок по созданию ИИ-агентов для проведения финансовой аналитики на базе Agents for Amazon Bedrock.

Система анализирует разнородные данные (текст, аудио, БД, финансовые рынки) и автоматизирует рутинные задачи аналитиков.

Мультимодальные агенты обрабатывают запросы на естественном языке, генерируя инсайты на базе данных из различных источников.

В примере описан RAG подход для контекстуализации LLM и безопасное подключение к корпоративным данным, извлечение финансовых показателей из отчетов и анализ настроений в транскриптах конференц-звонков.

Амазон выходит за рамки обычных технических руководств, по сути выкладывая полное изложение технической начинки финтех стартапа.

#AmazonBedrock #FinancialAnalysis #InvestmentResearch
-------
@tsingular

134 views05:23

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Интересный сценарий использования Artifacts в Claude 3.5 Sonnet.

Модель прочитала документ.
В данном случае - Attention is all you need - известная фундаментальная работа.
https://arxiv.org/pdf/1706.03762

И создала интерактивный урок с проверочным тестом в итоге.

Есть вопросы по качеству обучающего материала, конечно.
Но факт, что можно теперь сложный технический документ быстро (буквально за секунды) превратить в черновик урока, - прекрасен.

источник: X

#Claude #Education
———
@tsingualr

134 viewsedited 05:38

Технозаметки Малышева

Использование ИИ для рассекречивания документов

Исследование, проведённое в Мэриленде по заказу Минобороны США показало успешное применение ИИ для рассекречивания документов.
Ключевой момент - сопоставление процессных правил с моделями контекстуального понимания.
Алгоритмы способны различать контекст терминов в разных сферах (например, «килотонна» в сельском хозяйстве и обороне).
Планируется создание руководства по использованию ИИ для поддержки решений о рассекречивании в госструктурах.
Технология применима к различным типам проверки информации, включая FOIA и проверку безопасности.

В данном конкретном случае это больше про сортировку документов, чтобы лишнее не опубликовать, но в целом интересна методика подхода по снижению неопределённостей.

#Pentagon #declassification #machinelearning
-------
@tsingular

142 views05:56

Технозаметки Малышева

Forwarded from GigaChat

GigaConf 2024 начинается уже сегодня! Рассказываем о главной технологической конференции от Сбера

😎

Открываем GigaConf пленарным докладом от Сбера, SberDevices, Минцифры, MindSpore и Авито.

Продолжим десятками выступлений от разработчиков, менеджеров, руководителей команд и айтишников. Они поделятся опытом и разберут разные кейсы.

Вот только малая часть из 30+ тем:

⭕️ Настоящее и будущее GigaChat
⭕️ Большие языковые модели: на границе исследований и бизнеса
⭕️ Нужен ли эксперту AI, а AI — эксперт?
⭕️ Безопасность LLM
⭕️ AI: конкурент или помощник?

Мы в большом предвкушении сегодняшнего дня!

Выбирайте нужный блок и смотрите прямую трансляцию 🖥

🙌 — иду смотреть трансляции и записывать все умные мысли спикеров

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

129 views07:27

Технозаметки Малышева

1:49

This media is not supported in your browser

VIEW IN TELEGRAM

ИИ омолаживает звезд Голливуда в новом фильме - Here

Роберт Земекис в картине "Here" применяет передовую ИИ-технологию для омоложения Тома Хэнкса и Робин Райт.

Инструмент Metaphysic Live в реальном времени возвращает актерам облик 90-х.

Фильм охватывает разные эпохи с одной точки обзора.

Эксперимент Земекиса вызывает споры в киноиндустрии.
Многие творческие работники против использования ИИ в кинопроизводстве.

Актёры из 90х продолжат карьеру после своей смерти.
Первыми получат цифровое бессмертие, получается.

#Zemeckis #Metaphysic #DeAging
———
@tsingular

147 views14:14

Технозаметки Малышева

Forwarded from эйай ньюз

Google выкатил Gemma 2

Как и обещали на Google I/O, модель вышла в июне. Выпускают два размера: 9 и 27 миллиардов параметров. Обе достаточно маленькие, так что их можно запустить дома на одной геймерской видяхе. Показывают себя на бенчах они хорошо: 9B обгоняет LLaMa 3 8B, будучи не сильно больше, а 27B подбирается по качеству к Mixtral 8x22B.

27B версию тренили на 13 триллионах токенов, а вот 9B лишь на 8, но там дистиллировали из модели побольше.

Модель последние два дня тестили на арене, под названием im-also-a-late-june-chatbot. Пока говорить что-то рано, разброс слишком большой, но вроде вышло неплохо. Лишь бы не было кучи проблем, как было с оригинальной Gemma.

Веса
Блогпост
Техрепорт

@ai_newz

122 views04:09

Технозаметки Малышева

Forwarded from Сергей Булаев AI 🤖

CriticGPT: ИИ для поиска ошибок ИИ

OpenAI рассказала о новой модели CriticGPT, основанной на GPT-4, для выявления ошибок в коде, сгенерированном GPT-4.

Возможности CriticGPT:

🔶 Анализ кода, созданного ChatGPT и выявление неточностей

🔶 Написание критических замечаний к ответам ChatGPT

🔶 Помощь людям-тренерам в оценке выходных данных ИИ

🔶 Балансировка между агрессивным поиском проблем и точностью обнаружения

Ключевые факты:

Модель обучена с помощью RLHF (Усиление обучения с помощью людского фидбэка), как и ChatGPT, но на данных с намеренно внесенными ошибками. CriticGPT способна находить как искусственно внесенные, так и естественные ошибки ChatGPT. По мнению тренеров, критика CriticGPT лучше, чем критика ChatGPT в 63% случаев при работе с естественными ошибками.

Было обнаружено, что можно генерировать более длинные и всесторонние критические замечания, используя дополнительный поиск во время тестирования против модели вознаграждения критики. Этот поиск, называемый Принудительным выбором с использованием поиска по лучам (FSBS), позволяет балансировать агрессивность поиска проблем в коде и настраивать компромисс между точностью и полнотой обнаружения ошибок. В результате генерируются замечания, максимально полезные для RLHF. Подробнее в документе.

Ограничения CriticGPT включают возможные галлюцинации, сложность оценки длинных и комплексных задач, а также проблемы с обнаружением ошибок, распределенных по всему ответу.

OpenAI планирует интегрировать подобные CriticGPT модели в процесс обучения своих ИИ-систем и видит в этом подходе перспективу для создания более совершенных инструментов оценки сложных ИИ-систем.

Так то 63% не супер сильно отличается от 50…

@sergiobulaev - об AI и не только

144 views04:34

About

Blog

Apps

Platform