Технозаметки Малышева

Forwarded from e/acc

Фееристика. Только в прошлом месяце мы прыгали от восторга из-за 32К токенов контекста в GPT-4. Сегодняшний пейпер предлагает как увеличить окно контекста до 2 млн токенов.

Это, например, полностью прочитать серию книг о Гарри Поттере и написать следующую. Или одновременно держать в памяти весь документооборот за год среднего размера бизнеса. Или базу кода почти любого приложения в мире.

59 views11:37

Технозаметки Малышева

2million tokensAI.pdf

1.7 MB

Исходник

292 views11:45

Технозаметки Малышева

https://github.com/THUDM/ChatGLM-6B

Китайская модель. 750тыс скачиваний !!!

Просто для оценки масштабов вовлеченности мирового сообщества

221 viewsedited 15:05

Технозаметки Малышева

Forwarded from ChatGPT 5 | Gemini 3 | Nano Banana

ChatGPT использует модель глубокого обучения, которая обучена на большом количестве текстов на английском языке. Поэтому, когда пользователь вводит запрос на русском языке, он автоматически переводится на английский язык с помощью машинного перевода. Затем модель ChatGPT обрабатывает этот переведенный текст и генерирует ответ на английском языке.

Таким образом, ChatGPT не использует базу данных на русском языке, а работает с переводом запросов на английский язык. Однако, поскольку машинный перевод не всегда точен, возможны неточности в ответах ChatGPT на запросы на русском языке.

63 views17:01

Технозаметки Малышева

РКН исследование AI.pdf

7.5 MB

актуально

83 views03:59

Технозаметки Малышева

На подходе новая сетка на 1.2 триллиона параметров
https://www.together.xyz/blog/redpajama

Полный набор данных RedPajama на 1,2 триллиона токенов и меньшую, но более удобную случайную выборку можно загрузить через Hugging Face. Полный набор данных составляет ~5 ТБ в разархивированном виде на диске и ~3 ТБ в сжатом виде для скачивания.

RedPajama-Data-1T состоит из семи срезов данных:

CommonCrawl: пять дампов CommonCrawl, обработанных с использованием конвейера CCNet и отфильтрованных с помощью нескольких фильтров качества, включая линейный классификатор, который выбирает страницы, подобные Википедии.

C4: стандартный набор данных C4

GitHub: данные GitHub, отфильтрованные по лицензиям и качеству.

arXiv: удаление шаблонов из научных статей

Книги: корпус открытых книг, дедуплицированный по сходству содержания.

Википедия: подмножество страниц Википедии, удаление шаблонного кода.

StackExchange: Подмножество популярных веб-сайтов в StackExchange, удаление шаблонного кода.

68 views06:17

Технозаметки Малышева

Forwarded from e/acc

1:17

Media is too big

VIEW IN TELEGRAM

У меня сегодня день рождения, поэтому я делюсь с вами подарком.

Гигабрейн — это виртуальный университет , в котором можно

— изучать любую тему с персонализированным тьютором
— задавать вопросы, просить уточнения терминов
— обсуждать с историческими персонажами (спроси Сатоши про биткоин, а Фейнмана про природу науки)
— исследовать области знаний с мудрым наставником
— тестировать себя через тесты и лабораторные работы
— на любом языке, в любой области знаний, абсолютно бесплатно

Если вы educator или edtech и хотите себе такую же штуку в образовательный процесс — пишите. Сделал проект в одиночку за неделю, но буду еще улучшать.

В качестве подарка можно шарить пост по любым каналам.

48 views10:52

Технозаметки Малышева

2million tokensAI.pdf

https://github.com/booydar/t5-experiments/tree/scaling-report

Гитхаб код

GitHub

GitHub - booydar/recurrent-memory-transformer at scaling-report

[NeurIPS 22] [AAAI 24] Recurrent Transformer-based long-context architecture. - GitHub - booydar/recurrent-memory-transformer at scaling-report

53 views12:35

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

https://github.com/logspace-ai/langflow

UI для выстраивания последовательностей обработки через разные модели.

54 viewsedited 19:55

Технозаметки Малышева

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

Новая среда для запуска GPT моделей в браузере

Run GPT model on the browser with WebGPU. An implementation of GPT inference in less than ~2000 lines of vanilla Javascript.

https://github.com/0hq/WebGPT

53 viewsedited 03:47

Технозаметки Малышева

Новый курс от Andrew Ng:

ChatGPT Prompt Engineering for Developers - DeepLearning.AI
https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/

DeepLearning.AI - Learning Platform

ChatGPT Prompt Engineering for Developers

Learn the fundamentals of prompt engineering for ChatGPT. Learn effective prompting, and how to use LLMs for summarizing, inferring, transforming, and expanding.

54 viewsedited 20:25

Технозаметки Малышева

Skynet готов:
https://youtu.be/XEM5qz__HOU

https://www.palantir.com/platforms/aip/#defense

YouTube

Palantir AIP | Defense and Military

Palantir AIP brings together the latest in large language models and cutting edge AI to activate data and models from the most highly sensitive environments in both a legal and ethical way. From classified networks, to devices on the tactical edge, find out…

62 viewsedited 04:06

Технозаметки Малышева

Автономеый агент:
https://babyagi.org/

54 views06:30

Технозаметки Малышева

48 views09:45

Технозаметки Малышева

Cebra.ai - научились снимать видеосигнал с зрительной коры

👍1

44 views07:38

Технозаметки Малышева

Forwarded from CodeCamp

1:59

This media is not supported in your browser

VIEW IN TELEGRAM

Нашел прикольную программу Wolverin на базе ChatGPT.

В чем суть: каждый раз, когда ваш код выдает ошибку, запускается скрипт поиска, где ChatGPT пытается угадать почему ~~у вас руки кривые~~ все пошло не так. Как только бот найдет косяк, он его исправляет, запускает код и так по новой, пока программа не отладит весь код.

Разумеется, ссылочка на GitHub.

🔥2

47 views09:53

Технозаметки Малышева

Forwarded from ТЕХНО: Яндекс про технологии

🗿Чат-боты на основе нейросетей способны ответить практически на любой вопрос. Далеко не всегда их ответы точны, но иногда они выдают что-то заведомо ложное и даже фантасмагорическое — это называют галлюцинациями нейросетей.

Мы выбрали 5 примеров того, как обманывал пользователей самый популярный чат-бот ChatGPT.

А более подробно феномен галлюцинаций нейросетей мы разбираем в новом материале ТЕХНО.

@yandexhq

👍1

38 views10:03

About

Blog

Apps

Platform