e/acc
71.6K subscribers
579 photos
95 videos
8 files
922 links
Пишу про будущее: AI, web3, технологии и общество. Ускоряемся.

Автор: @sgershuni
Инвестирую: cyber.fund
Построил: Credentia, Deep Skills, Codex Town
Download Telegram
Сегодня за утро несколько раз подряд столкнулся с очень похожими проблемами у тех кто строит ИИ-приложения. Я вижу очень часто, что получив новые технологии, люди пытаются применить их везде где нужно и где не нужно.

В частности, сегодня крайне распространена идея про то что, мол, если хочешь сделать LLM приложение умнее — используй векторные эмбединги. Или даже хуже: что векторные базы данных это каким образом способ сделать LLM умнее. Но это не так. Это просто способ хранить и искать по данным, используя семантику, а не лексику. То есть, когда мне нужно найти в тексте определенную мысль или смысл, но я не знаю какими конкретно словами (или на каком языке) она там сформулирована.

Эмбединги не расширяют контекст модели и не помогают ей знать больше, чем она знает и так. И в 95% случаев вам вообще не нужна векторная база данных, потому что релевантные данные у вас уже и так лежат с постгресе, в архиве почты или на сайте. Вам просто нужно взять их и передать в контекст LLM в качестве инпута. Берем информацию из базы данных, скармливаем в контекст, задаем вопрос, повторяем. База данных стоит в ~100 раз дешевле, работает быстрее, геморроя меньше, инструментов для работы больше. Чем не профит?

То же самое верно для операций на основе ответа LLM. Допустим, Лама сказала что вам нужно пойти в спортзал чтобы похудеть. Можно конечно пытаться триллионом промтов добиться чтобы она в нужный момент напомнила, не забыла свои собственные слова и логику рассуждений. А можно просто выгрузить результат в типизированном и заранее строго отформатированном виде и затем работать с ним, как с любыми другими данными в рамках классической строго детерминированной парадигмы, где вы четко понимаете что ожидать на входе и на выходе. Никаких стохастических неожиданностей. И проще в тысячу раз.

Кстати, записывайтесь на очередной воркшоп по созданию автономных агентов, который пройдет в эту пятницу!
This media is not supported in your browser
VIEW IN TELEGRAM
Возможно, вы забыли что за пределами ИИ и веб3 есть реальный мир, но там тоже происходит кое-что интересное. Вчера вышла статья, которая взорвала интернет: учёные из Кореи впервые в истории смогли создать сверхпроводник, который работает при комнатной температуре.

Пишут, что они смогли создать материал практически из говна и палок, используя пылесос и печь. Если все правда, то это открывает какие-то фантастические перспективы от создания массовых квантовых компьютеров и ненагревающихся классических чипов (то есть, в разы более эффективных процессоров). Так же это значит, что можно будет в промышленном масштабе создать систему распределения электроэнергии без потерь в процессе передачи на длинные расстояния (триллионы киловатт-часов ежегодно в мире). А так же в разы более дешевые поезда на магнитной подушке и МРТ.

Короче, пушка, будем наблюдать. Авторы заверяют, что это прорыв не меньше чем ИИ.
День unsolicited и неаргументированных мнений по поводу веб3:

1. Слишком много проектов делают инфраструктуру, но спроса на неё такого пока нет. ZkSync & Optimism вполне хватит для вашего аппчейна. Blockspace проблема на ближайшие годы решена. Агрегации ликвидности — пока нет.

2. Можно подводить итоги войны чейнов. Биткоин и эфир, очевидно победили. Централизованные чейны (TON, LUNA) погибают. «Убийцы» эфира (AVAX, NEAR, DOT) имеют очень интересные моменты в технической реализации но не показали зачем они нужны. Cosmos экосистема кажется единственной где есть реальная активность, но встраивание ее в EVM мир вопрос времени.

3. Веб3 развивается быстрее чем когда-либо. Лучшие предприниматели кого я знаю начинают делать веб3 проекты. В подавляющем случае без токенов — токенов там нет и не планируется в ближайшем будущем. Именно у таких проектов, которые решают огромные боли, самые высокие шансы на успех. Смотрите как Твиттер прекрасно решил проблему борьбы с дезинформацией (community notes) или вознаграждением авторов (вы получаете процент от рекламы, показанной рядом с вашими твитами). И без токенов. И это только начало.

4. Самая большая возможность в крипте остаётся той же, что была в 2015 — создание нецензурируемой надгосударственной и значительно более дешевой системы сохранения и денежных переводов.
Напоминаю, что сегодня пройдёт очередной воркшоп по автономным ИИ-агентам, где мы сделаем своего собственного умного помощника по дому, научимся структурировать данные и построим ботов, которые сами умеют декомпозировать и приоритизировать сложные задачи.

Запись: Lu.ma/codextown
Запись вебинара: https://youtu.be/WJs5RuMbgb0

На следующей неделе будем учиться запускать бесплатные модели, типа LLaMa через пользовательский интерфейс и дообучать модель, чтобы сделать её более токсичной. Навыков программирования не нужно.

Регистрация и детали тут: https://lu.ma/codextown (может требоваться VPN)
Результат первого дня отпуска:

Залог счастливой и успешной жизни — это тонкий баланс дисциплины и умения отъебаться от себя.
This media is not supported in your browser
VIEW IN TELEGRAM
Key Crypto News - это канал, созданный студентами MIT с инсайдерской информацией в Web3.

Мы внимательно анализируем поведение и транзакции китов, которые играют значительную роль в формировании цен и тенденций на рынке Web3.

В быстро меняющемся мире криптовалюты критически важно быть в курсе последних трендов и новостей для качественного понимания рынка.

Узнай прямо сейчас:

🔮 Как продвинуть ваш ИИ-стартап
📬 Manta нанимает сотрудников - 10 вакансий
🔐 Как защитить ваш кошелек

👉 Будь в курсе последних новостей - @key_crypto_news
Please open Telegram to view this post
VIEW IN TELEGRAM
В эту пятницу пройдёт легендарный вебинар codex.town для тех, кто хочет профессионально научиться использовать LLM для бизнеса (навыков программирования не требуется).

Мы научимся использовать визуальный интерфейс для запуска сотен других моделей - проигрывающих или превосходящих GPT. Например, это нужно если вы не хотите платить за токены OpenAI, натренировать свою собственную модель или работать с приватными данными, типа медицинских или ответа на личные сообщения и почту. Рассмотрим 6 различных бесплатных инструментов для этого: text-generator-ui, h2o-llmstudio, fastchat gpt4all, lmstudio, MLCChat. Научимся дообучать эти нейронки с помощью механизма LoRA и оценивать результат.

Воркшоп проведет Майк Fluff — он реально очень круто шарит в этой теме и запустил уже не один довольно крутой продукт в области генеративных сетей. Регистрация, как обычно, тут: https://lu.ma/codextown (если не работает, значит включите VPN)
Забавно: пока лучшие лаборатории мира пытаются повторить эксперимент LK-99, анон из твиттера с аниме-аватаркой живущий в России рассказал что у него получилось и показал как. Это еще не доказательство повторяемости эксперимента, но отличный пример как работает наука в век твиттера.
На рынке предсказаний Manifold вероятность повторимость синтеза LK-99 превысила 50% (последние несколько дней была на уровне 20-30%). Это некий crowd wisdom сигнал, что последние эксперименты были вполне реальными, обстоятельными и независимыми.

Тут интересен сам феномен рынков предсказаний. Я считаю, что это наиболее недооцененный продукт в крипте и его полезность нам только предстоит раскрыть. Мы увидим сотни очень умных и классных применений и тысячи хитрых стратегий трейдинга. Которые, в отличии от большинства токенов, дают теоретико-игровой net benefit самому рынку и тем, кто использует эти данные.

Кстати, на днях наткнулся на очень крутой пример рынка предсказаний (Wingman), который делает основатель AppInTheAir Байрам Аннаков. В этом продукте вы можете купить акции вероятности того что некоторый рейс прилетит вовремя или будет задержан. Крутая штука и для гемблеров-трейдеров и для путешественников. Почитать об истории создания продукта можно тут. (Это не реклама, Байрам действительно архи-крут)
Недавно я писал о том, что в веб3 мире появляется все больше проектов, которые решают реальные боли. Если вы используете крипту как средство платежа в своем бизнесе/фрилансе, вам наверняка надоело копировать адреса кошельков, менять валюты по 20 минут и не понимать, что у вас происходит с финансами? Недавно узнал о компании, которая закрывает эту боль.

Transfer - бесплатный инструмент для выставления инвойсов/счетов в крипте, с помощью которого вы можете отправить ссылку на счет в любой валюте за 20 секунд и хранить всю аналитику в одном месте, даже если у вас много кошельков и менеджеров. Ваши клиенты могут оплатить счет в любой валюте (кросс-чейн и кросс-токен свопы интегрированы прямо в страницу оплаты). С помощью Transfer вы также можете быстро проводить собственные платежи сотрудникам/фрилансерам/партнерам.

Не нужно спрашивать сети, не нужно отправлять тестовый платеж, не нужно бояться ошибок при копировании адресов кошелька, хранить кошельки в Google Spreadsheets и т.д. И не нужно делиться своими приватными ключами!

Зарегистрируйтесь, попробуйте выставить инвойс за 20 секунд и убедитесь, как это может ускорить вашу работу. До сентября 2023 года бесплатно: app.gotransfer.money

Кстати, Transfer сейчас нанимает сотрудников (разработчики, маркетологи). По всем вопросам писать на @transfer_support.

#партнерский_пост
Sneak peek открытых и бесплатных моделей, который мы разберем завтра на вебинаре. Каждую из них при желании можно докрутить уровня примерно gpt-3.5 или даже круче, но при этом они абсолютно бесплатны, могут запускаться локально (данные остаются у вас) и могут быть натренерованы на ваши нужды. Завтра рассмотрим способы запуска всех этих моделей через UI (без программирования, версионности питона и даже терминала).

Регистрация: https://lu.ma/codextown
Новое видео: Открытые LLM сетки и их обучение

Рассматриваем инструменты для работы с открытыми и бесплатными LLM и сами модели. Разбираемся в способах дообучения и затачивания моделей под ваши нужды. Обсудили как работает и зачем нужен портал Huggingface, посмотрели с практической стороны на модели Llama, BLOOM, Vicuna, Falcon, Open-Assistant. Поговорили о методах обучения моделей, таких как LoRA, RLHF, Soft prompting, fine-tuning.

Записаться на мероприятия и вступить в сообщество: https://codex.town

Ссылка на презентацию: https://docs.google.com/presentation/d/1JO1uLqMnYUS7orTLQQh8LH2_aKnnmeG_/edit?usp=sharing&ouid=111260393669728804774&rtpof=true&sd=true
Пока интернет рвет друг другу глотки за эффект Мейснера, мы тут изобрели семантическую математику.

Как сказал Вольфрам: булева логика это было последнее (200 лет назад) открытие, которое позволило нам понять из чего состоит внутренняя структура языка и, for that matter, мышления. И само по себе изобретение векторых семантических эмбеддингов оказалось не менее интересным, чем LLM-ки. Потому что эти многомерные шайтан-векторы каким-то неуловимым для мясных и кожаных образом удерживают в себе куда более сложные связи и логику отношений между смыслами, которую мы называем речью или языком.

Мы не привыкли думать и представлять образы цифрами, тем более в 300-мерном пространстве, но при этом у нас есть алгебра, а значит и аппарат взаимодействия с этой информацией.

Утром я нашел преинтереснейший репозиторий, в котором на примере очень простой модельки показывается как простыми операциями вроде сложения и вычитания можно взаимодействовать со смыслами и образами. Если бы это не было реальностью, это был бы отличный нарратив для какой-нибудь шаманской секты. Но тут все круче.

Прикрепляю несколько экспериментов, которые сделал сегодня утром. Обратите внимание, что здесь используется только сложение и вычитание. Я пробовал взять фразу "Я люблю груши" и умножить её на 1,5 или поделить на 10. Получается бред, но это, скорее всего, ограничение модели (nanoGPT).

Сложно сказать какой из этого практический вывод, кроме того, что у нас появился инструмент для качественно совершенно нового исследования того что называется смыслом, идеей, семантикой. А внешний разум (GPT) и формализация процесса (математическая) очень помогают этому процессу.

С уважением,
Галлюцинирующее латентное пространство смыслов
Самая важная вещь, которую нужно понимать про генеративный AI — это импульс, скорость движения.

Вот например, 3-4 месяца назад интернет кишмя кишел видосиками типа "как сделать бота, который знает все данные о вашей компании, чтобы он продавал, онбордил сотрудников и отвечал на вопросы клиентов". И работы там действительно было минут на 30. Все, кто хотел, таких ботов себе сделали и действительно сэкономили до 50% бюджета на этих функциях. (Особенно, если бизнес простой, типа SMM агентства или йога-студии — там вопросы однотипные и бот отвечает лучше чем человек.)

Но — внезапный поворот!

На базе этих десяти тысяч видосов выросли мотивационные тренеры и бизнес-проходимцы, которые начали учить людей оказывать услуги по создаю ботов для интернет-магазинов, которые консультируют покупателей на основе заранее загруженных данных продуктов; или онбординг-боты, которые встречают и отвечают на все вопросы новых клиентов; холодные продажные боты, которые читают инфу из онлайн профилей и пишут лидам в личку в телеграме, твиттере и линкдине; боты-контентщики, которые ищут в интернете новые тренды и темы и пишут на этой основе посты, подкасты, твиты. То есть, если у вас нет навыков, но много времени, то используя langflow, zapier, intercom, говно, палки и chatgpt вы можете за 2-3 дня построить любое из этих приложений без единой строчки кода и продать его за условные $500 какой-нибудь пиццерии или зубной клинике из соседней подворотни.

Но — внезапный поворот!

Таких тоже развелось десятки тысяч, аки продавцов гербалайфа. И вот незадача: они хотели себе построить no-code карьеру, но я не очень представляю как можно обмануть мир, судьбу и Вселенную иным методом, кроме как интеллектом. В итоге сегодня это просто является базовой фичей любой из существующих платформ по созданию ботов: "Хочешь чтобы бот отвечал на основе корпоративной wiki? Вставь ссылку и забудь". Эти платформы появились за 5-10 лет до GPT, и добавить такой функционал их разработчикам удалось на пару месяцев. Но у них есть главное — дистрибуция, moat, комплексный продукт.

Но — внезапный поворот!

И даже не смотря на то, что персональный HR-бот, Sales-бот, Support-бот сегодня доступен из уже привычного вам интерфейса и, чаще всего, бесплатно — несмотря на это, все равно люди пытаются и будут пытаться обмануть судьбу. Все равно владельцы салонов ногтей и тьюнинга приор будут отдавать свои кровные ради того, чтобы их научили нажимать LITERALLY три кнопки в приложении для создания бота, который снимет с них 80% геморроя продаж и общения с клиентами.

Даже я мог бы это продавать. И — самое ужасающее — купили бы.

А, может, гори оно все синем пламенем?...

P.S. кстати, если вы хотите опередить следующую волну, когда эти же no-code-разводилы будут учить несчастных владельцев бизнесов как натренировать свою собственную нейронку (а это, клянусь, неизбежно), то приходите к нам на вебинар в пятницу. Майк расскажет со всеми деталями как это делать и вы сами сможете открыть бизнес-курсы для wannabe ЭйАйинтерпринёров.
Значимые стадии развития генеративного ИИ, которые имеет смысл уточнять в контексте разговора:

1. ИИ является полезным ассистентом человека (пишет имейлы, отвечает на звонки, редактирует договоры, исправляет ошибки в коде) - 2022

2. ИИ эффективно заменяет людей в каких-то массовых задачах: программирование, преподавание, продажи, коучинг, диагностика, терапия, техническая поддержка - 2024, учитывая что технология сегодня это позволяет нужен год-два на массовые и легко масштабируемые практики внедрения это в бизнес-процессы тысяч компаний без боли и геморроя

3. ИИ является главным драйвером научно-технического прогресса, превосходя топ 1% экспертов в одной конкретно взятой области - никто не знает когда, но вот тогда и будет реально интересно.