Cloudflare объявила о партнерстве с Hugging Face.
Совместная работа позволит упростить и сделать более доступным развертывание ИИ-решений.
У пользователей Cloudflare Workers теперь появится возможность развертывать эти модели используя edge-computing.
https://blog.cloudflare.com/partnering-with-hugging-face-deploying-ai-easier-affordable/
Совместная работа позволит упростить и сделать более доступным развертывание ИИ-решений.
У пользователей Cloudflare Workers теперь появится возможность развертывать эти модели используя edge-computing.
https://blog.cloudflare.com/partnering-with-hugging-face-deploying-ai-easier-affordable/
The Cloudflare Blog
Partnering with Hugging Face to make deploying AI easier and more affordable than ever 🤗
Today, we’re excited to announce that we are partnering with Hugging Face to make AI models more accessible and affordable than ever before to developers.
Microsoft предлагает новый фреймворк AI для совместной разработки NLP
- Исследователи AI от Microsoft предложили новый фреймворк для разработки NLP, под названием CoDev.
- CoDev позволяет нескольким пользователям согласовывать модель с их собственными убеждениями и предпочтениями.
- Принцип работы: интерактивное обучение с подкреплением и использование экспертных знаний.
- Использование CoDev приводит к значительному улучшению результатов NLP.
- Microsoft планирует продолжать исследования для дальнейшего развития CoDev.
https://www.marktechpost.com/2023/10/03/microsoft-ai-research-proposes-a-new-artificial-intelligence-framework-for-collaborative-nlp-development-codev-that-enables-multiple-users-to-align-a-model-with-their-beliefs/
- Исследователи AI от Microsoft предложили новый фреймворк для разработки NLP, под названием CoDev.
- CoDev позволяет нескольким пользователям согласовывать модель с их собственными убеждениями и предпочтениями.
- Принцип работы: интерактивное обучение с подкреплением и использование экспертных знаний.
- Использование CoDev приводит к значительному улучшению результатов NLP.
- Microsoft планирует продолжать исследования для дальнейшего развития CoDev.
https://www.marktechpost.com/2023/10/03/microsoft-ai-research-proposes-a-new-artificial-intelligence-framework-for-collaborative-nlp-development-codev-that-enables-multiple-users-to-align-a-model-with-their-beliefs/
MarkTechPost
Microsoft AI Research Proposes a New Artificial Intelligence Framework for Collaborative NLP Development (CoDev) that Enables Multiple…
Although NLP models have demonstrated extraordinary strengths, they have challenges. The need to teach these models ideas is highlighted by unacceptable values buried in their training data, recurrent failures, or breaches of business standards. The phrase…
СофтБанк: суперинтеллект AI появится в пределах 10 лет
- Глава SoftBank, Масаёши Сон, прогнозирует появление искусственного общего интеллекта (AGI) в пределах 10 лет.
- Сон заявляет, что к 2030 году AI "будет в 10 раз умнее всего человечества".
- Это могло бы привести к общественным преобразованиям, начиная с полного перехода на автономные автомобили, и заканчивая заслуживающими Нобелевскую премию развитиями в науке и технологии, сгенерированными AI.
- SoftBank планирует удвоить свои инвестиции в AI, несмотря на убытки, вызванные технологической волатильностью.
- Хотя некоторые известные технологические эксперты выражают опасения о потенциале AI уничтожить человечество, г-н Сон и другие эксперты поддерживают AI, считая его силой добра и "катализатором глобального преобразования".
https://fortune.com/2023/10/04/softbank-masayoshi-son-ai-artificial-general-intelligence/
- Глава SoftBank, Масаёши Сон, прогнозирует появление искусственного общего интеллекта (AGI) в пределах 10 лет.
- Сон заявляет, что к 2030 году AI "будет в 10 раз умнее всего человечества".
- Это могло бы привести к общественным преобразованиям, начиная с полного перехода на автономные автомобили, и заканчивая заслуживающими Нобелевскую премию развитиями в науке и технологии, сгенерированными AI.
- SoftBank планирует удвоить свои инвестиции в AI, несмотря на убытки, вызванные технологической волатильностью.
- Хотя некоторые известные технологические эксперты выражают опасения о потенциале AI уничтожить человечество, г-н Сон и другие эксперты поддерживают AI, считая его силой добра и "катализатором глобального преобразования".
https://fortune.com/2023/10/04/softbank-masayoshi-son-ai-artificial-general-intelligence/
Fortune
Softbank’s CEO says you’ll end up like a mindless goldfish if you don’t get on board with AI
“Take advantage of it or be left behind,” warned Masayoshi Son, whose early bet on Alibaba built his reputation as a tech visionary.
Anthropic планирует привлечь инвестиции в размере 2 млрд долларов
- Компания Anthropic, конкурент OpenAI, ведет переговоры о привлечении 2 млрд долларов инвестиций.
- На прошлой неделе Amazon объявил о намерении инвестировать в компанию 1,25 млрд долларов.
- Google, владеющий примерно 10% акций Anthropic, также ожидается в числе инвесторов.
- Anthropic, занимающийся продажей чатбота Claude, конкурирующего с ChatGPT от OpenAI, оценивает свою стоимость от 20 до 30 млрд долларов, учитывая новые инвестиции.
- Это в пять раз превышает оценку компании в марте, когда на нее был поставлен ценник в 4 млрд долларов.
https://www.theinformation.com/articles/openai-rival-anthropic-in-talks-to-raise-2-billion-from-google-others-as-ai-arms-race-accelerates
- Компания Anthropic, конкурент OpenAI, ведет переговоры о привлечении 2 млрд долларов инвестиций.
- На прошлой неделе Amazon объявил о намерении инвестировать в компанию 1,25 млрд долларов.
- Google, владеющий примерно 10% акций Anthropic, также ожидается в числе инвесторов.
- Anthropic, занимающийся продажей чатбота Claude, конкурирующего с ChatGPT от OpenAI, оценивает свою стоимость от 20 до 30 млрд долларов, учитывая новые инвестиции.
- Это в пять раз превышает оценку компании в марте, когда на нее был поставлен ценник в 4 млрд долларов.
https://www.theinformation.com/articles/openai-rival-anthropic-in-talks-to-raise-2-billion-from-google-others-as-ai-arms-race-accelerates
The Information
Anthropic in Talks to Raise $2 Billion From Google and Others Just Days After Amazon Investment
Anthropic, one of the main rivals of OpenAI, is in talks with investors to raise at least $2 billion in new funding, following a commitment from Amazon last week to invest $1.25 billion in the company, according to three people with direct knowledge. Anthropic…
GPT Web App Generator создает полноценное приложение по текстовому описанию
- Проект основан на GPT: генерирует полноценное web-приложение на React и Node.js по краткому описанию.
- Пользователи могут указать основной цвет приложения и предпочитаемый метод аутентификации.
- Вся процедура занимает несколько минут, готовый код можно скачать и запустить локально или развернуть с помощью одной CLI-команды.
- GPT Web App Generator использует Prisma и Wasp: Prisma - это ORM для базы данных PostgreSQL, обеспечивающая безопасность типов, Wasp - полнофункциональный инструмент для рабыты на React и Node.js.
- Весь код проекта полностью открытый и доступен для использования.
#GPT, #WebAppGenerator, #Wasp
https://wasp-lang.dev/blog/2023/07/10/gpt-web-app-generator
- Проект основан на GPT: генерирует полноценное web-приложение на React и Node.js по краткому описанию.
- Пользователи могут указать основной цвет приложения и предпочитаемый метод аутентификации.
- Вся процедура занимает несколько минут, готовый код можно скачать и запустить локально или развернуть с помощью одной CLI-команды.
- GPT Web App Generator использует Prisma и Wasp: Prisma - это ORM для базы данных PostgreSQL, обеспечивающая безопасность типов, Wasp - полнофункциональный инструмент для рабыты на React и Node.js.
- Весь код проекта полностью открытый и доступен для использования.
#GPT, #WebAppGenerator, #Wasp
https://wasp-lang.dev/blog/2023/07/10/gpt-web-app-generator
wasp-lang.dev
GPT Web App Generator - Let AI create a full-stack React & Node.js codebase based on your description 🤖🤯 | Wasp
<ImgWithCaption
Google представила смартфоны Pixel 8 и Pixel 8 Pro
- Оба смартфона оснащены обновленными камерами, новыми датчиками и дополнительными функциями, созданными на базе ИИ.
- Оба устройства работают на процессоре Google Tensor G3 и будут получать обновления программного обеспечения в течение семи лет.
- Pixel 8 Pro оснащен дополнительным термическим датчиком, а также новыми функциями редактирования фото и видео.
- Pixel 8 имеет обновленную основную камеру и новую ультраширокую линзу, обеспечивающую макросъемку.
- Оба смартфона можно предзаказать, начиная с 699 и 999 долларов соответственно.
#Google, #Pixel8, #TensorG3
https://blog.google/products/pixel/google-pixel-8-pro/
- Оба смартфона оснащены обновленными камерами, новыми датчиками и дополнительными функциями, созданными на базе ИИ.
- Оба устройства работают на процессоре Google Tensor G3 и будут получать обновления программного обеспечения в течение семи лет.
- Pixel 8 Pro оснащен дополнительным термическим датчиком, а также новыми функциями редактирования фото и видео.
- Pixel 8 имеет обновленную основную камеру и новую ультраширокую линзу, обеспечивающую макросъемку.
- Оба смартфона можно предзаказать, начиная с 699 и 999 долларов соответственно.
#Google, #Pixel8, #TensorG3
https://blog.google/products/pixel/google-pixel-8-pro/
Google
Meet Pixel 8 and Pixel 8 Pro, our newest phones
Take a closer look at the new phones — everything from the beautiful design and new sensors to updated cameras.
Visa инвестирует $100 млн в ИИ-стартапы
- Visa планирует вложить $100 млн в компании, создающие ИИ-технологии и приложения.
- Инвестиции будут осуществляться через подразделение Visa Ventures.
- Средства будут направлены на ИИ-проекты, имеющие перспективу влиять на коммерцию и платежные операции.
- Visa считает себя пионером использования ИИ в платежах с 1993 года.
- Компания готова сделать ряд инвестиций на несколько миллионов долларов.
#Visa, #VisaVentures, #ИИ
https://techcrunch.com/2023/10/02/visa-earmarks-100m-to-invest-in-generative-ai-companies/
- Visa планирует вложить $100 млн в компании, создающие ИИ-технологии и приложения.
- Инвестиции будут осуществляться через подразделение Visa Ventures.
- Средства будут направлены на ИИ-проекты, имеющие перспективу влиять на коммерцию и платежные операции.
- Visa считает себя пионером использования ИИ в платежах с 1993 года.
- Компания готова сделать ряд инвестиций на несколько миллионов долларов.
#Visa, #VisaVentures, #ИИ
https://techcrunch.com/2023/10/02/visa-earmarks-100m-to-invest-in-generative-ai-companies/
TechCrunch
Visa earmarks $100M to invest in generative AI companies | TechCrunch
Visa announced today that it plans to invest $100 million in companies developing generative AI technologies and applications “that will impact the future The investments will be made through Visa Ventures, the card giant’s 16-year-old global corporate investment…
Оценка способности генерации кода моделями языка с помощью L2CEval
- L2CEval - всеобъемлющая оценка моделей языка для генерации кода, учитывающая varied показатели: масштаб модели, данные для обучения, чувствительность к экземплярам с небольшим количеством снимков и влияние настройки инструкций и т.д.
- В L2CEval присутствуют модели от 13 различных организаций, все они оцениваются в 3-х основных областях задач по генерации кода из естественного языка.
- L2CEval включает обширные оценки моделей, начиная от 1B параметров, до значительно больших, например, моделей davinci и GPT-4 от OpenAI, с оценочной величиной более 170B+ параметров.
- Данное исследование может быть полезным для сообщества при применении моделей языка в downstream кодовых приложениях.
#L2CEval, #OpenAI, #GPT-4
https://l2c-eval.github.io/
- L2CEval - всеобъемлющая оценка моделей языка для генерации кода, учитывающая varied показатели: масштаб модели, данные для обучения, чувствительность к экземплярам с небольшим количеством снимков и влияние настройки инструкций и т.д.
- В L2CEval присутствуют модели от 13 различных организаций, все они оцениваются в 3-х основных областях задач по генерации кода из естественного языка.
- L2CEval включает обширные оценки моделей, начиная от 1B параметров, до значительно больших, например, моделей davinci и GPT-4 от OpenAI, с оценочной величиной более 170B+ параметров.
- Данное исследование может быть полезным для сообщества при применении моделей языка в downstream кодовых приложениях.
#L2CEval, #OpenAI, #GPT-4
https://l2c-eval.github.io/
Лучшие AI-чат-модели доступны в Hugging Face
- Платформа Hugging Face открыла доступ к лучшим AI-чат-моделям со всего мира.
- модели используют веб-поиск.
#HuggingFace, #AI, #ЧатМодели
Falcon там тоже есть. Быстрый и по ответам близок к GPT4 по качеству.
Зреет конкурент AWS Bedrock
https://huggingface.co/chat
- Платформа Hugging Face открыла доступ к лучшим AI-чат-моделям со всего мира.
- модели используют веб-поиск.
#HuggingFace, #AI, #ЧатМодели
Falcon там тоже есть. Быстрый и по ответам близок к GPT4 по качеству.
Зреет конкурент AWS Bedrock
https://huggingface.co/chat
Adobe анонсирует новый инструмент редактирования фото на AI
- Adobe представит новый инструмент редактирования изображений на базе AI - "Project Stardust" на мероприятии Adobe Max.
- "Project Stardust" автоматически определяет отдельные объекты на обычных фотографиях, что позволяет легко перемещать и изменять их.
- Программа отображает объекты на фотографиях, как если бы они были выделены инструментом lasso в Photoshop.
- Одна из функций "Project Stardust" аналогична "Contextual Task Bar" в Photoshop.
- Используются некоторые из тех же возможностей генеративного AI, что и в инструментах Photoshop на Adobe's Firefly.
#Adobe, #ProjectStardust, #AI
https://www.theverge.com/2023/10/5/23904416/adobe-max-sneak-project-stardust-ai-photo-editing-tool
- Adobe представит новый инструмент редактирования изображений на базе AI - "Project Stardust" на мероприятии Adobe Max.
- "Project Stardust" автоматически определяет отдельные объекты на обычных фотографиях, что позволяет легко перемещать и изменять их.
- Программа отображает объекты на фотографиях, как если бы они были выделены инструментом lasso в Photoshop.
- Одна из функций "Project Stardust" аналогична "Contextual Task Bar" в Photoshop.
- Используются некоторые из тех же возможностей генеративного AI, что и в инструментах Photoshop на Adobe's Firefly.
#Adobe, #ProjectStardust, #AI
https://www.theverge.com/2023/10/5/23904416/adobe-max-sneak-project-stardust-ai-photo-editing-tool
The Verge
Adobe teases new AI photo editing tool that will ‘revolutionize’ its products
Project Stardust automates labor-intensive photo editing tasks.
OpenAI рассматривает возможность создания собственных AI чипов
- OpenAI, компания создавшая ChatGPT, рассматривает возможность создания собственных чипов ИИ и M&A в этой сфере.
- Внутренние дискуссии предполагают построение собственного AI-чипа и усиленное сотрудничество с другими производителями чипов, включая Nvidia.
- Сэм Altman, CEO компании, определил закупки большего количества AI-чипов одним из приоритетов.
- Стоимость эксплуатации ChatGPT очень высока, себестоимость каждого запроса примерно 4 цента.
- С 2020 года, OpenAI разрабатывает свои генеративные технологии ИИ на ресурсах Microsoft.
- Основной спонсор OpenAI, Microsoft, также разрабатывает собственный чип AI, который OpenAI тестирует.
#OpenAI, #AIчипы, #Microsoft
https://www.reuters.com/technology/chatgpt-owner-openai-is-exploring-making-its-own-ai-chips-sources-2023-10-06/
- OpenAI, компания создавшая ChatGPT, рассматривает возможность создания собственных чипов ИИ и M&A в этой сфере.
- Внутренние дискуссии предполагают построение собственного AI-чипа и усиленное сотрудничество с другими производителями чипов, включая Nvidia.
- Сэм Altman, CEO компании, определил закупки большего количества AI-чипов одним из приоритетов.
- Стоимость эксплуатации ChatGPT очень высока, себестоимость каждого запроса примерно 4 цента.
- С 2020 года, OpenAI разрабатывает свои генеративные технологии ИИ на ресурсах Microsoft.
- Основной спонсор OpenAI, Microsoft, также разрабатывает собственный чип AI, который OpenAI тестирует.
#OpenAI, #AIчипы, #Microsoft
https://www.reuters.com/technology/chatgpt-owner-openai-is-exploring-making-its-own-ai-chips-sources-2023-10-06/
Reuters
Exclusive: ChatGPT-owner OpenAI is exploring making its own AI chips
OpenAI, the company behind ChatGPT, is exploring making its own artificial intelligence chips and has gone as far as evaluating a potential acquisition target, according to people familiar with the company’s plans.
CEO JPMorgan: весь процесс работы банка будет автоматизирован
- Джейми Дэймон, генеральный директор JPMorgan Chase, заявил, что искусственный интеллект будет использован для каждого процесса в банке.
- По его словам, банк все больше использует AI и машинное обучение для внедрения новых продуктов и улучшения обслуживания клиентов.
- Дэймон подчеркнул, что автоматизация поможет банку стать более продуктивным и конкурентоспособным, что приведет к росту доходов.
#JPMorgan, #Автоматизация, #Искусственныйинтеллект
https://www.artificialintelligence-news.com/2023/10/03/jpmorgan-ceo-ai-will-be-used-for-every-single-process/
- Джейми Дэймон, генеральный директор JPMorgan Chase, заявил, что искусственный интеллект будет использован для каждого процесса в банке.
- По его словам, банк все больше использует AI и машинное обучение для внедрения новых продуктов и улучшения обслуживания клиентов.
- Дэймон подчеркнул, что автоматизация поможет банку стать более продуктивным и конкурентоспособным, что приведет к росту доходов.
#JPMorgan, #Автоматизация, #Искусственныйинтеллект
https://www.artificialintelligence-news.com/2023/10/03/jpmorgan-ceo-ai-will-be-used-for-every-single-process/
AI News
JPMorgan CEO: AI will be used for ‘every single process’
In a recent Bloomberg interview, JPMorgan CEO Jamie Dimon unveiled his AI-driven vision for the financial industry.
Dataiku представляет LLM Mesh для безопасного и масштабируемого применения Generative AI
- Dataiku предложила LLM Mesh как решение для безопасного применения Generative AI на внутреннем уровне и для работы с различными моделями.
- Совместно с партнерами (Snowflake, NVIDIA, Pinecone, AI21 Labs) LLM Mesh обеспечивает интеграцию Generative AI в корпоративные приложения.
- LLM Mesh анализирует запросы на конфиденциальные данные, следит за затратами на запросы к моделям и обрабатывает большие массивы данных.
#Dataiku, #LLMMesh, #GenerativeAI
https://blog.dataiku.com/llm-mesh
- Dataiku предложила LLM Mesh как решение для безопасного применения Generative AI на внутреннем уровне и для работы с различными моделями.
- Совместно с партнерами (Snowflake, NVIDIA, Pinecone, AI21 Labs) LLM Mesh обеспечивает интеграцию Generative AI в корпоративные приложения.
- LLM Mesh анализирует запросы на конфиденциальные данные, следит за затратами на запросы к моделям и обрабатывает большие массивы данных.
#Dataiku, #LLMMesh, #GenerativeAI
https://blog.dataiku.com/llm-mesh
"Революция ChatGPT" вызывает переосмысление оценок достижения уровня AGI
- "Революция ChatGPT" в 2023 году снизила прогнозы экспертов о времени создания искусственного интеллекта, равного человеческому (АGI).
- Современные методы тестирования ИИ не могут достоверно оценить достижение ИИ-системами уровня АGI, из-за "ловушки Гудхарта" (Goodhart's law).
- Обход "ловушки Гудхарта" может быть достигнут помощью трех эвристических гипотез, предложенных в новых исследованиях.
#ChatGPT, #AGI, #GoodhartsLaw
https://scientific-letters.ru/index.php/SLIPRAS/article/view/80
- "Революция ChatGPT" в 2023 году снизила прогнозы экспертов о времени создания искусственного интеллекта, равного человеческому (АGI).
- Современные методы тестирования ИИ не могут достоверно оценить достижение ИИ-системами уровня АGI, из-за "ловушки Гудхарта" (Goodhart's law).
- Обход "ловушки Гудхарта" может быть достигнут помощью трех эвристических гипотез, предложенных в новых исследованиях.
#ChatGPT, #AGI, #GoodhartsLaw
https://scientific-letters.ru/index.php/SLIPRAS/article/view/80
scientific-letters.ru
«Ловушка Гудхарта» для AGI: проблема сравнительного анализа искусственного интеллекта и интеллекта человека | Учёные записки Института…
«Революция ChatGPT», которая произошла в 2023, резко сократила прогнозные оценки экспертов сроков, отделяющих нас от создания искусственного интеллекта, ни в чем интеллектуально не уступающего никому из людей (AGI). При этом, как это ни парадоксально, но…
Hugging Face представляет руководство для создания собственного ChatGPT без кода
- Пользователи могут создать свой собственный чат-бот на основе модели LLaMA 2 без написания кода, благодаря инструментам Hugging Face: Spaces, AutoTrain и Inference Endpoints.
- Настоящее руководство позволяет любому пользователю, не обладающему техническими навыками, развивать и развертывать искусственный интеллект.
- На базе модели LLaMA 2 обучают модель чату на открытых данных, а затем разворачивают модель в чат-приложении для общения с друзьями.
#HuggingFace, #LLaMA2, #ChatGPT
https://huggingface.co/blog/Llama2-for-non-engineers
- Пользователи могут создать свой собственный чат-бот на основе модели LLaMA 2 без написания кода, благодаря инструментам Hugging Face: Spaces, AutoTrain и Inference Endpoints.
- Настоящее руководство позволяет любому пользователю, не обладающему техническими навыками, развивать и развертывать искусственный интеллект.
- На базе модели LLaMA 2 обучают модель чату на открытых данных, а затем разворачивают модель в чат-приложении для общения с друзьями.
#HuggingFace, #LLaMA2, #ChatGPT
https://huggingface.co/blog/Llama2-for-non-engineers
huggingface.co
Non-engineers guide: Train a LLaMA 2 chatbot
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Tachyum представила суперкомпьютер с производительностью свыше 50 ExaFLOP
Проект проходит под рабочим названием "Project Prodigy".
Суперкомпьютер будет использоваться для исследовательских целей, ИИ и в нанотехнологиях.
Устройство разработано для работы с искусственным интеллектом, серверными приложениями и облачными вычислениями.
#Tachyum, #ProjectProdigy, #Суперкомпьютер
https://www.cryptopolitan.com/tachyum-unveils-supercomputer/
Проект проходит под рабочим названием "Project Prodigy".
Суперкомпьютер будет использоваться для исследовательских целей, ИИ и в нанотехнологиях.
Устройство разработано для работы с искусственным интеллектом, серверными приложениями и облачными вычислениями.
#Tachyum, #ProjectProdigy, #Суперкомпьютер
https://www.cryptopolitan.com/tachyum-unveils-supercomputer/
Cryptopolitan
Tachyum Unveils Supercomputer with Over 50 ExaFLOP Performance
Tachyum has revealed its groundbreaking supercomputer, expected to be operational by 2025.
Plus.AI - генерация презентаций в Google Slides.
#Google, #PlusAI, #GoogleSlides
https://workspace.google.com/marketplace/app/plus_ai_for_google_slides/214277172452
#Google, #PlusAI, #GoogleSlides
https://workspace.google.com/marketplace/app/plus_ai_for_google_slides/214277172452
Google
Plus AI for Google Slides™ and Docs™ - Google Workspace Marketplace
Stop creating slides and docs the old way. Make work easier with the best AI tools for Google Slides™ and Google Docs™.
Microsoft представит чип для ИИ на ежегодной конференции
- Презентация нового чипа Microsoft для искусственного интеллекта ожидается в следующем месяце.
- Чип, работа над которым заняла несколько лет, позволит компании снизить зависимость от чипов для ИИ от Nvidia.
- Microsoft использует GPU от Nvidia для обучения и выполнения больших языковых моделей, таких как ChatGPT от OpenAI.
#Microsoft, #Nvidia, #ИИ
https://www.theinformation.com/articles/microsoft-to-debut-ai-chip-next-month-that-could-cut-nvidia-gpu-costs
- Презентация нового чипа Microsoft для искусственного интеллекта ожидается в следующем месяце.
- Чип, работа над которым заняла несколько лет, позволит компании снизить зависимость от чипов для ИИ от Nvidia.
- Microsoft использует GPU от Nvidia для обучения и выполнения больших языковых моделей, таких как ChatGPT от OpenAI.
#Microsoft, #Nvidia, #ИИ
https://www.theinformation.com/articles/microsoft-to-debut-ai-chip-next-month-that-could-cut-nvidia-gpu-costs
The Information
Microsoft to Debut AI Chip Next Month That Could Cut Nvidia GPU Costs
Microsoft next month plans to unveil the company’s first chip designed for artificial intelligence at its annual developers’ conference, according to a person with direct knowledge. The move, a culmination of years of work, could help Microsoft lessen its…
👍1
Forwarded from Сиолошная
Large Language Models (in 2023)
Large models of today will be Small models in only a few years
— Hyung Won Chung, OpenAI
Наткнулся на 45-минутное выступление сотрудника OpenAI, в прошлом — Google Brain. Интересно, что это первый автор статьи Scaling Instruction-Finetuned Language Models (от Google), в которой и обучаются большие языковые модели, и делается попытка обучения следования инструкциям. Крутой-опытный чувак, в общем, и вот теперь он (с несколькими коллегами, лол) в OpenAI.
Тезисы:
1️⃣ Обычно люди привыкли жить в мире, где аксиомы, лежащие в основе их области, не меняются. Однако сейчас "аксиомой" в мире больших языковых моделей просто является самая лучшая LLM (например, GPT-4). Какие-то вещи можно попробовать накрутить поверх модели, они не получатся, но это не значит, что через 5 лет с GPT-6 это не заработает — потому что поменяется база. Вообще, к почти любому утверждению логично добавлять "пока что". Не "модель не может X", а "модель не может делать X ПОКА ЧТО".
2️⃣ Я как-то недавно пришёл к этому тезису, очень рад, что сотрудники OpenAI его разделяют: всё, что делается сейчас, надо документировать и, самое главное, оставлять в таком виде, чтобы в будущем можно было вернуться и очень быстро воспроизвести и перепроверить. Вдруг что-то не работало сейчас, но заработает в будущем? Те же AI-агенты — им не хватает навыков планирования и декомпозиции, но сама концепция "давайте дадим LLM память, доступ в интернет и возможность писать код, а затем поставим задачу" — офигенная.
3️⃣ 11:55 - 24:03 на пальцах объясняет как работает data/model parallelism, и для чего он нужен. Если интересно с технической точки зрения немного углубиться — можно глянуть.
4️⃣ Hyung считает, что целевая функция (в данный момент — Maximum Likelihood для предтренировки LLM) является бутылочным горлышком в достижении масштабов, условно, 10000x GPT-4. В рамках развития машинного обучения вещи, которые мы проектировали вручную, становились все более ненужными и ограничивающими (есть даже шутка, что каждый раз, когда из Google-переводчика увольняли лингвистов, то качество вырастало).
Но мы все еще разрабатываем функции потерь для обучения вручную. Выучиваемая функции с помощью отдельных алгоритмов, в понимании лектора, это следующая парадигма, к которой мы должны прийти, и она будет гораздо более масштабируемой. Сейчас шаг обучения RLHF с RM-моделированием (что это? смотрите мою лекцию) — это своего рода попытка сделать нечто подобное, но увы, пока всё изучено слабо и работает не на максимум.
Large models of today will be Small models in only a few years
— Hyung Won Chung, OpenAI
Наткнулся на 45-минутное выступление сотрудника OpenAI, в прошлом — Google Brain. Интересно, что это первый автор статьи Scaling Instruction-Finetuned Language Models (от Google), в которой и обучаются большие языковые модели, и делается попытка обучения следования инструкциям. Крутой-опытный чувак, в общем, и вот теперь он (с несколькими коллегами, лол) в OpenAI.
Тезисы:
Но мы все еще разрабатываем функции потерь для обучения вручную. Выучиваемая функции с помощью отдельных алгоритмов, в понимании лектора, это следующая парадигма, к которой мы должны прийти, и она будет гораздо более масштабируемой. Сейчас шаг обучения RLHF с RM-моделированием (что это? смотрите мою лекцию) — это своего рода попытка сделать нечто подобное, но увы, пока всё изучено слабо и работает не на максимум.
Please open Telegram to view this post
VIEW IN TELEGRAM
Canva представила инструменты для дизайна на базе ИИ
- Canva, австралийская платформа графического дизайна, представила инструменты дизайна, основанные на искусственном интеллекте.
- Они смогут конвертировать документы одним кликом или создать резюме из презентации, сообщения для блога из заметок, фотографии и видео из текста или картинок
- Всего Canva запустила 10+ новых продуктов на базе ИИ
- Данное обновление является ответом Canva на всплеск конкуренции со стороны крупных игроков в данной области, таких как Adobe.
#Canva, #Adobe, #ИИ
https://www.bloomberg.com/news/articles/2023-10-04/canva-unveils-ai-design-tools-as-competition-from-adobe-heats-up
- Canva, австралийская платформа графического дизайна, представила инструменты дизайна, основанные на искусственном интеллекте.
- Они смогут конвертировать документы одним кликом или создать резюме из презентации, сообщения для блога из заметок, фотографии и видео из текста или картинок
- Всего Canva запустила 10+ новых продуктов на базе ИИ
- Данное обновление является ответом Canva на всплеск конкуренции со стороны крупных игроков в данной области, таких как Adobe.
#Canva, #Adobe, #ИИ
https://www.bloomberg.com/news/articles/2023-10-04/canva-unveils-ai-design-tools-as-competition-from-adobe-heats-up
Bloomberg.com
Design Software Company Canva Unveils AI Tools to Take on Rivals Like Adobe
Australian design software company Canva Inc. unveiled a suite of artificial intelligence-powered tools to take on competitors including Adobe Inc.
Forwarded from Сиолошная
И ещё один набор тезисов от Dario Amodei, CEO Anthropic, из вот этого подкаста. Выписал для вас 5 самых интересных тезисов из двухчасового видео.
1️⃣ Отвечая на вопрос про бизнесы и продукты вокруг LLM, Dario дал следующий совет: "Лучше фокусироваться на том, что модели не могут делать сегодня. Скажем, они справляются лишь в 40% случаев. Это, вероятно, означает, что через год-два они смогут давать правильное решение в 80-90% случаев. Поэтому имейте доверие и совершите прыжок веры, в надежде на такое улучшение, и разрабатывайте продукт с оглядкой на прогресс." А если бизнес клевый — можно вообще делать партнерство с Anthropic, и увеличивать шансы того, что это станет правдой (ибо они включат ваши задачи в свою выборку).
2️⃣ Одно из (частично) неудавшихся предсказаний Dario — сразу после GPT-2 он думал, что модели преобразуют в агентов и придумают, как обучать их через Reinforcement Learning, как это было с Dota 2, Го, Starcraft. Однако оказалось, что компании просто продолжать вливать больше денег в вычислительные мощности и увеличивать нейронки, так как это самые низковисящие фрукты, которые легко сорвать. Вероятно, сам этап ещё впереди, просто Dario ожидал другую последовательность развития технологии.
3️⃣ Воу, а вот это инсайд. На дежурный вопрос "а не прекратится ли дальнейшее масштабирование из-за отсутствия данных?" Amodei дал свой обычный ответ: "По разным причинам я не думаю, что это произойдет в ближайшее время, ну, может 10% дам. В интернете много публично доступных данных, если внимательно посмотреть по углам, даже не обращаясь к лицензированным и закопирайченным данным".
А вот дальше он сказал, что есть разные многообещающие подходы, и он не будет вдаваться в подробности, НО ВОТ СОЗДАНИЕ СИНТЕТИЧЕСКИХ ДАННЫХ! Об этом они, мол, много думали, и скорее всего другие LLM-компании тоже исследуют направление. Никогда раньше, даже в подкастах 2-3 недельной давности, он этого уточнения не делал.
Также он добавил, что пока не доказано, что это будет работать на том масштабе, на котором мы хотим (типа можно ли взять модель на 1T параметров, сгенерировать высококачественные данные, и на этом обучать модель на 10T параметров, чтобы она была лучше исходной).
4️⃣ Предсказание от Dario: в 2024м с точки зрения как самых положительных, так и самых негативных сценариев (разработка био-оружия, etc.) с LLMками ничего радикального не произойдет. Модели просто станут существенно лучше в глазах потребителей, и все будут приятно удивлены прогрессу за полтора-два года (с выхода ChatGPT). Бизнесы и стартаперы начнут ещё больше адаптировать их под свои нужды. Наша будничная жизнь не изменится. Но вот в 2025м, может 2026м, намечаются реальные изменения.
5️⃣ Затронули тему интерпретируемости LLM, Amodei пофлексил, что они вот сейчас выпустят одну работу (Towards Monosemanticity: Decomposing Language Models With Dictionary Learning, разбора на канале нет, но блогпост оформлен очень сочно!), и там они показывают хороший прогресс в понимании отдельных нейронов в сети, и что он очень оптимистичен и ожидает прикладных результатов в течение 2-3 лет. Потенциально, дальнейшее развитие поможет с улучшением AI Safety.
А вот дальше он сказал, что есть разные многообещающие подходы, и он не будет вдаваться в подробности, НО ВОТ СОЗДАНИЕ СИНТЕТИЧЕСКИХ ДАННЫХ! Об этом они, мол, много думали, и скорее всего другие LLM-компании тоже исследуют направление. Никогда раньше, даже в подкастах 2-3 недельной давности, он этого уточнения не делал.
Также он добавил, что пока не доказано, что это будет работать на том масштабе, на котором мы хотим (типа можно ли взять модель на 1T параметров, сгенерировать высококачественные данные, и на этом обучать модель на 10T параметров, чтобы она была лучше исходной).
Please open Telegram to view this post
VIEW IN TELEGRAM