Innovation & Research
2.88K subscribers
416 photos
57 videos
149 files
4.47K links
“Push-the-envelope” Channel
Download Telegram
Google представили языковые модели Gemma c открытым исходным кодом

Две легкие языковые модели (SLM) Gemma 2B и Gemma 7B с 2 и 7 млрд параметров, соответственно, построены на тех же технологиях и исследованиях, что и Gemini. По бенчмаркам Gemma 7B превосходит модели LLaMa-2 с 7 и с 13 млрд параметров от Meta*.

Вместе с Gemma был также выпущен новый инструментарий ответственного GenAI, чтобы помочь разработчикам и исследователям расставить приоритеты при создании безопасных и ответственных AI-приложений.

* организация признана экстремистской и запрещена в РФ

#news #Google #AI

https://blog.google/technology/developers/gemma-open-models/
Google анонсировали бесплатный инструмент на базе AI с открытым исходным кодом для выявления вредоносных программ

Компания объявила об инициативе по предоставлению бесплатных инструментов на базе AI и инвестиций в целях укрепления онлайн-безопасности и противодействия хакерам. Так, злоумышленники, как и компании, занимающиеся вопросами кибербезопасности, сегодня все активнее используют AI в своей деятельности.

Таким образом, исходные коды нового AI-инструмента, использующего идентификацию типов файлов для обнаружения вредоносных программ для защиты Gmail, Google Drive и других продуктов, будут представлены в открытом доступе.

#news #Google #AI

https://www.bloomberg.com/news/articles/2024-02-16/google-announces-free-ai-cyber-tools-to-bolster-online-security
DeepMind разработала универсального AI-агента для виртуальных 3D-сред

SIMA (Scalable Instructable Multiworld Agent) может в различных условиях видеоигр следовать инструкциям на естественном языке и выполнять поставленные задачи. Агент изучил около 600 базовых игровых навыков: движение вперёд-назад, повороты, подъём по лестнице, открытие меню и карты игрового мира. Со временем разработчики планируют поручать SIMA выполнение более сложных функций, так как комплексные задачи типа «найти ресурсы и построить лагерь» агенту пока не под силу. Управление персонажем происходит с помощью обычных клавиатуры или мыши.

AI-агента обучали в 9 играх и 4 виртуальных исследовательских средах. SIMA не нужен доступ к исходному коду или специальные API, а достаточно изображения на экране и простых инструкций от пользователя. В основе агента — предварительно обученные модели машинного зрения, модель для интерпретации языка и преобразования команд пользователя в действия и ряд других.

Видеоигры являются ключевым тренировочным полигоном для AI-систем, т.к. представляют собой безопасную и при этом богатую среду обучения с гибкими настройками и постоянно меняющимися целями.

#news #AI #Google

https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/
Apple ведёт переговоры с Google об использовании Gemini на iPhone

AI-сервис может быть интегрирован уже в iOS 18, которую представят в этом году. Таким образом модель Google получит масштабирование на примерно 2 млрд активно используемых устройств, а Apple — полноценного AI-агента. Ранее сообщалось, что компания ведёт переговоры с OpenAI об интеграции ChatGPT в iPhone, но их результаты неизвестны. Apple также вела собственные разработки — инсайдеры называли модели генеративного AI Ajax и Apple GPT — но все они оказались недостаточно хороши для вывода на рынок.

Gemini уже внедрён на новых смартфонах Samsung — корейская корпорация тоже разрабатывала свою AI-модель Gauss, но в итоге выбрала Gemini. Расширение доли Google за счёт Apple неминуемо привлечёт внимание антимонопольных органов, поэтому у сделки могут быть препятствия регулятивного характера. Однако уже можно говорить о тенденции объединения производителей устройств вокруг крупных разработчиков AI. Очевидно, что собственные AI-модели производителей электроники не могут конкурировать с развитыми сервисами софтверных гигантов, и экосистемы последних будут прирастать за счёт новых пользователей сторонних устройств.

#news #Apple #Google #AI

https://www.bloomberg.com/news/articles/2024-03-18/apple-in-talks-to-license-google-gemini-for-iphone-ios-18-generative-ai-tools
Google планирует взимать плату за AI-функции поиска

Вероятно, новая опция станет частью премиальной подписки, в которой уже есть AI-инструменты на основе модели Gemini для Google Docs и Gmail. Ранее приоритетом компании была экспансия на рынках искусственного интеллекта, и за базовые функции — тем более за поиск — плату не взимали. Также сообщается, что традиционная поисковая система останется бесплатной, а реклама продолжит появляться рядом с результатами поиска даже для подписчиков.

#news #Google #AI

https://www.reuters.com/technology/google-plans-charge-ai-powered-search-engine-ft-reports-2024-04-03/
Google Cloud представил новинки для разработчиков на конференции Next

Vertex AI Agent Builder — no-code инструмент для создания диалоговых AI-агентов. Для снижения «галлюцинаций» опирается на RAG API и на векторный поиск. Также ответы агента могут привязываться к результатам поиска Google или к корпоративным базам знаний. Агент может генерировать контент — от простых текстов до полноценной маркетинговой кампании. Модель поддерживает 25 языков, в том числе русский, но полный функционал пока доступен для английского.

Gemini Code Assist — помощник написания кода для корпоративных клиентов, конкурент Copilot Enterprise от Microsoft. Будет доступен через плагины в популярных программах для разработки от VS Code, JetBrains и других. Особенности Code Assist:
1. широкое (до 1 млн токенов) контекстное окно, которое, по заверениям Google Cloud, радикально улучшит качество кода.
2. Способность работать с on-prem базами кода типа GitLab, GitHub и BitBucket, в том числе базами, распределёнными между разными сервисами
3. Доступ к партнерским базам знаний от Stack Overflow, Datadog, Datastax, Elastic, HashiCorp, Neo4j, Pinecone, Redis, Singlestore и др.
4. Основные факторы риска для продукта — величина задержки в реальной работе и качество выдаваемого кода в целом.

Gemini Cloud Assist, который поможет проектировать, эксплуатировать и оптимизировать жизненный цикл приложений в облаке. Инструмент может генерировать конфигурацию архитектуры по запросу клиента, диагностировать проблемы и находить их основные причины, а также оптимизировать использование облака для снижения затрат и повышения производительности.

Axion — ориентированный на задачи искусственного интеллекта серверный чип на архитектуре Neoverse 2 от Arm. По утверждению разработчиков, обеспечивает на 30% большую производительность, чем аналоги на базе Arm от конкурентов — AWS и Microsoft, а по сравнению с архитектурой x86 —на 50%, энергоэффективность — на 60%. Детальные спецификации и тесты компания обещает опубликовать позже в этом году.

#news #Google #AI

https://cloud.withgoogle.com/next
Innovation & Research
Amazon инвестирует в новые дата-центры $148 млрд за 15 лет Облачный провайдер Amazon Web Services наращивает вычислительные мощности: будут как расширены существующие в штатах Вирджиния и Орегон, так и заложены новые объекты в США, Саудовской Аравии и Малайзии.…
Google включилась в инвестиционную гонку за мощностями для AI

Глава DeepMind Демис Хассабис (Demis Hassabis) заявил, что в ближайшие годы DeepMind и Google совместно инвестируют свыше $100 млрд в разработку и вычислительную базу для искусственного интеллекта. Такой прогноз топ-менеджер дал в ответ на заявление Microsoft и OpenAI о новом суперЦОДе Stargate, постройка которого запланирована на 2028 г. и который, по предварительным оценкам, обойдётся в $100 млрд. Ранее также AWS сообщили о вложении в вычислительную инфраструктуру свыше $148 млрд в ближайшие 15 лет.

#news #Google #AI #инвестиции

https://www.bloomberg.com/news/articles/2024-04-16/deepmind-ceo-says-google-will-spend-more-than-100-billion-on-ai
Google обновил AI-продукты

AI-агент Astra. DeepMind продолжает работать над его предрелизной версией. В настоящий момент агент способен воспринимать видео на вход, искать физические объекты, определять их функции, читать код и вести диалог на естественном языке (впечатляющее демо-видео). Агент будет работать как на смартфонах, так и AR-очках. Дальнейшее направление развития агентов — повышения скорости обработки информации и ответов. Фокус на скорость становится трендом рынка чат-ботов и ассистентов.

Новая модель 1.5 Flash — самая быстрая из семейства, оптимизирована для масштабного промышленного выполнения объёмных высокочастотных задач, оснащена особенно широким контекстным окном. Модель мультимодальна и может обобщать разговоры, добавлять подписи к изображениям и видео, а также извлекать данные из длинных документов и таблиц. Ее обучение проходило при помощи дистилляции – процессе, при котором «навыки» передали из большой и мощной модели 1.5 Pro в более лёгкую и эффективную Flash.

Улучшение 1.5 Pro. Окно контекста расширено до 2 млн токенов (у ChatGPT-4o — 128 тыс.), улучшена генерация кода, планирование, ведение многоходовых диалогов, а также понимание аудио и изображений за счет усовершенствований данных и алгоритмов. Модель будет работать с аудиовизуальным контентом в Google AI Studio.

1.5 Pro может следовать более сложным и специфическим инструкциям, в том числе в части роли, формата и стиля поведения. Улучшен контроль над ответами модели для конкретных случаев применения, например, создание личности или ответов агента чата. Разработка будет доступна в Gemini Advanced и Workspace.

Мультимодальная Gemini Nano. Android становится первой мобильной ОС со встроенной мультимодальной моделью, работающей непосредственно на устройстве. Помимо текста модель теперь понимает также изображения. Оснащенные ею приложения на смартфонах Pixel смогут не только понимать текст, но также изображения, видео, PDF-документы, устную речь и иные звуки.

Следующее поколение открытых моделей Gemma. Эти модели созданы на тех же технологиях, что и Gimini. Gemma 2 получила оптимизацию архитектуры. Новая PaliGemma — лёгкая vision-language model (VLM). Она может распознавать изображения, текст на них, объекты, и анализировать короткие видео.

#news #Google #AI

https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/#gemini-model-updates
Honor внедрит AI-функции Google на новых смартфонах

Китайский производитель стал одним из первых в мире, кто объявил о таком шаге. Речь идет о помощнике Gemini, а также инструменте для преобразования текста в изображение Imagen 2. Несмотря на технологическое противостояние США и КНР и санкционное давление на Пекин, Honor продолжает использовать Android и ориентироваться на инструменты Google. Разработка собственных достаточно эффективных AI-моделей оказывается не под силу большинству производителей техники. Так, Samsung, сперва выпустивший собственную LLM Gauss, в итоге перешёл на решения Google.

#news #Google #AI

https://www.cnbc.com/2024/05/22/honor-will-have-google-ai-features-on-its-upcoming-smartphones.html
Google входит в капитал крупной солнечной электростанции на Тайване

Бигтех в этом проекте выступает партнёром инвестиционного гиганта BlackRock. Корпорации профинансируют строительство СЭС на 1 ГВт, управлять которым будет тайваньская компания New Green Power, подконтрольная BlackRock. Доли софинансирования участники сделки не раскрывают.
Google гарантирует закупку 300 МВт мощности новой станции.

Энергию предполагается направить на питание местных серверов Google, поддерживающих AI- и облачные сервисы Тайваня, а также на производственные мощности некоторых поставщиков чипов для интернет-гиганта.

#Google #news #энергетика

https://www.cnbc.com/2024/07/01/google-invests-in-blackrock-backed-solar-developer-in-taiwan-amid-ai-boom.html