Neurogen

ChatGPT-3.5-Turbo уходит на покой - вышла ChatGPT-4o mini

Новая модель умнее классической ChatGPT-4, а стоимость при работе через API ниже на 60 процентов чем ChatGPT 3.5 Turbo, что делает ее самой дешевой моделью из арсенала OpenAI

Модель имеет контекстное окно из 128 тыс. токенов, поддерживает до 16 тыс. выходных токенов на запрос и обладает знаниями до октября 2023 года.

В официальном чате ChatGPT пользователи Free, Plus и Team смогут получить доступ к GPT-4o mini с сегодняшнего дня вместо GPT-3.5

Полный текст анонса выхода можно прочесть в блоге OpenAI.

#chatgpt #llm #ai

@neurogen_news

10.4K viewsedited 19:17

Neurogen

Вышла Grok-2: новая версия языковой модели от Илона Маска.

Grok-2 - значительный шаг вперед по сравнению с предыдущей моделью Grok-1.5, с передовыми возможностями в области чата, программирования и логических рассуждений.

Ранняя версия Grok-2 "sus-column-r" превосходит Claude 3.5 Sonnet и GPT-4-Turbo в таблице лидеров LMSYS.

Grok-2 и Grok-2 mini находятся в стадии бета-тестирования на 𝕏 и будут доступны через корпоративный API.

Grok-2 демонстрирует значительные улучшения в работе с контентом и инструментами, такими как определение недостающей информации и анализ последовательности событий.

Grok-2 и Grok-2 mini достигают уровня производительности, конкурентоспособного с другими передовыми моделями в различных областях, включая научные знания, общие знания и математические задачи.

Также заявлено, что Grok-2 отлично справляется с задачами распознавания изображений, обеспечивая современную производительность в области визуальных математических рассуждений и ответов на вопросы на основе документов.

#ai #llm #groq

11.4K views08:07

Neurogen

10.7K views14:45

Neurogen

Reflection 70B - дообученная Llama 3.1, обгоняющая все GPT-4o

Модель была дообучена на синтетических данных (созданных другой нейросетью) и по бенчмаркам обходит GPT-4o, а в скором времени обещают выпуск модели на 405B параметров.

Особенность модели - она проверяет сама себя и исправляет, перед тем как дать финальный ответ. Из-за этого время генерации ответа увеличивается, но и улучшается качество ответа.

Модель доступна в для загрузки, но даже квантованная до 4-bit GGUF версия требует 42.5 Гигабайта видео или оперативной памяти, а версия квантованная до 2-bit - 29.4 Gb.

Тем не менее, протестировать ее можно тут: Reflection 70B Playground, но из-за большой нагрузки сайт периодически ложится

#llm #ai #chatgpt

Neurogen - подпишись, тут рассказывают про нейросети

9.5K viewsedited 13:20

Neurogen

DeepSeek-Coder-V2 - open-source модель, которая лучше GPT-4-Turbo в программировании. DeepSeek-Coder-V2 обеспечивает производительность, сравнимую с GPT4-Turbo, в задачах, связанных с кодом, а также она лучше чем Claude, Gemini и все open-source языковые…

Вышла DeepSeek 2.5. Модель стала лучше чем ее Coder версия в работе с кодом, но также и комбинирует возможности обычной (Chat) версии, превосходя и ее.

Про DeepSeek Coder V2 я писал тут:
DeepSeek-Coder-V2 - open-source модель, которая лучше GPT-4-Turbo в программировании.

Модель имеет контекстное окно в 128000 токенов

Модель большая, на 236B параметров, поэтому запустить локально на домашнем ПК будет весьма проблематично.

Тем не менее, есть возможность бесплатной работы через официальный онлайн чат: chat.deepseek.com

Также модель доступна через API со стоимостью 0.14$ за миллион токенов на вход и 0.28$ за миллион токен на выход.

От себя хочу сказать, что давно активно пользуюсь версией DeepSeek Coder V2 в онлайн чате, и на некоторых сценариях модель действительно позволяла получить рабочее решение за меньшее кол-во шагов, чем через GPT-4o.

#llm #ai #deepseek #chatgpt

Neurogen - подпишись, тут рассказывают про нейросети

9.0K views17:55

Neurogen

Тесты GGUF Q2_K_L версии Reflection 70B на личном ПК. Модель работала на последней версии LM Studio - 0.3.2. Первые итоги: Задачки из серии "Тест на GPT-4" - проходит. Русский язык - знает, но порой делает ошибки. Стихи и песни на русском - не пишет.

Please open Telegram to view this post