Вышел генератор картинок Ideogram 2.0
По их оценке - круче чем flux pro.
По моим наблюдениям - весьма неплох. Хорошо справляется со сложными промптами и мелкими деталями. Иногда косячит с пальцами. С текстом справляется чуть лучше чем flux pro. Умеет сам сочинять связный текст: там есть встроенная LLM, которая пишет ему тексты (функция Magic Prompt).
Есть на сайте и в ios приложении (локально установить нельзя).
Дают бесплатно 10 кредитов в день (всего 5 генераций по 4 картинки за раз = 20 картинок). Цена 1 генерации по API - $0.08 (скорее всего, тоже за 4 картинки за один проход). Дорого.
https://ideogram.ai/
По их оценке - круче чем flux pro.
По моим наблюдениям - весьма неплох. Хорошо справляется со сложными промптами и мелкими деталями. Иногда косячит с пальцами. С текстом справляется чуть лучше чем flux pro. Умеет сам сочинять связный текст: там есть встроенная LLM, которая пишет ему тексты (функция Magic Prompt).
Есть на сайте и в ios приложении (локально установить нельзя).
Дают бесплатно 10 кредитов в день (всего 5 генераций по 4 картинки за раз = 20 картинок). Цена 1 генерации по API - $0.08 (скорее всего, тоже за 4 картинки за один проход). Дорого.
https://ideogram.ai/
👍20👎5🤔4❤2😁1
T-lite-instruct-0.1-8B от Тинькофф
Модель вышла еще месяц назад, но затестил только сейчас.
В русском рейтинге на llmarena.ru она внезапно оказалась на 4-м месте (лучшая среди протестированных опенсорс моделей)
Отлично работает на русском. Уровень владения языком даже лучше чем у gemma-2-9b и llama-3-8b.
Основана на llama-3-8b
Контекст: 8k
Отлично работает в talk-llama-fast
Интеллект для 8b модели на русском - средний, где-то справляется чуть лучше, где-то чуть хуже своих собратьев (лама и гемма). С математикой бывают проблемы.
Стихи на русском пытается писать! Точно лучше всех среди опенсорс моделей размером до 100b (на уровне mistral-123b. даже лама-405b не умеет в стихи). Причем, у меня локально рифма намного лучше, чем на сайте llmarena (возможно, у них температура слишком большая или квант хуже)
Для ассистента тестил с температурой 0.30, rep_pen 1, min_p 0.05
Для роулплея тестил с температурой 0.75, rep_pen 1.20, min_p 0.05, context 4k.
Instruct template: chatML
Цензуры почти нет.
Пишут, что тренировка заняла 4 дня на 96x A100-80GB ($16 000)
В чате шутят - поставить ее Олегу в моем боте - но ее что-то нет на openrouter =).
В целом, - лайк, буду гонять вместе со своей любимой gemma-27b, хз кто из них лучше в роулплее.
https://huggingface.co/AnatoliiPotapov/T-lite-instruct-0.1
gguf https://huggingface.co/mradermacher/T-lite-instruct-0.1-GGUF
Потестить (на вкладке Сравнение): https://llmarena.ru/
Модель вышла еще месяц назад, но затестил только сейчас.
В русском рейтинге на llmarena.ru она внезапно оказалась на 4-м месте (лучшая среди протестированных опенсорс моделей)
Отлично работает на русском. Уровень владения языком даже лучше чем у gemma-2-9b и llama-3-8b.
Основана на llama-3-8b
Контекст: 8k
Отлично работает в talk-llama-fast
Интеллект для 8b модели на русском - средний, где-то справляется чуть лучше, где-то чуть хуже своих собратьев (лама и гемма). С математикой бывают проблемы.
Стихи на русском пытается писать! Точно лучше всех среди опенсорс моделей размером до 100b (на уровне mistral-123b. даже лама-405b не умеет в стихи). Причем, у меня локально рифма намного лучше, чем на сайте llmarena (возможно, у них температура слишком большая или квант хуже)
Для ассистента тестил с температурой 0.30, rep_pen 1, min_p 0.05
Для роулплея тестил с температурой 0.75, rep_pen 1.20, min_p 0.05, context 4k.
Instruct template: chatML
Цензуры почти нет.
Пишут, что тренировка заняла 4 дня на 96x A100-80GB ($16 000)
В чате шутят - поставить ее Олегу в моем боте - но ее что-то нет на openrouter =).
В целом, - лайк, буду гонять вместе со своей любимой gemma-27b, хз кто из них лучше в роулплее.
https://huggingface.co/AnatoliiPotapov/T-lite-instruct-0.1
gguf https://huggingface.co/mradermacher/T-lite-instruct-0.1-GGUF
Потестить (на вкладке Сравнение): https://llmarena.ru/
🔥19👍10😭1
Flux умеет модифицировать известные логотипы с сохранением стиля
Половину сгенерировал в Flux Dev fp8 (T5_fp8), половину в Pro. "Котлета-Сарай" - из Ideogram 2.0 (там должна была быть котлета-царь, но что-то пошло не так)
"Царь-котлету" получил через img2img от оригинального лого + пришлось буквы Ц и Л в фотошопе поправить.
1024x1024 25 steps
Guidance 5-8
Sampler: Euler
Scheduler: Normal
Если с первого раза не понимает:
Для хорошего результата:
- длина нового слова должна примерно совпадать со старой
- желательно чтобы первая буква быть той же.
- flux не умеет в кириллицу. Ideogram пытается.
Иначе будете долго пытаться его заставить написать, то что нужно.
Если все равно не хочет - попробуйте в Flux Pro, он чуть умнее (https://fluxpro.art/create) или ideogram 2.0.
Половину сгенерировал в Flux Dev fp8 (T5_fp8), половину в Pro. "Котлета-Сарай" - из Ideogram 2.0 (там должна была быть котлета-царь, но что-то пошло не так)
"Царь-котлету" получил через img2img от оригинального лого + пришлось буквы Ц и Л в фотошопе поправить.
1024x1024 25 steps
Guidance 5-8
Sampler: Euler
Scheduler: Normal
Burger king logo with text "Bratan King" instead with red branded letters
Если с первого раза не понимает:
LEGO logo with text "OLEG" instead with branded letters
text is "OLEG" with white letters on red and yellow
The first letter is "O"
Для хорошего результата:
- длина нового слова должна примерно совпадать со старой
- желательно чтобы первая буква быть той же.
- flux не умеет в кириллицу. Ideogram пытается.
Иначе будете долго пытаться его заставить написать, то что нужно.
Если все равно не хочет - попробуйте в Flux Pro, он чуть умнее (https://fluxpro.art/create) или ideogram 2.0.
3👍29😁6🔥3👏3