Z AI (Zhipu AI)

Z AI (ранее Zhipu AI) предлагает революционную серию GLM-4.5, обладающую возможностями гибридного мышления и агентным дизайном ИИ. Выпущенные в июле 2025 года, эти модели демонстрируют выдающиеся результаты в унифицированном логическом мышлении, написании кода и приложениях с интеллектуальными агентами, сохраняя при этом доступность открытого исходного кода под лицензией MIT.

Веб-сайт: https://z.ai/model-api (международный) | https://open.bigmodel.cn/ (Китай)

Получение API Key

Международные пользователи

Регистрация/Вход: Перейдите на https://z.ai/model-api. Создайте аккаунт или войдите в систему.
Переход к API Keys: Перейдите в панель управления аккаунтом и найдите раздел API keys.
Создание ключа: Сгенерируйте новый API key для вашего приложения.
Копирование ключа: Немедленно скопируйте API key и сохраните его в безопасном месте.

Пользователи из материкового Китая

Регистрация/Вход: Перейдите на https://open.bigmodel.cn/. Создайте аккаунт или войдите в систему.
Переход к API Keys: Перейдите в панель управления аккаунтом и найдите раздел API keys.
Создание ключа: Сгенерируйте новый API key для вашего приложения.
Копирование ключа: Немедленно скопируйте API key и сохраните его в безопасном месте.

Поддерживаемые модели

Z AI предоставляет различные каталоги моделей в зависимости от выбранного региона:

Серия GLM-4.5

GLM-4.5 — флагманская модель с общим количеством параметров 355B и 32B активными параметрами.
GLM-4.5-Air — компактная модель с общим количеством параметров 106B и 12B активными параметрами.

Модели GLM-4.5 с гибридным мышлением (Hybrid Reasoning)

GLM-4.5 (Thinking Mode) — продвинутое мышление с пошаговым анализом.
GLM-4.5-Air (Thinking Mode) — эффективное мышление для массового оборудования.

Все модели обладают следующими характеристиками:

Контекстное окно 128 000 токенов для обработки объемных документов.
Архитектура Mixture of Experts (MoE) для оптимальной производительности.
Agent-native дизайн, интегрирующий логическое мышление, написание кода и использование инструментов.
Доступность в open-source под лицензией MIT.

Настройка в Careti

Откройте настройки Careti: Нажмите на иконку шестеренки (⚙️) в панели Careti.
Выберите провайдера: Выберите "Z AI" в выпадающем списке "API Provider".
Выберите регион: Выберите ваш регион:
- "International" для глобального доступа.
- "China" для доступа из материкового Китая.
Введите API Key: Вставьте ваш Z AI API key в поле "Z AI API Key".
Выберите модель: Выберите нужную модель в выпадающем списке "Model".

Планы GLM Coding

Z AI предлагает тарифные планы подписки, специально разработанные для задач программирования. Эти планы обеспечивают экономичный доступ к моделям GLM-4.5 через структуру на основе промптов, а не традиционную тарификацию за использование API.

Варианты планов

GLM Coding Lite — $3/месяц

120 промптов за 5-часовой цикл.
Доступ к модели GLM-4.5.
Работает исключительно через инструменты для программирования, такие как Careti.

GLM Coding Pro — $15/месяц

600 промптов за 5-часовой цикл.
Доступ к модели GLM-4.5.
Работает исключительно через инструменты для программирования, такие как Careti.

Оба плана предлагают промо-цену на первый месяц: Lite снижается с $6 до $3, Pro снижается с $30 до $15.

Страница подписки zAI, показывающая планы GLM Coding Lite и Pro с ценами

Настройка планов GLM Coding

Чтобы использовать планы GLM Coding в Careti:

Подпишитесь: Перейдите на https://z.ai/subscribe и выберите свой план.
Создайте API Key: После подписки войдите в панель управления zAI и создайте API key для вашего плана программирования.
Настройте в Careti: Откройте настройки Careti, выберите "Z AI" в качестве провайдера и вставьте ваш API key в поле "Z AI API Key".

Настройки Careti с выбранным провайдером zAI и выделенным полем API key

Настройка напрямую связывает вашу подписку с Careti, предоставляя доступ к возможностям вызова инструментов GLM-4.5, оптимизированным для рабочих процессов программирования.

Гибридный интеллект Z AI

Серия GLM-4.5 от Z AI представляет революционные возможности, которые отличают ее от обычных языковых моделей:

Архитектура гибридного мышления (Hybrid Reasoning)

GLM-4.5 работает в двух различных режимах:

Thinking Mode: Предназначен для сложных задач логического вывода и использования инструментов, задействуя глубокие аналитические процессы.
Non-Thinking Mode: Обеспечивает мгновенные ответы на простые запросы, оптимизируя эффективность.

Эта двухрежимная архитектура представляет собой философию "agent-native" дизайна, которая адаптирует интенсивность обработки в зависимости от сложности запроса.

Исключительная производительность

GLM-4.5 набрала в сумме 63.2 балла в 12 бенчмарках, охватывающих агентные задачи, логическое мышление и программирование, заняв 3-е место среди всех проприетарных и открытых моделей. GLM-4.5-Air сохраняет конкурентоспособность с результатом 59.8 баллов, обеспечивая при этом превосходную эффективность.

Превосходство Mixture of Experts

Сложная архитектура MoE оптимизирует производительность при сохранении вычислительной эффективности:

GLM-4.5: 355B общих параметров и 32B активных параметров.
GLM-4.5-Air: 106B общих параметров и 12B активных параметров.

Расширенные возможности контекста

Контекстное окно в 128 000 токенов позволяет всесторонне понимать длинные документы и кодовые базы. Реальные тесты подтверждают эффективную обработку кодовых баз объемом почти 2 000 строк при сохранении замечательной производительности.

Лидерство в Open-Source

Выпущенная под лицензией MIT, GLM-4.5 предоставляет исследователям и разработчикам доступ к передовым возможностям без проприетарных ограничений, включая базовые модели, версии с гибридным мышлением и оптимизированные варианты FP8.

Региональная оптимизация

API Endpoints

International: Использует https://api.z.ai/api/paas/v4
China: Использует https://open.bigmodel.cn/api/paas/v4

Доступность моделей

Настройка региона определяет как API endpoint, так и доступные модели с автоматической фильтрацией для обеспечения совместимости с выбранным регионом.

Особые функции

Агентные возможности (Agentic Capabilities)

Унифицированная архитектура GLM-4.5 делает ее особенно подходящей для сложных приложений с интеллектуальными агентами, требующих интегрированного мышления, написания кода и использования инструментов.

Комплексный бенчмаркинг

Оценка производительности включает в себя:

3 бенчмарка для агентных задач
7 бенчмарков для логического мышления
2 бенчмарка для программирования

Эта всесторонняя оценка демонстрирует универсальность в различных сценариях применения ИИ.

Интеграция для разработчиков

Модели поддерживают интеграцию через несколько фреймворков:

transformers
vLLM
SGLang

В комплекте поставляются специализированный код модели, парсер инструментов и реализации парсера мышления.

Сравнение производительности

против Claude 4 Sonnet

GLM-4.5 показывает конкурентоспособные результаты в агентном программировании и задачах на логику, хотя Claude Sonnet 4 сохраняет преимущества в проценте успешного написания кода и автономной разработке многофункциональных приложений.

против GPT-4.5

GLM-4.5 занимает конкурентные позиции в бенчмарках на мышление и агентные функции, в то время как GPT-4.5 обычно лидирует в точности выполнения чистых задач в профессиональных тестах, таких как MMLU и AIME.

Советы и примечания

Выбор региона: Выбирайте соответствующий регион для оптимальной производительности и соблюдения местных правил.
Выбор модели: GLM-4.5 для максимальной производительности, GLM-4.5-Air для эффективности и совместимости с массовым оборудованием.
Преимущество контекста: Большое контекстное окно 128K позволяет обрабатывать значительные кодовые базы и документы.
Преимущества Open Source: Лицензия MIT разрешает как коммерческое использование, так и вторичную разработку.
Агентные приложения: Особенно сильна в приложениях, требующих интеграции логики, кода и использования инструментов.
Гибридное мышление: Используйте Thinking Mode для сложных проблем и Non-Thinking Mode для простых запросов.
API Совместимость: OpenAI-совместимый API обеспечивает потоковые ответы и отчеты об использовании.
Поддержка фреймворков: Доступно несколько вариантов интеграции для различных сценариев развертывания.

Получение API Key​

Международные пользователи​

Пользователи из материкового Китая​

Поддерживаемые модели​

Серия GLM-4.5​

Модели GLM-4.5 с гибридным мышлением (Hybrid Reasoning)​

Настройка в Careti​

Планы GLM Coding​

Варианты планов​

Настройка планов GLM Coding​

Гибридный интеллект Z AI​

Архитектура гибридного мышления (Hybrid Reasoning)​

Исключительная производительность​

Превосходство Mixture of Experts​

Расширенные возможности контекста​

Лидерство в Open-Source​

Региональная оптимизация​

API Endpoints​

Доступность моделей​

Особые функции​

Агентные возможности (Agentic Capabilities)​

Комплексный бенчмаркинг​

Интеграция для разработчиков​

Сравнение производительности​

против Claude 4 Sonnet​

против GPT-4.5​

Советы и примечания​