Z AI (Zhipu AI)
Z AI (ранее Zhipu AI) предлагает революционную серию GLM-4.5, обладающую возможностями гибридного мышления и агентным дизайном ИИ. Выпущенные в июле 2025 года, эти модели демонстрируют выдающиеся результаты в унифицированном логическом мышлении, написании кода и приложениях с интеллектуальными агентами, сохраняя при этом доступность открытого исходного кода под лицензией MIT.
Веб-сайт: https://z.ai/model-api (международный) | https://open.bigmodel.cn/ (Китай)
Получение API Key
Международные пользователи
- Регистрация/Вход: Перейдите на https://z.ai/model-api. Создайте аккаунт или войдите в систему.
- Переход к API Keys: Перейдите в панель управления аккаунтом и найдите раздел API keys.
- Создание ключа: Сгенерируйте новый API key для вашего приложения.
- Копирование ключа: Немедленно скопируйте API key и сохраните его в безопасном месте.
Пользователи из материкового Китая
- Регистрация/Вход: Перейдите на https://open.bigmodel.cn/. Создайте аккаунт или войдите в систему.
- Переход к API Keys: Перейдите в панель управления аккаунтом и найдите раздел API keys.
- Создание ключа: Сгенерируйте новый API key для вашего приложения.
- Копирование ключа: Немедленно скопируйте API key и сохраните его в безопасном месте.
Поддерживаемые модели
Z AI предоставляет различные каталоги моделей в зависимости от выбранного региона:
Серия GLM-4.5
- GLM-4.5 — флагманская модель с общим количеством параметров 355B и 32B активными параметрами.
- GLM-4.5-Air — компактная модель с общим количеством параметров 106B и 12B активными параметрами.
Модели GLM-4.5 с гибридным мышлением (Hybrid Reasoning)
- GLM-4.5 (Thinking Mode) — продвинутое мышление с пошаговым анализом.
- GLM-4.5-Air (Thinking Mode) — эффективное мышление для массового оборудования.
Все модели обладают следующими характеристиками:
- Контекстное окно 128 000 токенов для обработки объемных документов.
- Архитектура Mixture of Experts (MoE) для оптимальной производительности.
- Agent-native дизайн, интегрирующий логическое мышление, написание кода и использование инструментов.
- Доступность в open-source под лицензией MIT.
Настройка в Careti
- Откройте настройки Careti: Нажмите на иконку шестеренки (⚙️) в панели Careti.
- Выберите провайдера: Выберите "Z AI" в выпадающем списке "API Provider".
- Выберите регион: Выберите ваш регион:
- "International" для глобального доступа.
- "China" для доступа из материкового Китая.
- Введите API Key: Вставьте ваш Z AI API key в поле "Z AI API Key".
- Выберите модель: Выберите нужную модель в выпадающем списке "Model".
Планы GLM Coding
Z AI предлагает тарифные планы подписки, специально разработанные для задач программирования. Эти планы обеспечивают экономичный доступ к моделям GLM-4.5 через структуру на основе промптов, а не традиционную тарификацию за использование API.
Варианты планов
GLM Coding Lite — $3/месяц
- 120 промптов за 5-часовой цикл.
- Доступ к модели GLM-4.5.
- Работает исключительно через инструменты для программирования, такие как Careti.
GLM Coding Pro — $15/месяц
- 600 промптов за 5-часовой цикл.
- Доступ к модели GLM-4.5.
- Работает исключительно через инструменты для программирования, такие как Careti.
Оба плана предлагают промо-цену на первый месяц: Lite снижается с $6 до $3, Pro снижается с $30 до $15.
Настройка планов GLM Coding
Чтобы использовать планы GLM Coding в Careti:
-
Подпишитесь: Перейдите на https://z.ai/subscribe и выберите свой план.
-
Создайте API Key: После подписки войдите в панель управления zAI и создайте API key для вашего плана программирования.
-
Настройте в Careti: Откройте настройки Careti, выберите "Z AI" в качестве провайдера и вставьте ваш API key в поле "Z AI API Key".
Настройка напрямую связывает вашу подписку с Careti, предоставляя доступ к возможностям вызова инструментов GLM-4.5, оптимизированным для рабочих процессов программирования.
Гибридный интеллект Z AI
Серия GLM-4.5 от Z AI представляет революционные возможности, которые отличают ее от обычных языковых моделей:
Архитектура гибридного мышления (Hybrid Reasoning)
GLM-4.5 работает в двух различных режимах:
- Thinking Mode: Предназначен для сложных задач логического вывода и использования инструментов, задействуя глубокие аналитические процессы.
- Non-Thinking Mode: Обеспечивает мгновенные ответы на простые запросы, оптимизируя эффективность.
Эта двухрежимная архитектура представляет собой философию "agent-native" дизайна, которая адаптирует интенсивность обработки в зависимости от сложности запроса.
Исключительная производительность
GLM-4.5 набрала в сумме 63.2 балла в 12 бенчмарках, охватывающих агентные задачи, логическое мышление и программирование, заняв 3-е место среди всех проприетарных и открытых моделей. GLM-4.5-Air сохраняет конкурентоспособность с результатом 59.8 баллов, обеспечивая при этом превосходную эффективность.
Превосходство Mixture of Experts
Сложная архитектура MoE оптимизирует производительность при сохранении вычислительной эффективности:
- GLM-4.5: 355B общих параметров и 32B активных параметров.
- GLM-4.5-Air: 106B общих параметров и 12B активных параметров.
Расширенные возможности контекста
Контекстное окно в 128 000 токенов позволяет всесторонне понимать длинные документы и кодовые базы. Реальные тесты подтверждают эффективную обработку кодовых баз объемом почти 2 000 строк при сохранении замечательной производительности.
Лидерство в Open-Source
Выпущенная под лицензией MIT, GLM-4.5 предоставляет исследователям и разработчикам доступ к передовым возможностям без проприетарных ограничений, включая базовые модели, версии с гибридным мышлением и оптимизированные варианты FP8.
Региональная оптимизация
API Endpoints
- International: Использует
https://api.z.ai/api/paas/v4 - China: Использует
https://open.bigmodel.cn/api/paas/v4
Доступность моделей
Настройка региона определяет как API endpoint, так и доступные модели с автоматической фильтрацией для обеспечения совместимости с выбранным регионом.
Особые функции
Агентные возможности (Agentic Capabilities)
Унифицированная архитектура GLM-4.5 делает ее особенно подходящей для сложных приложений с интеллектуальными агентами, требующих интегрированного мышления, написания кода и использования инструментов.
Комплексный бенчмаркинг
Оценка производительности включает в себя:
- 3 бенчмарка для агентных задач
- 7 бенчмарков для логического мышления
- 2 бенчмарка для программирования
Эта всесторонняя оценка демонстрирует универсальность в различных сценариях применения ИИ.
Интеграция для разработчиков
Модели поддерживают интеграцию через несколько фреймворков:
- transformers
- vLLM
- SGLang
В комплекте поставляются специализированный код модели, парсер инструментов и реализации парсера мышления.
Сравнение производительности
против Claude 4 Sonnet
GLM-4.5 показывает конкурентоспособные результаты в агентном программировании и задачах на логику, хотя Claude Sonnet 4 сохраняет преимущества в проценте успешного написания кода и автономной разработке многофункциональных приложений.
против GPT-4.5
GLM-4.5 занимает конкурентные позиции в бенчмарках на мышление и агентные функции, в то время как GPT-4.5 обычно лидирует в точности выполнения чистых задач в профессиональных тестах, таких как MMLU и AIME.
Советы и примечания
- Выбор региона: Выбирайте соответствующий регион для оптимальной производительности и соблюдения местных правил.
- Выбор модели: GLM-4.5 для максимальной производительности, GLM-4.5-Air для эффективности и совместимости с массовым оборудованием.
- Преимущество контекста: Большое контекстное окно 128K позволяет обрабатывать значительные кодовые базы и документы.
- Преимущества Open Source: Лицензия MIT разрешает как коммерческое использование, так и вторичную разработку.
- Агентные приложения: Особенно сильна в приложениях, требующих интеграции логики, кода и использования инструментов.
- Гибридное мышление: Используйте Thinking Mode для сложных проблем и Non-Thinking Mode для простых запросов.
- API Совместимость: OpenAI-совместимый API обеспечивает потоковые ответы и отчеты об использовании.
- Поддержка фреймворков: Доступно несколько вариантов интеграции для различных сценариев развертывания.

