Skip to main content

Z AI (Zhipu AI)

Z AI (ранее Zhipu AI) предлагает революционную серию GLM-4.5, обладающую возможностями гибридного мышления и агентным дизайном ИИ. Выпущенные в июле 2025 года, эти модели демонстрируют выдающиеся результаты в унифицированном логическом мышлении, написании кода и приложениях с интеллектуальными агентами, сохраняя при этом доступность открытого исходного кода под лицензией MIT.

Веб-сайт: https://z.ai/model-api (международный) | https://open.bigmodel.cn/ (Китай)

Получение API Key

Международные пользователи

  1. Регистрация/Вход: Перейдите на https://z.ai/model-api. Создайте аккаунт или войдите в систему.
  2. Переход к API Keys: Перейдите в панель управления аккаунтом и найдите раздел API keys.
  3. Создание ключа: Сгенерируйте новый API key для вашего приложения.
  4. Копирование ключа: Немедленно скопируйте API key и сохраните его в безопасном месте.

Пользователи из материкового Китая

  1. Регистрация/Вход: Перейдите на https://open.bigmodel.cn/. Создайте аккаунт или войдите в систему.
  2. Переход к API Keys: Перейдите в панель управления аккаунтом и найдите раздел API keys.
  3. Создание ключа: Сгенерируйте новый API key для вашего приложения.
  4. Копирование ключа: Немедленно скопируйте API key и сохраните его в безопасном месте.

Поддерживаемые модели

Z AI предоставляет различные каталоги моделей в зависимости от выбранного региона:

Серия GLM-4.5

  • GLM-4.5 — флагманская модель с общим количеством параметров 355B и 32B активными параметрами.
  • GLM-4.5-Air — компактная модель с общим количеством параметров 106B и 12B активными параметрами.

Модели GLM-4.5 с гибридным мышлением (Hybrid Reasoning)

  • GLM-4.5 (Thinking Mode) — продвинутое мышление с пошаговым анализом.
  • GLM-4.5-Air (Thinking Mode) — эффективное мышление для массового оборудования.

Все модели обладают следующими характеристиками:

  • Контекстное окно 128 000 токенов для обработки объемных документов.
  • Архитектура Mixture of Experts (MoE) для оптимальной производительности.
  • Agent-native дизайн, интегрирующий логическое мышление, написание кода и использование инструментов.
  • Доступность в open-source под лицензией MIT.

Настройка в Careti

  1. Откройте настройки Careti: Нажмите на иконку шестеренки (⚙️) в панели Careti.
  2. Выберите провайдера: Выберите "Z AI" в выпадающем списке "API Provider".
  3. Выберите регион: Выберите ваш регион:
    • "International" для глобального доступа.
    • "China" для доступа из материкового Китая.
  4. Введите API Key: Вставьте ваш Z AI API key в поле "Z AI API Key".
  5. Выберите модель: Выберите нужную модель в выпадающем списке "Model".

Планы GLM Coding

Z AI предлагает тарифные планы подписки, специально разработанные для задач программирования. Эти планы обеспечивают экономичный доступ к моделям GLM-4.5 через структуру на основе промптов, а не традиционную тарификацию за использование API.

Варианты планов

GLM Coding Lite — $3/месяц

  • 120 промптов за 5-часовой цикл.
  • Доступ к модели GLM-4.5.
  • Работает исключительно через инструменты для программирования, такие как Careti.

GLM Coding Pro — $15/месяц

  • 600 промптов за 5-часовой цикл.
  • Доступ к модели GLM-4.5.
  • Работает исключительно через инструменты для программирования, такие как Careti.

Оба плана предлагают промо-цену на первый месяц: Lite снижается с $6 до $3, Pro снижается с $30 до $15.

Страница подписки zAI, показывающая планы GLM Coding Lite и Pro с ценами

Настройка планов GLM Coding

Чтобы использовать планы GLM Coding в Careti:

  1. Подпишитесь: Перейдите на https://z.ai/subscribe и выберите свой план.

  2. Создайте API Key: После подписки войдите в панель управления zAI и создайте API key для вашего плана программирования.

  3. Настройте в Careti: Откройте настройки Careti, выберите "Z AI" в качестве провайдера и вставьте ваш API key в поле "Z AI API Key".

Настройки Careti с выбранным провайдером zAI и выделенным полем API key

Настройка напрямую связывает вашу подписку с Careti, предоставляя доступ к возможностям вызова инструментов GLM-4.5, оптимизированным для рабочих процессов программирования.

Гибридный интеллект Z AI

Серия GLM-4.5 от Z AI представляет революционные возможности, которые отличают ее от обычных языковых моделей:

Архитектура гибридного мышления (Hybrid Reasoning)

GLM-4.5 работает в двух различных режимах:

  • Thinking Mode: Предназначен для сложных задач логического вывода и использования инструментов, задействуя глубокие аналитические процессы.
  • Non-Thinking Mode: Обеспечивает мгновенные ответы на простые запросы, оптимизируя эффективность.

Эта двухрежимная архитектура представляет собой философию "agent-native" дизайна, которая адаптирует интенсивность обработки в зависимости от сложности запроса.

Исключительная производительность

GLM-4.5 набрала в сумме 63.2 балла в 12 бенчмарках, охватывающих агентные задачи, логическое мышление и программирование, заняв 3-е место среди всех проприетарных и открытых моделей. GLM-4.5-Air сохраняет конкурентоспособность с результатом 59.8 баллов, обеспечивая при этом превосходную эффективность.

Превосходство Mixture of Experts

Сложная архитектура MoE оптимизирует производительность при сохранении вычислительной эффективности:

  • GLM-4.5: 355B общих параметров и 32B активных параметров.
  • GLM-4.5-Air: 106B общих параметров и 12B активных параметров.

Расширенные возможности контекста

Контекстное окно в 128 000 токенов позволяет всесторонне понимать длинные документы и кодовые базы. Реальные тесты подтверждают эффективную обработку кодовых баз объемом почти 2 000 строк при сохранении замечательной производительности.

Лидерство в Open-Source

Выпущенная под лицензией MIT, GLM-4.5 предоставляет исследователям и разработчикам доступ к передовым возможностям без проприетарных ограничений, включая базовые модели, версии с гибридным мышлением и оптимизированные варианты FP8.

Региональная оптимизация

API Endpoints

  • International: Использует https://api.z.ai/api/paas/v4
  • China: Использует https://open.bigmodel.cn/api/paas/v4

Доступность моделей

Настройка региона определяет как API endpoint, так и доступные модели с автоматической фильтрацией для обеспечения совместимости с выбранным регионом.

Особые функции

Агентные возможности (Agentic Capabilities)

Унифицированная архитектура GLM-4.5 делает ее особенно подходящей для сложных приложений с интеллектуальными агентами, требующих интегрированного мышления, написания кода и использования инструментов.

Комплексный бенчмаркинг

Оценка производительности включает в себя:

  • 3 бенчмарка для агентных задач
  • 7 бенчмарков для логического мышления
  • 2 бенчмарка для программирования

Эта всесторонняя оценка демонстрирует универсальность в различных сценариях применения ИИ.

Интеграция для разработчиков

Модели поддерживают интеграцию через несколько фреймворков:

  • transformers
  • vLLM
  • SGLang

В комплекте поставляются специализированный код модели, парсер инструментов и реализации парсера мышления.

Сравнение производительности

против Claude 4 Sonnet

GLM-4.5 показывает конкурентоспособные результаты в агентном программировании и задачах на логику, хотя Claude Sonnet 4 сохраняет преимущества в проценте успешного написания кода и автономной разработке многофункциональных приложений.

против GPT-4.5

GLM-4.5 занимает конкурентные позиции в бенчмарках на мышление и агентные функции, в то время как GPT-4.5 обычно лидирует в точности выполнения чистых задач в профессиональных тестах, таких как MMLU и AIME.

Советы и примечания

  • Выбор региона: Выбирайте соответствующий регион для оптимальной производительности и соблюдения местных правил.
  • Выбор модели: GLM-4.5 для максимальной производительности, GLM-4.5-Air для эффективности и совместимости с массовым оборудованием.
  • Преимущество контекста: Большое контекстное окно 128K позволяет обрабатывать значительные кодовые базы и документы.
  • Преимущества Open Source: Лицензия MIT разрешает как коммерческое использование, так и вторичную разработку.
  • Агентные приложения: Особенно сильна в приложениях, требующих интеграции логики, кода и использования инструментов.
  • Гибридное мышление: Используйте Thinking Mode для сложных проблем и Non-Thinking Mode для простых запросов.
  • API Совместимость: OpenAI-совместимый API обеспечивает потоковые ответы и отчеты об использовании.
  • Поддержка фреймворков: Доступно несколько вариантов интеграции для различных сценариев развертывания.