LM Studio
Note
Ceci est un document de référence pour Careti. Il suit la version fusionnée de Careti v3.38.1. Les politiques spécifiques à Careti (runtime local pris en charge, authentification/routage, limitations des modèles) sont indiquées par <Note> dans le texte.
Configurer LM Studio avec Careti
Exécutez des modèles d'IA localement en utilisant LM Studio avec Careti.
Prérequis
- Ordinateur Windows, macOS ou Linux avec support AVX2
- Careti installé dans VS Code
Étapes de configuration
1. Installer LM Studio
- Visitez lmstudio.ai
- Téléchargez et installez pour votre système d'exploitation
2. Lancer LM Studio
- Ouvrez l'application installée
- Vous verrez quatre onglets sur la gauche : Chat, Developer (où vous démarrerez le serveur), My Models (où vos modèles téléchargés sont stockés), Discover (ajouter de nouveaux modèles)
3. Télécharger un modèle
- Parcourez la page « Discover »
- Sélectionnez et téléchargez votre modèle préféré
- Attendez que le téléchargement se termine
4. Démarrer le serveur
- Accédez à l'onglet « Developer »
- Basculez l'interrupteur du serveur sur « Running »
- Note : Le serveur fonctionnera à l'adresse
http://localhost:1234
5. Configurer Careti
- Ouvrez VS Code
- Cliquez sur l'icône des paramètres de Careti
- Sélectionnez « LM Studio » comme fournisseur d'API
- Sélectionnez votre modèle parmi les options disponibles
Modèle et paramètres recommandés
Pour une expérience optimale avec Careti, utilisez Qwen3 Coder 30B A3B Instruct. Ce modèle offre de solides performances en programmation et une utilisation fiable des outils.
Paramètres critiques
Après avoir chargé votre modèle dans l'onglet Developer, configurez ces paramètres :
- Context Length : Réglez sur 262 144 (le maximum du modèle)
- KV Cache Quantization : Laissez décoché (critique pour des performances constantes)
- Flash Attention : Activez si disponible (améliore les performances)
Guide de quantification
Choisissez la quantification en fonction de votre RAM :
- 32 Go de RAM : Utilisez la quantification 4 bits (~17 Go de téléchargement)
- 64 Go de RAM : Utilisez la quantification 8 bits (~32 Go de téléchargement) pour une meilleure qualité
- 128 Go+ de RAM : Envisagez la pleine précision ou des modèles plus volumineux
Format de modèle
- Mac (Apple Silicon) : Utilisez le format MLX pour des performances optimisées
- Windows/Linux : Utilisez le format GGUF
Activer les Compact Prompts
Pour des performances optimales avec les modèles locaux, activez les prompts compacts dans les paramètres de Careti. Cela réduit la taille du prompt de 90 % tout en conservant les fonctionnalités de base.
Accédez à Careti Settings → Features → Use Compact Prompt et activez l'option.
Notes importantes
- Démarrez LM Studio avant de l'utiliser avec Careti
- Gardez LM Studio en cours d'exécution en arrière-plan
- Le premier téléchargement du modèle peut prendre plusieurs minutes selon sa taille
- Les modèles sont stockés localement après le téléchargement
Dépannage
- Si Careti ne parvient pas à se connecter à LM Studio :
- Vérifiez que le serveur LM Studio est en cours d'exécution (consultez l'onglet Developer)
- Assurez-vous qu'un modèle est chargé
- Vérifiez que votre système répond aux exigences matérielles
.png)
.png)


