Skip to main content

^ Document Reading Tools

Die AI von Careti kann verschiedene Dokumentdateien direkt lesen, indem einfach der Pfad angegeben wird. Benutzer müssen Dateien nicht manuell anhängen.

Difference from Cline

FeatureClineCareti
PDF-LesenNur wenn Benutzer anhängtAI liest direkt über Pfad
DOCX/XLSX-LesenNur wenn Benutzer anhängtAI liest direkt über Pfad
Hangul (HWPX)Nicht unterstütztUnterstützt
Hangul 5.0 (HWP)Nicht unterstütztUnterstützt
PowerPoint (PPTX)Nicht unterstütztUnterstützt
Jupyter NotebookNicht unterstütztUnterstützt

Supported Formats

FormatErweiterungBeschreibung
PDF.pdfTextextraktion
Word.docxModerne Word-Dokumente
Excel.xlsxModerne Excel-Tabellen
PowerPoint.pptxTextextraktion aus Folien
Hangul (Modern).hwpxHangul 2014 und neuer
Hangul (Legacy).hwpHangul 5.0 ~ 2010
Jupyter.ipynbInhalte von Notebook-Zellen

Unsupported Formats

Veraltete Binärformate werden nicht unterstützt:

FormatErweiterungAlternative
Word 97-2003.docIn .docx konvertieren
Excel 97-2003.xlsIn .xlsx konvertieren
PowerPoint 97-2003.pptIn .pptx konvertieren

Konvertierungstools: LibreOffice, Google Docs, Microsoft Office

How to Use

Example 1: Analyzing Specification Documents

User: Analyze docs/spec.pdf
AI: [Uses Document Reading Tool] → Extracts PDF content → Provides analysis results

Example 2: Reading Hangul Documents

User: Summarize the contents of contract.hwp
AI: [Uses Document Reading Tool] → Extracts HWP text → Provides summary

Example 3: Analyzing Excel Data

User: Analyze the data in sales-report.xlsx
AI: [Uses Document Reading Tool] → Extracts spreadsheet data → Provides analysis results

Security

Pfad-Schutz

  • Pfad-Normalisierung verhindert Directory Traversal Attacks
  • Dateien innerhalb des Workspace werden automatisch genehmigt
  • Dateien außerhalb des Workspace erfordern die Zustimmung des Benutzers

File Size Limit

  • Maximal 50MB
  • Klare Fehlermeldung bei Überschreitung

Configuration

Document Reading Tools sind standardmäßig aktiviert. Da es sich um eine schreibgeschützte Operation handelt, gibt es keine separate Einstellung zum Deaktivieren.

Known Limitations

  1. Bilder/Diagramme nicht enthalten: Bilder und Diagramme in Dokumenten werden nicht in Text umgewandelt
  2. Komplexe Layouts: Tabellen und mehrspaltige Layouts werden in einfachen Text umgewandelt
  3. Ursprüngliche Formatierung geht verloren: Schriftart, Farbe und andere Formatierungsinformationen werden nicht extrahiert