मुख्य सामग्री पर जाएं
pdf एक या अधिक PDF दस्तावेज़ों का विश्लेषण करता है और टेक्स्ट लौटाता है। त्वरित व्यवहार:
  • Anthropic और Google मॉडल प्रदाताओं के लिए नेटिव प्रदाता मोड।
  • अन्य प्रदाताओं के लिए निष्कर्षण फ़ॉलबैक मोड (पहले टेक्स्ट निकालता है, फिर ज़रूरत होने पर पेज इमेज)।
  • एकल (pdf) या बहु (pdfs) इनपुट का समर्थन करता है, प्रति कॉल अधिकतम 10 PDF।

उपलब्धता

यह टूल केवल तब रजिस्टर होता है जब OpenClaw एजेंट के लिए PDF-सक्षम मॉडल कॉन्फ़िग हल कर सके:
  1. agents.defaults.pdfModel
  2. agents.defaults.imageModel पर फ़ॉलबैक
  3. एजेंट के हल किए गए सेशन/डिफ़ॉल्ट मॉडल पर फ़ॉलबैक
  4. यदि नेटिव-PDF प्रदाता auth-समर्थित हैं, तो उन्हें सामान्य इमेज फ़ॉलबैक उम्मीदवारों से पहले प्राथमिकता दें
यदि कोई उपयोगी मॉडल हल नहीं किया जा सकता, तो pdf टूल उपलब्ध नहीं कराया जाता। उपलब्धता नोट्स:
  • फ़ॉलबैक श्रृंखला auth-सचेत है। कॉन्फ़िगर किया गया provider/model केवल तभी गिना जाता है जब OpenClaw वास्तव में उस प्रदाता के लिए एजेंट को प्रमाणित कर सके।
  • नेटिव PDF प्रदाता वर्तमान में Anthropic और Google हैं।
  • यदि हल किए गए सेशन/डिफ़ॉल्ट प्रदाता के पास पहले से कॉन्फ़िगर किया गया vision/PDF मॉडल है, तो PDF टूल अन्य auth-समर्थित प्रदाताओं पर फ़ॉलबैक करने से पहले उसी का दोबारा उपयोग करता है।

इनपुट संदर्भ

pdf
string
एक PDF पथ या URL।
pdfs
string[]
कई PDF पथ या URL, कुल मिलाकर 10 तक।
prompt
string
डिफ़ॉल्ट:"Analyze this PDF document."
विश्लेषण प्रॉम्प्ट।
pages
string
1-5 या 1,3,7-9 जैसा पेज फ़िल्टर।
password
string
निष्कर्षण फ़ॉलबैक मोड में एन्क्रिप्टेड PDF के लिए पासवर्ड।
model
string
provider/model रूप में वैकल्पिक मॉडल ओवरराइड।
maxBytesMb
number
प्रति-PDF आकार सीमा MB में। डिफ़ॉल्ट agents.defaults.pdfMaxBytesMb या 10 है।
इनपुट नोट्स:
  • लोड करने से पहले pdf और pdfs को मर्ज और डिडुप्लिकेट किया जाता है।
  • यदि कोई PDF इनपुट नहीं दिया गया है, तो टूल त्रुटि देता है।
  • pages को 1-आधारित पेज नंबरों के रूप में पार्स किया जाता है, डिडुप्लिकेट, सॉर्ट, और कॉन्फ़िगर किए गए अधिकतम पेजों तक सीमित किया जाता है।
  • password अनुरोध में हर PDF पर लागू होता है और केवल निष्कर्षण फ़ॉलबैक मोड द्वारा उपयोग किया जाता है।
  • maxBytesMb का डिफ़ॉल्ट agents.defaults.pdfMaxBytesMb या 10 है।

समर्थित PDF संदर्भ

  • स्थानीय फ़ाइल पथ (~ विस्तार सहित)
  • file:// URL
  • http:// और https:// URL
  • OpenClaw-प्रबंधित इनबाउंड रेफ़, जैसे media://inbound/<id>
संदर्भ नोट्स:
  • अन्य URI स्कीम (उदाहरण के लिए ftp://) unsupported_pdf_reference के साथ अस्वीकार की जाती हैं।
  • सैंडबॉक्स मोड में, रिमोट http(s) URL अस्वीकार किए जाते हैं।
  • workspace-only फ़ाइल नीति सक्षम होने पर, अनुमत रूट्स के बाहर स्थानीय फ़ाइल पथ अस्वीकार किए जाते हैं।
  • OpenClaw के इनबाउंड मीडिया स्टोर के अंतर्गत प्रबंधित इनबाउंड रेफ़ और रीप्ले किए गए पथ workspace-only फ़ाइल नीति के साथ अनुमत हैं।

निष्पादन मोड

नेटिव प्रदाता मोड

नेटिव मोड प्रदाता anthropic और google के लिए उपयोग किया जाता है। टूल कच्चे PDF बाइट्स सीधे प्रदाता APIs को भेजता है। नेटिव मोड सीमाएँ:
  • pages समर्थित नहीं है। यदि सेट किया गया, तो टूल त्रुटि लौटाता है।
  • password समर्थित नहीं है। एन्क्रिप्टेड PDF का विश्लेषण करने के लिए non-native मॉडल का उपयोग करें।
  • बहु-PDF इनपुट समर्थित है; प्रत्येक PDF को प्रॉम्प्ट से पहले नेटिव दस्तावेज़ ब्लॉक / इनलाइन PDF भाग के रूप में भेजा जाता है।

निष्कर्षण फ़ॉलबैक मोड

फ़ॉलबैक मोड non-native प्रदाताओं के लिए उपयोग किया जाता है। प्रवाह:
  1. चुने गए पेजों से टेक्स्ट निकालें (agents.defaults.pdfMaxPages तक, डिफ़ॉल्ट 20)।
  2. यदि निकाले गए टेक्स्ट की लंबाई 200 वर्णों से कम है, तो चुने गए पेजों को PNG इमेज में रेंडर करें और उन्हें शामिल करें।
  3. निकाली गई सामग्री और प्रॉम्प्ट को चुने गए मॉडल को भेजें।
फ़ॉलबैक विवरण:
  • पेज इमेज निष्कर्षण 4,000,000 के पिक्सेल बजट का उपयोग करता है।
  • एन्क्रिप्टेड PDF को शीर्ष-स्तरीय password पैरामीटर के साथ खोला जा सकता है।
  • यदि लक्ष्य मॉडल इमेज इनपुट का समर्थन नहीं करता और निकालने योग्य टेक्स्ट नहीं है, तो टूल त्रुटि देता है।
  • यदि टेक्स्ट निष्कर्षण सफल होता है लेकिन इमेज निष्कर्षण के लिए केवल-टेक्स्ट मॉडल पर vision की आवश्यकता होगी, तो OpenClaw रेंडर की गई इमेज हटा देता है और निकाले गए टेक्स्ट के साथ जारी रखता है।
  • निष्कर्षण फ़ॉलबैक bundled document-extract Plugin का उपयोग करता है। Plugin clawpdf का स्वामी है, जो PDFium WebAssembly के माध्यम से टेक्स्ट निष्कर्षण और इमेज रेंडरिंग प्रदान करता है।

कॉन्फ़िग

{
  agents: {
    defaults: {
      pdfModel: {
        primary: "anthropic/claude-opus-4-6",
        fallbacks: ["openai/gpt-5.4-mini"],
      },
      pdfMaxBytesMb: 10,
      pdfMaxPages: 20,
    },
  },
}
पूर्ण फ़ील्ड विवरण के लिए कॉन्फ़िगरेशन संदर्भ देखें।

आउटपुट विवरण

टूल content[0].text में टेक्स्ट और details में संरचित मेटाडेटा लौटाता है। सामान्य details फ़ील्ड:
  • model: हल किया गया मॉडल रेफ़ (provider/model)
  • native: नेटिव प्रदाता मोड के लिए true, फ़ॉलबैक के लिए false
  • attempts: सफलता से पहले विफल हुए फ़ॉलबैक प्रयास
पथ फ़ील्ड:
  • एकल PDF इनपुट: details.pdf
  • बहु PDF इनपुट: pdf प्रविष्टियों के साथ details.pdfs[]
  • सैंडबॉक्स पथ पुनर्लेखन मेटाडेटा (जब लागू हो): rewrittenFrom

त्रुटि व्यवहार

  • PDF इनपुट गुम: pdf required: provide a path or URL to a PDF document फेंकता है
  • बहुत अधिक PDF: details.error = "too_many_pdfs" में संरचित त्रुटि लौटाता है
  • असमर्थित संदर्भ स्कीम: details.error = "unsupported_pdf_reference" लौटाता है
  • pages के साथ नेटिव मोड: स्पष्ट pages is not supported with native PDF providers त्रुटि फेंकता है

उदाहरण

एकल PDF:
{
  "pdf": "/tmp/report.pdf",
  "prompt": "Summarize this report in 5 bullets"
}
कई PDF:
{
  "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],
  "prompt": "Compare risks and timeline changes across both documents"
}
पेज-फ़िल्टर किया गया फ़ॉलबैक मॉडल:
{
  "pdf": "https://example.com/report.pdf",
  "pages": "1-3,7",
  "model": "openai/gpt-5.4-mini",
  "prompt": "Extract only customer-impacting incidents"
}
निष्कर्षण फ़ॉलबैक के साथ एन्क्रिप्टेड PDF:
{
  "pdf": "/tmp/locked.pdf",
  "password": "example-password",
  "model": "openai/gpt-5.4-mini",
  "prompt": "Summarize this contract"
}

संबंधित