pdf एक या अधिक PDF दस्तावेज़ों का विश्लेषण करता है और टेक्स्ट लौटाता है।
त्वरित व्यवहार:
- Anthropic और Google मॉडल प्रदाताओं के लिए नेटिव प्रदाता मोड।
- अन्य प्रदाताओं के लिए निष्कर्षण फ़ॉलबैक मोड (पहले टेक्स्ट निकालता है, फिर ज़रूरत होने पर पेज इमेज)।
- एकल (
pdf) या बहु (pdfs) इनपुट का समर्थन करता है, प्रति कॉल अधिकतम 10 PDF।
उपलब्धता
यह टूल केवल तब रजिस्टर होता है जब OpenClaw एजेंट के लिए PDF-सक्षम मॉडल कॉन्फ़िग हल कर सके:agents.defaults.pdfModelagents.defaults.imageModelपर फ़ॉलबैक- एजेंट के हल किए गए सेशन/डिफ़ॉल्ट मॉडल पर फ़ॉलबैक
- यदि नेटिव-PDF प्रदाता auth-समर्थित हैं, तो उन्हें सामान्य इमेज फ़ॉलबैक उम्मीदवारों से पहले प्राथमिकता दें
pdf टूल उपलब्ध नहीं कराया जाता।
उपलब्धता नोट्स:
- फ़ॉलबैक श्रृंखला auth-सचेत है। कॉन्फ़िगर किया गया
provider/modelकेवल तभी गिना जाता है जब OpenClaw वास्तव में उस प्रदाता के लिए एजेंट को प्रमाणित कर सके। - नेटिव PDF प्रदाता वर्तमान में Anthropic और Google हैं।
- यदि हल किए गए सेशन/डिफ़ॉल्ट प्रदाता के पास पहले से कॉन्फ़िगर किया गया vision/PDF मॉडल है, तो PDF टूल अन्य auth-समर्थित प्रदाताओं पर फ़ॉलबैक करने से पहले उसी का दोबारा उपयोग करता है।
इनपुट संदर्भ
एक PDF पथ या URL।
कई PDF पथ या URL, कुल मिलाकर 10 तक।
विश्लेषण प्रॉम्प्ट।
1-5 या 1,3,7-9 जैसा पेज फ़िल्टर।निष्कर्षण फ़ॉलबैक मोड में एन्क्रिप्टेड PDF के लिए पासवर्ड।
provider/model रूप में वैकल्पिक मॉडल ओवरराइड।प्रति-PDF आकार सीमा MB में। डिफ़ॉल्ट
agents.defaults.pdfMaxBytesMb या 10 है।- लोड करने से पहले
pdfऔरpdfsको मर्ज और डिडुप्लिकेट किया जाता है। - यदि कोई PDF इनपुट नहीं दिया गया है, तो टूल त्रुटि देता है।
pagesको 1-आधारित पेज नंबरों के रूप में पार्स किया जाता है, डिडुप्लिकेट, सॉर्ट, और कॉन्फ़िगर किए गए अधिकतम पेजों तक सीमित किया जाता है।passwordअनुरोध में हर PDF पर लागू होता है और केवल निष्कर्षण फ़ॉलबैक मोड द्वारा उपयोग किया जाता है।maxBytesMbका डिफ़ॉल्टagents.defaults.pdfMaxBytesMbया10है।
समर्थित PDF संदर्भ
- स्थानीय फ़ाइल पथ (
~विस्तार सहित) file://URLhttp://औरhttps://URL- OpenClaw-प्रबंधित इनबाउंड रेफ़, जैसे
media://inbound/<id>
- अन्य URI स्कीम (उदाहरण के लिए
ftp://)unsupported_pdf_referenceके साथ अस्वीकार की जाती हैं। - सैंडबॉक्स मोड में, रिमोट
http(s)URL अस्वीकार किए जाते हैं। - workspace-only फ़ाइल नीति सक्षम होने पर, अनुमत रूट्स के बाहर स्थानीय फ़ाइल पथ अस्वीकार किए जाते हैं।
- OpenClaw के इनबाउंड मीडिया स्टोर के अंतर्गत प्रबंधित इनबाउंड रेफ़ और रीप्ले किए गए पथ workspace-only फ़ाइल नीति के साथ अनुमत हैं।
निष्पादन मोड
नेटिव प्रदाता मोड
नेटिव मोड प्रदाताanthropic और google के लिए उपयोग किया जाता है।
टूल कच्चे PDF बाइट्स सीधे प्रदाता APIs को भेजता है।
नेटिव मोड सीमाएँ:
pagesसमर्थित नहीं है। यदि सेट किया गया, तो टूल त्रुटि लौटाता है।passwordसमर्थित नहीं है। एन्क्रिप्टेड PDF का विश्लेषण करने के लिए non-native मॉडल का उपयोग करें।- बहु-PDF इनपुट समर्थित है; प्रत्येक PDF को प्रॉम्प्ट से पहले नेटिव दस्तावेज़ ब्लॉक / इनलाइन PDF भाग के रूप में भेजा जाता है।
निष्कर्षण फ़ॉलबैक मोड
फ़ॉलबैक मोड non-native प्रदाताओं के लिए उपयोग किया जाता है। प्रवाह:- चुने गए पेजों से टेक्स्ट निकालें (
agents.defaults.pdfMaxPagesतक, डिफ़ॉल्ट20)। - यदि निकाले गए टेक्स्ट की लंबाई
200वर्णों से कम है, तो चुने गए पेजों को PNG इमेज में रेंडर करें और उन्हें शामिल करें। - निकाली गई सामग्री और प्रॉम्प्ट को चुने गए मॉडल को भेजें।
- पेज इमेज निष्कर्षण
4,000,000के पिक्सेल बजट का उपयोग करता है। - एन्क्रिप्टेड PDF को शीर्ष-स्तरीय
passwordपैरामीटर के साथ खोला जा सकता है। - यदि लक्ष्य मॉडल इमेज इनपुट का समर्थन नहीं करता और निकालने योग्य टेक्स्ट नहीं है, तो टूल त्रुटि देता है।
- यदि टेक्स्ट निष्कर्षण सफल होता है लेकिन इमेज निष्कर्षण के लिए केवल-टेक्स्ट मॉडल पर vision की आवश्यकता होगी, तो OpenClaw रेंडर की गई इमेज हटा देता है और निकाले गए टेक्स्ट के साथ जारी रखता है।
- निष्कर्षण फ़ॉलबैक bundled
document-extractPlugin का उपयोग करता है। Pluginclawpdfका स्वामी है, जो PDFium WebAssembly के माध्यम से टेक्स्ट निष्कर्षण और इमेज रेंडरिंग प्रदान करता है।
कॉन्फ़िग
आउटपुट विवरण
टूलcontent[0].text में टेक्स्ट और details में संरचित मेटाडेटा लौटाता है।
सामान्य details फ़ील्ड:
model: हल किया गया मॉडल रेफ़ (provider/model)native: नेटिव प्रदाता मोड के लिएtrue, फ़ॉलबैक के लिएfalseattempts: सफलता से पहले विफल हुए फ़ॉलबैक प्रयास
- एकल PDF इनपुट:
details.pdf - बहु PDF इनपुट:
pdfप्रविष्टियों के साथdetails.pdfs[] - सैंडबॉक्स पथ पुनर्लेखन मेटाडेटा (जब लागू हो):
rewrittenFrom
त्रुटि व्यवहार
- PDF इनपुट गुम:
pdf required: provide a path or URL to a PDF documentफेंकता है - बहुत अधिक PDF:
details.error = "too_many_pdfs"में संरचित त्रुटि लौटाता है - असमर्थित संदर्भ स्कीम:
details.error = "unsupported_pdf_reference"लौटाता है pagesके साथ नेटिव मोड: स्पष्टpages is not supported with native PDF providersत्रुटि फेंकता है
उदाहरण
एकल PDF:संबंधित
- टूल्स अवलोकन - सभी उपलब्ध एजेंट टूल
- कॉन्फ़िगरेशन संदर्भ - pdfMaxBytesMb और pdfMaxPages कॉन्फ़िग