व्यक्तिगत एजेंट बेंचमार्क पैक

Personal Agent Benchmark Pack स्थानीय व्यक्तिगत सहायक वर्कफ़्लो के लिए एक छोटा repo-समर्थित QA परिदृश्य पैक है। यह कोई सामान्य मॉडल बेंचमार्क नहीं है और इसे नए रनर की आवश्यकता नहीं है। पैक QA अवलोकन, सिंथेटिक QA चैनल, और मौजूदा qa/scenarios YAML कैटलॉग में वर्णित निजी QA स्टैक का पुनः उपयोग करता है। पहला पैक जानबूझकर सीमित है:

स्थानीय Cron डिलीवरी के माध्यम से नकली व्यक्तिगत रिमाइंडर
qa-channel के माध्यम से नकली DM और थ्रेड उत्तर रूटिंग
अस्थायी QA वर्कस्पेस मेमरी फ़ाइलों से नकली प्राथमिकता स्मरण
नकली गुप्त नो-इको जांचें
छोटे अनुमोदन-शैली संवाद-चरण के बाद सुरक्षित पठन-समर्थित टूल फ़ॉलोथ्रू
संवेदनशील स्थानीय पठन अनुरोध के लिए अनुमोदन अस्वीकृति रोक व्यवहार
प्रमाण-समर्थित कार्य स्थिति रिपोर्टिंग, जो लंबित, अवरुद्ध, और पूर्ण को अलग रखती है
साझा करने के लिए सुरक्षित निदान आर्टिफ़ैक्ट, जो कच्ची व्यक्तिगत सामग्री हटाते हुए उपयोगी स्थिति बनाए रखते हैं
प्रमाण-समर्थित पूर्णता दावे, जो स्थानीय साक्ष्य मौजूद होने से पहले नकली प्रगति से बचते हैं
विफलता पुनर्प्राप्ति, जो आंशिक स्थिति रिपोर्ट करती है और पुनः प्रयास सीमाओं को स्पष्ट रखती है

परिदृश्य

मशीन-पठनीय पैक मेटाडेटा extensions/qa-lab/src/scenario-packs.ts में रहता है। पैक को --pack personal-agent के साथ चलाएँ:

OPENCLAW_ENABLE_PRIVATE_QA_CLI=1 pnpm openclaw qa suite \
  --provider-mode mock-openai \
  --pack personal-agent \
  --concurrency 1

--pack दोहराए गए --scenario फ़्लैग के साथ योगात्मक है। स्पष्ट परिदृश्य पहले चलते हैं, फिर पैक परिदृश्य QA_PERSONAL_AGENT_SCENARIO_IDS क्रम में चलते हैं और डुप्लिकेट हटा दिए जाते हैं। यह पैक mock-openai या किसी अन्य स्थानीय QA प्रदाता लेन के साथ qa-channel के लिए बनाया गया है। इसे लाइव चैट सेवाओं या वास्तविक व्यक्तिगत खातों की ओर निर्देशित नहीं किया जाना चाहिए।

गोपनीयता मॉडल

परिदृश्य केवल नकली उपयोगकर्ताओं, नकली प्राथमिकताओं, नकली रहस्यों, और suite द्वारा बनाए गए अस्थायी QA Gateway वर्कस्पेस का उपयोग करते हैं। उन्हें वास्तविक OpenClaw उपयोगकर्ता मेमरी, सत्र, क्रेडेंशियल, लॉन्च एजेंट, वैश्विक कॉन्फ़िग, या लाइव Gateway स्थिति को पढ़ना या लिखना नहीं चाहिए। आर्टिफ़ैक्ट मौजूदा QA suite आर्टिफ़ैक्ट डायरेक्टरी के अंतर्गत रहते हैं और उन्हें परीक्षण आउटपुट की तरह माना जाना चाहिए। रिडैक्शन जांचें नकली मार्कर का उपयोग करती हैं, इसलिए विफलताओं का निरीक्षण करना और उन्हें issues में दर्ज करना सुरक्षित है।

पैक का विस्तार करना

qa/scenarios/personal/ के अंतर्गत नए .yaml केस जोड़ें, फिर परिदृश्य id को QA_PERSONAL_AGENT_SCENARIO_IDS में जोड़ें। प्रत्येक केस को छोटा, स्थानीय, mock-openai में नियतात्मक, और एक व्यक्तिगत सहायक व्यवहार पर केंद्रित रखें। अच्छे अनुवर्ती उम्मीदवार:

रिडैक्ट किए गए ट्रैजेक्टरी निर्यात जांचें
केवल-स्थानीय Plugin वर्कफ़्लो जांचें

नया रनर, Plugin, निर्भरता, लाइव ट्रांसपोर्ट, या मॉडल जज जोड़ने से बचें, जब तक परिदृश्य कैटलॉग में उस सतह को उचित ठहराने के लिए पर्याप्त स्थिर केस न हों।

​परिदृश्य

​गोपनीयता मॉडल

​पैक का विस्तार करना

परिदृश्य

गोपनीयता मॉडल

पैक का विस्तार करना