Równoległe tory specjalistyczne pozwalają jednemu Gateway kierować różne czaty lub pokoje do różnych agentów, zachowując przy tym szybką obsługę użytkownika. Sztuka polega na traktowaniu równoległości jako problemu projektowania z ograniczonymi zasobami, a nie tylko jako „więcej agentów”.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Pierwsze zasady
Tor specjalistyczny poprawia przepustowość tylko wtedy, gdy zmniejsza rywalizację o rzeczywiste wąskie gardła:- Blokady sesji: tylko jedno uruchomienie powinno jednocześnie modyfikować daną sesję.
- Globalna przepustowość modelu: wszystkie widoczne uruchomienia czatu nadal współdzielą limity dostawcy.
- Przepustowość narzędzi: praca z powłoką, przeglądarką, siecią i repozytorium może być wolniejsza niż sama tura modelu.
- Budżet kontekstu: długie transkrypty spowalniają każdą przyszłą turę i zmniejszają jej koncentrację.
- Niejasność własności: zduplikowani agenci wykonujący tę samą pracę marnują przepustowość.
Zalecane wdrożenie
Faza 1: kontrakty torów + ciężka praca w tle
Nadaj każdemu torowi pisemny kontrakt w jego przestrzeni roboczej i prompcie systemowym:- Cel: praca, za którą odpowiada ten tor.
- Poza zakresem: praca, którą powinien przekazać dalej zamiast próbować wykonać.
- Budżet czatu: szybkie odpowiedzi zostają w czacie; długie zadania powinny zostać krótko potwierdzone, a następnie uruchomione w subagencie lub zadaniu w tle.
- Reguła przekazania: gdy inny tor jest właścicielem pracy, powiedz, dokąd powinna trafić, i podaj zwięzłe podsumowanie przekazania.
- Reguła ryzyka narzędzi: preferuj najmniejszą powierzchnię narzędziową, która może wykonać zadanie.
Faza 2: priorytet i kontrola współbieżności
Dostrój kolejkę i przepustowość modelu wokół wartości biznesowej każdego toru:Faza 3: koordynator / kontroler ruchu
Dodaj mały wzorzec koordynatora, gdy aktywnych jest już wiele torów:- Śledź aktywne zadania torów i ich właścicieli.
- Wykrywaj zduplikowane żądania w różnych grupach.
- Przekazuj podsumowania między torami.
- Pokazuj tylko blokery, ukończone wyniki i decyzje, które musi podjąć człowiek.