Основные принципы
Специализированная линия повышает пропускную способность только тогда, когда снижает конкуренцию за реальные узкие места:- Блокировки сеансов: только один запуск должен изменять конкретный сеанс одновременно.
- Глобальная емкость модели: все видимые запуски в чатах по-прежнему совместно используют лимиты провайдера.
- Емкость инструментов: работа с оболочкой, браузером, сетью и репозиторием может быть медленнее самого хода модели.
- Бюджет контекста: длинные расшифровки делают каждый следующий ход медленнее и менее сфокусированным.
- Неясность владения: агенты-дубликаты, выполняющие одну и ту же работу, тратят емкость впустую.
Рекомендуемое развертывание
Этап 1: контракты линий + тяжелая фоновая работа
Дайте каждой линии письменный контракт в ее рабочей области и системном промпте:- Назначение: работа, которой владеет эта линия.
- Не цели: работа, которую ей следует передавать, а не пытаться выполнить.
- Бюджет чата: быстрые ответы остаются в чате; длинные задачи следует кратко подтверждать, затем запускать в фоновом субагенте или задаче.
- Правило передачи: когда работой владеет другая линия, укажите, куда ее следует направить, и предоставьте компактную сводку для передачи.
- Правило риска инструментов: предпочитайте минимальную поверхность инструментов, способную выполнить задачу.
Этап 2: управление приоритетами и параллелизмом
Настройте очередь и емкость модели вокруг бизнес-ценности каждой линии:Этап 3: координатор / диспетчер трафика
Добавьте небольшой паттерн координатора, когда активно несколько линий:- Отслеживайте активные задачи линий и владельцев.
- Обнаруживайте дублирующиеся запросы в разных группах.
- Передавайте сводки между линиями.
- Показывайте только блокеры, завершенные результаты и решения, которые должен принять человек.