Прогресс проекта

Что сделано по AI-ассистенту для заполнения кредитных заключений. Обновляется по мере релизов.

Задач в системе

Загружено файлов

Компонентов

RAG · Tools · Agent · Filler · UI

Стадия

Beta

tagged-templates end-to-end, CoT + cross-check

Roadmap

Инфраструктура и веб-приложение

FastAPI + SQLite + Jinja2 на ipotekabank.space. OTP-логин, задачи, загрузка файлов drag&drop, дашборд аналитика, dark-тема.

готово

GUI-редактор JSON-шаблона отчёта

Non-IT пользователь может редактировать поля (section/label/type/values), валидировать и сохранять без касания JSON. Сохранение с бэкапом.

готово

RAG-сервис (Voyage + OpenAI GPT-4.1)

Адаптивный chunking 50–150 токенов с overlap и пришитыми заголовками, OCR-fallback через vision-модель, гибридный поиск BM25+vector с RRF-fusion, LLM-query-expansion (paraphrases + HyDE + keywords), LLM-rerank. Прямой OpenAI API (OpenRouter fallback).

готово

Filler для tagged-templates.docx (2-step CoT)

Пайплайн заполнения: RO (57 полей + 28 TEXT-блоков) и LA (46 полей + 20 таблиц + 10 блоков). Multilingual RAG (en + ru + uz синонимы лейблов, кеш на диск). CoT-экстракт на поле: (1) hypothesize — LLM предлагает до 3 кандидатов с цитатами; (2) verify — строгий ревьюер проверяет и выбирает лучшего или null. TEXT-блоки: narrative-генератор с few-shot стилевыми примерами. TABLE-ячейки: LLM-маппер [TABLE N.R.C] по заголовкам строк/колонок. Выход на английском языке. Docx-patcher по тегам.

готово

Два типа задач: tagged-templates / freeform

При создании задачи выбирается тип — заполнение шаблона (filler) или свободный анализ (SGR-агент). Хранится в tasks.task_type. Для tagged-templates результат — скачиваемый .docx.

готово

Persistence логов агента и авто-восстановление

События пишутся в /var/lib/cra/agent_runs/<run_id>/events.jsonl + status.json. После F5 или рестарта сервиса лог подтягивается с диска и polling продолжается с того же места. Эндпоинт /agent/runs перечисляет раны задачи.

готово

Тулкит агента (fs / bash / clock)

fs.list, fs.read_page (с OCR-fallback), fs.read_slice, fs.grep, bash.run в песочнице (cwd pinned, regex-blocklist, timeout), clock.now. Единый dispatcher.

готово

SGR-агент с «плюшками» top-leaderboard

Pydantic discriminated union над тулами, episodic summaries, CISC weighted voting (3 цепочки), consistency-check, critic + multi-persona debate, retry reflection, per-run snapshot.

готово

UI запуска с IT-терминальным логом

Кнопка «Запустить AI-агента», live-прогресс (polling 1.5с), терминально-стилизованный лог (JetBrains Mono, цветные теги info/step/tool/ok/err, timestamps). События: ingest_*, i18n_*, field_begin/ok/missing/skip/error, cross_check_*, cross_issue, docx_save, completion. Для tagged-templates — кнопка скачивания заполненного .docx.

готово

HITL-форма отчёта · разметка 1-в-1 с .docx

Страница /tasks/<id>/report с тремя режимами: Форма — cover-блок, banner-заголовки секций, таблицы с мерджами как в .docx, поля в ячейках, SELECT-дропдауны. Тексты — word-like стиль с gradient tag-badges. Документ — WYSIWYG-рендер .docx через mammoth с серверным кэшированием. Цветной dot-статус (ok / вручную / нет), 📎 source+page+score, ↻ rerun одного поля. «Сохранить» → перегенерирует три .docx (EN · RU · UZ) для скачивания. Результаты персистентны в out/summary.json.

готово

Второй тип шаблона: Limit Application

46 скаляров + 20 динамических таблиц ([TABLE N.R.C]) + 10 аналитических блоков. Поячеечный LLM-маппер с учётом заголовков строк и колонок. Карта полей + filler pipeline.

готово

Trilingual .docx (EN · RU · UZ)

Агент извлекает и генерирует всё на английском. При сохранении HITL-формы LLM переводит поля (batch) и narrative-тексты (per-block) на русский и узбекский. Три версии .docx для скачивания.

готово

WYSIWYG-превью .docx с кэшированием

mammoth.js рендерит .docx в HTML. Серверный файловый кэш с инвалидацией по mtime. Кнопка «Обновить превью» с force-bypass кэша.

готово

Расширенный тулкит агента: python.exec + web

python.exec — песочница для вычислений (дата-арифметика, CAGR, парсинг). web.search (DuckDuckGo) + web.fetch — поиск в интернете (реестры, курсы, регуляторные пороги). Добавлены в SGR-агент и system prompt.

готово

Landscape-ориентация .docx и PDF

Шаблон .docx переведён в альбомный формат (A4 landscape). PDF генерируется через WeasyPrint с size: 297mm×210mm. Таблицы масштабированы до полной ширины страницы с правильными пропорциями колонок (25% label / 40% value / 20% right label / 15% right value).

готово

Colgroup-инъекция для HTML/PDF-превью

Автоматическое извлечение ширин колонок из DOCX gridCol и инъекция <colgroup> в mammoth HTML. Превью и PDF соответствуют табличной структуре .docx.

готово

On-prem LLM (vLLM / Ollama)

Сейчас OpenAI GPT-4.1 напрямую — быстрее итерироваться. Для прод-использования нужен локальный endpoint (данные клиентов не должны уходить вовне). Кандидаты: Qwen2.5-Instruct, Llama-3.x, DeepSeek.

план

Метрики и дашборд качества

Точность по полям (по тест-кейсу WATER MCHJ и другим), доля найденных полей, среднее число шагов, стоимость ($), время. Отдельная страница метрик для руководства.

план

Интеграционные тесты

Golden-суит на реальных тест-кейсах: прогон агента end-to-end, сравнение с эталонным заключением, CI-пайплайн.

план

Архитектура

user → CRA UI (/app)
         │
         ├── выбор типа задачи: [tagged-templates | freeform]
         ├── загрузка документов → /var/lib/cra/tasks/<tid>/
         │
         ▼
   [ Запустить AI-агента ] ── POST /api/tasks/<tid>/agent/run
         │
    ┌────┴────────────────────────────────────────────────┐
    │ task_type == tagged-templates                               │ task_type == freeform
    ▼                                                     ▼
  Filler (filler/)                                   SGR Agent (agent/)
    │                                                     │
    ├─ ingest → RAG store(<run_id>)                       ├─ auto-ingest → RAG store
    ├─ i18n: en→ru+uz (1 LLM, cached)                     ├─ consistency probe (3 планировщика)
    ├─ per-field: multilingual RAG + LLM-rerank           ├─ N chains (CISC voting)
    │    ├─ CoT step 1: hypothesize (до 3 кандидатов)     │    loop: NextStep JSON → dispatch
    │    └─ CoT step 2: verify → pick / null (English)    │          каждые N шагов — episodic summary
    ├─ TEXT narrative gen (2–5 paragraphs, English)        ├─ critic + multi-persona debate
    ├─ TABLE cell mapping ([TABLE N.R.C])                 └─ final completion
    ├─ docx-patch (tag replacement)                            │
    ├─ save → summary.json                                     ▼
    └─ HITL-форма /tasks/<tid>/report                   grounding_refs + confidence
         │  (Форма · Тексты · Документ)
         │  (правки + ↻ rerun → /fields/rerun)
         ▼
   Сохранить → LLM-перевод RU+UZ → 3 × .docx → Скачать

  Event log → /agent_runs/<run_id>/events.jsonl (persistent, F5-safe)
  

Последние задачи

Клиент	Статус	Файлы	Создано
PRODUCTS WATER · W84KgYaj	draft	7	2026-04-19 10:47
FINAL_SOLUTION · 6lgDIe5w	draft	8	2026-04-17 10:11
WATER_RISK LA · JOyfNGmw	draft	6	2026-04-17 05:38
WATER_RISK · nNC4tkVN	draft	6	2026-04-15 16:38
PRODUCTS WATER MCHJ (пример) · X0kseHll	draft	6	2026-04-14 02:36

Детальная тех-документация: README проекта, а также README по каждому модулю (rag/, tools/, agent/).