Прогресс проекта

Что сделано по AI-ассистенту для заполнения кредитных заключений. Обновляется по мере релизов.
Задач в системе
5
Загружено файлов
33
Компонентов
5
RAG · Tools · Agent · Filler · UI
Стадия
Beta
tagged-templates end-to-end, CoT + cross-check

Roadmap

Инфраструктура и веб-приложение
FastAPI + SQLite + Jinja2 на ipotekabank.space. OTP-логин, задачи, загрузка файлов drag&drop, дашборд аналитика, dark-тема.
готово
GUI-редактор JSON-шаблона отчёта
Non-IT пользователь может редактировать поля (section/label/type/values), валидировать и сохранять без касания JSON. Сохранение с бэкапом.
готово
RAG-сервис (Voyage + OpenAI GPT-4.1)
Адаптивный chunking 50–150 токенов с overlap и пришитыми заголовками, OCR-fallback через vision-модель, гибридный поиск BM25+vector с RRF-fusion, LLM-query-expansion (paraphrases + HyDE + keywords), LLM-rerank. Прямой OpenAI API (OpenRouter fallback).
готово
Filler для tagged-templates.docx (2-step CoT)
Пайплайн заполнения: RO (57 полей + 28 TEXT-блоков) и LA (46 полей + 20 таблиц + 10 блоков). Multilingual RAG (en + ru + uz синонимы лейблов, кеш на диск). CoT-экстракт на поле: (1) hypothesize — LLM предлагает до 3 кандидатов с цитатами; (2) verify — строгий ревьюер проверяет и выбирает лучшего или null. TEXT-блоки: narrative-генератор с few-shot стилевыми примерами. TABLE-ячейки: LLM-маппер [TABLE N.R.C] по заголовкам строк/колонок. Выход на английском языке. Docx-patcher по тегам.
готово
Два типа задач: tagged-templates / freeform
При создании задачи выбирается тип — заполнение шаблона (filler) или свободный анализ (SGR-агент). Хранится в tasks.task_type. Для tagged-templates результат — скачиваемый .docx.
готово
Persistence логов агента и авто-восстановление
События пишутся в /var/lib/cra/agent_runs/<run_id>/events.jsonl + status.json. После F5 или рестарта сервиса лог подтягивается с диска и polling продолжается с того же места. Эндпоинт /agent/runs перечисляет раны задачи.
готово
Тулкит агента (fs / bash / clock)
fs.list, fs.read_page (с OCR-fallback), fs.read_slice, fs.grep, bash.run в песочнице (cwd pinned, regex-blocklist, timeout), clock.now. Единый dispatcher.
готово
SGR-агент с «плюшками» top-leaderboard
Pydantic discriminated union над тулами, episodic summaries, CISC weighted voting (3 цепочки), consistency-check, critic + multi-persona debate, retry reflection, per-run snapshot.
готово
UI запуска с IT-терминальным логом
Кнопка «Запустить AI-агента», live-прогресс (polling 1.5с), терминально-стилизованный лог (JetBrains Mono, цветные теги info/step/tool/ok/err, timestamps). События: ingest_*, i18n_*, field_begin/ok/missing/skip/error, cross_check_*, cross_issue, docx_save, completion. Для tagged-templates — кнопка скачивания заполненного .docx.
готово
HITL-форма отчёта · разметка 1-в-1 с .docx
Страница /tasks/<id>/report с тремя режимами: Форма — cover-блок, banner-заголовки секций, таблицы с мерджами как в .docx, поля в ячейках, SELECT-дропдауны. Тексты — word-like стиль с gradient tag-badges. Документ — WYSIWYG-рендер .docx через mammoth с серверным кэшированием. Цветной dot-статус (ok / вручную / нет), 📎 source+page+score, ↻ rerun одного поля. «Сохранить» → перегенерирует три .docx (EN · RU · UZ) для скачивания. Результаты персистентны в out/summary.json.
готово
Второй тип шаблона: Limit Application
46 скаляров + 20 динамических таблиц ([TABLE N.R.C]) + 10 аналитических блоков. Поячеечный LLM-маппер с учётом заголовков строк и колонок. Карта полей + filler pipeline.
готово
Trilingual .docx (EN · RU · UZ)
Агент извлекает и генерирует всё на английском. При сохранении HITL-формы LLM переводит поля (batch) и narrative-тексты (per-block) на русский и узбекский. Три версии .docx для скачивания.
готово
WYSIWYG-превью .docx с кэшированием
mammoth.js рендерит .docx в HTML. Серверный файловый кэш с инвалидацией по mtime. Кнопка «Обновить превью» с force-bypass кэша.
готово
Расширенный тулкит агента: python.exec + web
python.exec — песочница для вычислений (дата-арифметика, CAGR, парсинг). web.search (DuckDuckGo) + web.fetch — поиск в интернете (реестры, курсы, регуляторные пороги). Добавлены в SGR-агент и system prompt.
готово
Landscape-ориентация .docx и PDF
Шаблон .docx переведён в альбомный формат (A4 landscape). PDF генерируется через WeasyPrint с size: 297mm×210mm. Таблицы масштабированы до полной ширины страницы с правильными пропорциями колонок (25% label / 40% value / 20% right label / 15% right value).
готово
Colgroup-инъекция для HTML/PDF-превью
Автоматическое извлечение ширин колонок из DOCX gridCol и инъекция <colgroup> в mammoth HTML. Превью и PDF соответствуют табличной структуре .docx.
готово
On-prem LLM (vLLM / Ollama)
Сейчас OpenAI GPT-4.1 напрямую — быстрее итерироваться. Для прод-использования нужен локальный endpoint (данные клиентов не должны уходить вовне). Кандидаты: Qwen2.5-Instruct, Llama-3.x, DeepSeek.
план
Метрики и дашборд качества
Точность по полям (по тест-кейсу WATER MCHJ и другим), доля найденных полей, среднее число шагов, стоимость ($), время. Отдельная страница метрик для руководства.
план
Интеграционные тесты
Golden-суит на реальных тест-кейсах: прогон агента end-to-end, сравнение с эталонным заключением, CI-пайплайн.
план

Архитектура

user → CRA UI (/app) │ ├── выбор типа задачи: [tagged-templates | freeform] ├── загрузка документов → /var/lib/cra/tasks/<tid>/ │ ▼ [ Запустить AI-агента ] ── POST /api/tasks/<tid>/agent/run │ ┌────┴────────────────────────────────────────────────┐ │ task_type == tagged-templates │ task_type == freeform ▼ ▼ Filler (filler/) SGR Agent (agent/) │ │ ├─ ingest → RAG store(<run_id>) ├─ auto-ingest → RAG store ├─ i18n: en→ru+uz (1 LLM, cached) ├─ consistency probe (3 планировщика) ├─ per-field: multilingual RAG + LLM-rerank ├─ N chains (CISC voting) │ ├─ CoT step 1: hypothesize (до 3 кандидатов) │ loop: NextStep JSON → dispatch │ └─ CoT step 2: verify → pick / null (English) │ каждые N шагов — episodic summary ├─ TEXT narrative gen (2–5 paragraphs, English) ├─ critic + multi-persona debate ├─ TABLE cell mapping ([TABLE N.R.C]) └─ final completion ├─ docx-patch (tag replacement) │ ├─ save → summary.json ▼ └─ HITL-форма /tasks/<tid>/report grounding_refs + confidence │ (Форма · Тексты · Документ) │ (правки + ↻ rerun → /fields/rerun) ▼ Сохранить → LLM-перевод RU+UZ → 3 × .docx → Скачать Event log → /agent_runs/<run_id>/events.jsonl (persistent, F5-safe)

Последние задачи

Клиент Статус Файлы Создано
PRODUCTS WATER · W84KgYaj draft 7 2026-04-19 10:47
FINAL_SOLUTION · 6lgDIe5w draft 8 2026-04-17 10:11
WATER_RISK LA · JOyfNGmw draft 6 2026-04-17 05:38
WATER_RISK · nNC4tkVN draft 6 2026-04-15 16:38
PRODUCTS WATER MCHJ (пример) · X0kseHll draft 6 2026-04-14 02:36
Детальная тех-документация: README проекта, а также README по каждому модулю (rag/, tools/, agent/).