Статус разработки · Результаты обучения нейросети
7 месяцев · 2 500 000 руб.
Дедлайн: ~12 июля 2026
7 месяцев · 2 500 000 руб.
Дедлайн: ~12 февраля 2027
из 30 документов 223-ФЗ
LAW_REF, ORG, MONEY, DATE
ТЗ требует ≥ 3
| Класс | Precision | Recall | F1 | N |
|---|---|---|---|---|
| deadline | 0.500 | 0.556 | 0.526 | 18 |
| definition | 0.423 | 1.000 | 0.595 | 11 |
| other | 0.909 | 0.566 | 0.698 | 53 |
| procedure | 0.500 | 1.000 | 0.667 | 1 |
| requirement | 0.500 | 1.000 | 0.667 | 1 |
| right | 0.750 | 1.000 | 0.857 | 3 |
Модель: cointegrated/rubert-tiny2 (29M)
Датасет: 347 train / 87 test
Эпохи: 15 (best @ checkpoint-308)
Время: 9.3 мин (CPU)
Стоимость: 0 руб. (open-source)
Fix: class_weight=balanced
Юрист читает и размечает каждый пункт
AI размечает, юрист проверяет 10-20%
Качество растёт с каждым документом
| Метрика | Требование ТЗ | Факт | Статус | План достижения |
|---|---|---|---|---|
| Boundary F1 (фрагментация) | ≥ 0.75 | не измерен | Golden Dataset | Юрист размечает эталон → замеряем |
| F1 (классификация) | ≥ 0.80 | 0.668 | 83% от цели | + данные, + ruBERT-base, + валидация |
| F1 (противоречия) | ≥ 0.80 | не начато | этап 2 | После подсистемы анализа |
| ROUGE-L (консультации) | ≥ 0.40 | не измерен | RAG работает | Eval-набор + замер |
| BLEU (консультации) | ≥ 0.45 | не измерен | RAG работает | Eval-набор + замер |
| Исследование моделей | ≥ 3 модели | 8 моделей | ПРЕВЫШЕНО | 5 BERT + 3 LLM |
| Аннотированный корпус | ≥ 3000 док. | 30 док. | 1% | Парсинг ЕИС + СудАкт + НПА |
ruBERT в боте и админке для тестирования командой
София проверяет AI-разметку → коррекции → дообучение
30 → 100+ документов (ЕИС, 44-ФЗ, ГК РФ)
Более мощная модель → F1 ближе к 0.80
Boundary F1, ROUGE-L, BLEU — Golden Dataset
Обнаружение несоответствий НПА в положениях
Извещения, ТЗ, обоснование НМЦК
Научно-технический отчёт, методика испытаний