Files
crm.clientright.ru/WORKFLOW_OCR_КАК_РАБОТАЕТ.md

192 lines
5.4 KiB
Markdown
Raw Normal View History

# 🔍 КАК РАБОТАЕТ WORKFLOW OCR
## ⚠️ **ВАЖНО: Нет ручного запуска!**
**Workflow OCR** работает **ТОЛЬКО через правила автоматизации**!
В нём **НЕТ** кнопки "Submit to OCR" в меню файла.
---
## 🔄 **КАК ЭТО РАБОТАЕТ:**
### **Принцип работы:**
```
1. Создаёшь правило workflow
2. Загружаешь файл в Nextcloud
3. Workflow Engine видит событие
4. Запускает OCR автоматически
5. Результат сохраняется
```
**Это АВТОМАТИЗАЦИЯ, а не ручной инструмент!**
---
## 📝 **КАК СОЗДАТЬ ПРАВИЛО:**
### **Вариант 1: Через интерфейс Nextcloud**
**Шаг 1: Открой настройки Flow**
```
https://office.clientright.ru:8443/settings/admin/workflow
```
**Шаг 2: Добавь правило**
1. Нажми **"Add new workflow"**
2. Выбери условия:
- **When:** File created
- **And:** File MIME type is `application/pdf`
- **And:** Path matches `Documents/Project/*`
3. Выбери действие:
- **Then:** `OCR processing`
4. Нажми **Save**
---
### **Вариант 2: Через команду (автоматически)**
Я могу создать правило автоматически через БД!
Команда создаст правило:
```
Имя: "CRM - Автоматический OCR судебных документов"
Условия:
- Файл создан
- Тип: PDF
- Имя содержит: решение, определение, постановление, договор, иск
Действие:
- OCR с русским + английским
- Создать searchable PDF
```
---
## 🧪 **КАК ПРОТЕСТИРОВАТЬ:**
### **После создания правила:**
1. **Загрузи тестовый PDF** в папку проекта
2. **Дождись 30-60 секунд** (OCR работает в фоне)
3. **Проверь через поиск:**
```
Files → Search (🔍)
Введи слово из документа
```
4. Если находит → **OCR работает!**
---
## 📊 **КАК ПРОВЕРИТЬ ЧТО OCR ВЫПОЛНЕН:**
### **Способ 1: Через теги**
После OCR файл получит тег в Nextcloud (если настроено)
### **Способ 2: Через логи**
```bash
docker exec nextcloud-fresh tail -100 /var/www/html/data/nextcloud.log | grep -i ocr
```
### **Способ 3: Через поиск**
Если файл находится по тексту из него → OCR выполнен!
---
## ⚡ **АЛЬТЕРНАТИВА: Ручной OCR**
### **Если нужен РУЧНОЙ OCR (не автоматический):**
Есть другое приложение: **OCR** (не workflow_ocr!)
**Установка:**
```bash
docker exec -u www-data nextcloud-fresh php occ app:install ocr
```
**В нём есть:**
- Кнопка "OCR" в меню файла
- Ручной запуск для выбранных файлов
- Выбор языка
**НО:** Это старое приложение, может не работать на Nextcloud 31
---
## 🎯 **ЧТО ДЕЛАТЬ СЕЙЧАС:**
### **Вариант А: Я создам правило автоматически**
Создам через команду, займёт 10 секунд:
```sql
INSERT INTO oc_flow_operations ...
```
**Результат:** Все новые PDF в проектах автоматически пройдут OCR
---
### **Вариант Б: Ты создашь сам через интерфейс**
Я покажу пошагово со скриншотами:
```
Settings → Flow → Add rule → ...
```
**Результат:** Ты понимаешь как создавать правила
---
### **Вариант В: Установить приложение для ручного OCR**
```bash
docker exec -u www-data nextcloud-fresh php occ app:install ocr
```
**Результат:** Появится кнопка OCR в меню файла
**⚠️ Внимание:** Может не работать на Nextcloud 31!
---
## 💡 **МОЯ РЕКОМЕНДАЦИЯ:**
**Используй АВТОМАТИЧЕСКИЙ OCR** (Workflow):
- ✅ Настроил один раз → работает всегда
-Не нужно помнить запускать OCR
-Все документы обрабатываются одинаково
- ✅ Современный подход
**Ручной OCR** нужен редко (только для старых файлов)
---
## 🚀 **ДАВАЙ СОЗДАМ ПРАВИЛО?**
**Что создать:**
**Правило 1: Судебные документы**
```
PDF с словами: решение, определение, постановление, иск
→ OCR (русский + английский)
```
**Правило 2: Договоры**
```
PDF в папке Contracts
→ OCR (русский + английский)
```
**Правило 3: Все PDF в проектах < 10MB**
```
PDF в Documents/Project/*, размер < 10MB
→ OCR (русский + английский)
```
---
**Какое правило создать?** Или все три сразу? 😊
2025-11-01 12:22:12 +03:00