2025-11-01 01:02:03 +03:00
|
|
|
|
# 🔍 КАК РАБОТАЕТ WORKFLOW OCR
|
|
|
|
|
|
|
|
|
|
|
|
## ⚠️ **ВАЖНО: Нет ручного запуска!**
|
|
|
|
|
|
|
|
|
|
|
|
**Workflow OCR** работает **ТОЛЬКО через правила автоматизации**!
|
|
|
|
|
|
|
|
|
|
|
|
В нём **НЕТ** кнопки "Submit to OCR" в меню файла.
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 🔄 **КАК ЭТО РАБОТАЕТ:**
|
|
|
|
|
|
|
|
|
|
|
|
### **Принцип работы:**
|
|
|
|
|
|
```
|
|
|
|
|
|
1. Создаёшь правило workflow
|
|
|
|
|
|
2. Загружаешь файл в Nextcloud
|
|
|
|
|
|
3. Workflow Engine видит событие
|
|
|
|
|
|
4. Запускает OCR автоматически
|
|
|
|
|
|
5. Результат сохраняется
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Это АВТОМАТИЗАЦИЯ, а не ручной инструмент!**
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 📝 **КАК СОЗДАТЬ ПРАВИЛО:**
|
|
|
|
|
|
|
|
|
|
|
|
### **Вариант 1: Через интерфейс Nextcloud**
|
|
|
|
|
|
|
|
|
|
|
|
**Шаг 1: Открой настройки Flow**
|
|
|
|
|
|
```
|
|
|
|
|
|
https://office.clientright.ru:8443/settings/admin/workflow
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Шаг 2: Добавь правило**
|
|
|
|
|
|
1. Нажми **"Add new workflow"**
|
|
|
|
|
|
2. Выбери условия:
|
|
|
|
|
|
- **When:** File created
|
|
|
|
|
|
- **And:** File MIME type is `application/pdf`
|
|
|
|
|
|
- **And:** Path matches `Documents/Project/*`
|
|
|
|
|
|
3. Выбери действие:
|
|
|
|
|
|
- **Then:** `OCR processing`
|
|
|
|
|
|
4. Нажми **Save**
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
### **Вариант 2: Через команду (автоматически)**
|
|
|
|
|
|
|
|
|
|
|
|
Я могу создать правило автоматически через БД!
|
|
|
|
|
|
|
|
|
|
|
|
Команда создаст правило:
|
|
|
|
|
|
```
|
|
|
|
|
|
Имя: "CRM - Автоматический OCR судебных документов"
|
|
|
|
|
|
|
|
|
|
|
|
Условия:
|
|
|
|
|
|
- Файл создан
|
|
|
|
|
|
- Тип: PDF
|
|
|
|
|
|
- Имя содержит: решение, определение, постановление, договор, иск
|
|
|
|
|
|
|
|
|
|
|
|
Действие:
|
|
|
|
|
|
- OCR с русским + английским
|
|
|
|
|
|
- Создать searchable PDF
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 🧪 **КАК ПРОТЕСТИРОВАТЬ:**
|
|
|
|
|
|
|
|
|
|
|
|
### **После создания правила:**
|
|
|
|
|
|
|
|
|
|
|
|
1. **Загрузи тестовый PDF** в папку проекта
|
|
|
|
|
|
2. **Дождись 30-60 секунд** (OCR работает в фоне)
|
|
|
|
|
|
3. **Проверь через поиск:**
|
|
|
|
|
|
```
|
|
|
|
|
|
Files → Search (🔍)
|
|
|
|
|
|
Введи слово из документа
|
|
|
|
|
|
```
|
|
|
|
|
|
4. Если находит → **OCR работает!** ✅
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 📊 **КАК ПРОВЕРИТЬ ЧТО OCR ВЫПОЛНЕН:**
|
|
|
|
|
|
|
|
|
|
|
|
### **Способ 1: Через теги**
|
|
|
|
|
|
После OCR файл получит тег в Nextcloud (если настроено)
|
|
|
|
|
|
|
|
|
|
|
|
### **Способ 2: Через логи**
|
|
|
|
|
|
```bash
|
|
|
|
|
|
docker exec nextcloud-fresh tail -100 /var/www/html/data/nextcloud.log | grep -i ocr
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
### **Способ 3: Через поиск**
|
|
|
|
|
|
Если файл находится по тексту из него → OCR выполнен!
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## ⚡ **АЛЬТЕРНАТИВА: Ручной OCR**
|
|
|
|
|
|
|
|
|
|
|
|
### **Если нужен РУЧНОЙ OCR (не автоматический):**
|
|
|
|
|
|
|
|
|
|
|
|
Есть другое приложение: **OCR** (не workflow_ocr!)
|
|
|
|
|
|
|
|
|
|
|
|
**Установка:**
|
|
|
|
|
|
```bash
|
|
|
|
|
|
docker exec -u www-data nextcloud-fresh php occ app:install ocr
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**В нём есть:**
|
|
|
|
|
|
- Кнопка "OCR" в меню файла
|
|
|
|
|
|
- Ручной запуск для выбранных файлов
|
|
|
|
|
|
- Выбор языка
|
|
|
|
|
|
|
|
|
|
|
|
**НО:** Это старое приложение, может не работать на Nextcloud 31
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 🎯 **ЧТО ДЕЛАТЬ СЕЙЧАС:**
|
|
|
|
|
|
|
|
|
|
|
|
### **Вариант А: Я создам правило автоматически**
|
|
|
|
|
|
|
|
|
|
|
|
Создам через команду, займёт 10 секунд:
|
|
|
|
|
|
```sql
|
|
|
|
|
|
INSERT INTO oc_flow_operations ...
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Результат:** Все новые PDF в проектах автоматически пройдут OCR
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
### **Вариант Б: Ты создашь сам через интерфейс**
|
|
|
|
|
|
|
|
|
|
|
|
Я покажу пошагово со скриншотами:
|
|
|
|
|
|
```
|
|
|
|
|
|
Settings → Flow → Add rule → ...
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Результат:** Ты понимаешь как создавать правила
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
### **Вариант В: Установить приложение для ручного OCR**
|
|
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
|
docker exec -u www-data nextcloud-fresh php occ app:install ocr
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Результат:** Появится кнопка OCR в меню файла
|
|
|
|
|
|
|
|
|
|
|
|
**⚠️ Внимание:** Может не работать на Nextcloud 31!
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 💡 **МОЯ РЕКОМЕНДАЦИЯ:**
|
|
|
|
|
|
|
|
|
|
|
|
**Используй АВТОМАТИЧЕСКИЙ OCR** (Workflow):
|
|
|
|
|
|
- ✅ Настроил один раз → работает всегда
|
|
|
|
|
|
- ✅ Не нужно помнить запускать OCR
|
|
|
|
|
|
- ✅ Все документы обрабатываются одинаково
|
|
|
|
|
|
- ✅ Современный подход
|
|
|
|
|
|
|
|
|
|
|
|
**Ручной OCR** нужен редко (только для старых файлов)
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 🚀 **ДАВАЙ СОЗДАМ ПРАВИЛО?**
|
|
|
|
|
|
|
|
|
|
|
|
**Что создать:**
|
|
|
|
|
|
|
|
|
|
|
|
**Правило 1: Судебные документы**
|
|
|
|
|
|
```
|
|
|
|
|
|
PDF с словами: решение, определение, постановление, иск
|
|
|
|
|
|
→ OCR (русский + английский)
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Правило 2: Договоры**
|
|
|
|
|
|
```
|
|
|
|
|
|
PDF в папке Contracts
|
|
|
|
|
|
→ OCR (русский + английский)
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
**Правило 3: Все PDF в проектах < 10MB**
|
|
|
|
|
|
```
|
|
|
|
|
|
PDF в Documents/Project/*, размер < 10MB
|
|
|
|
|
|
→ OCR (русский + английский)
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
**Какое правило создать?** Или все три сразу? 😊
|
|
|
|
|
|
|
2025-11-01 12:22:12 +03:00
|
|
|
|
|