Проект аудита отелей: основные скрипты и документация

- Краулеры: smart_crawler.py, regional_crawler.py
- Аудит: audit_orel_to_excel.py, audit_chukotka_to_excel.py
- РКН проверка: check_rkn_registry.py, recheck_unclear_rkn.py
- Отчёты: create_orel_horizontal_report.py
- Обработка: process_all_hotels_embeddings.py
- Документация: README.md, DB_SCHEMA_REFERENCE.md
This commit is contained in:
Фёдор
2025-10-16 10:52:09 +03:00
parent 545e199389
commit 0cf3297290
105 changed files with 28743 additions and 0 deletions

130
N8N_FILES_SUMMARY.md Normal file
View File

@@ -0,0 +1,130 @@
# 📦 ФАЙЛЫ ДЛЯ n8n AI AGENT - ПОЛНАЯ СВОДКА
## 🎯 **ЧТО СОЗДАНО:**
### **1. ПРОМПТЫ (System Message для AI Agent):**
| Файл | Размер | Описание | Рекомендация |
|------|--------|----------|--------------|
| `prompt.txt` | 21 KB | Полный детальный промпт с примерами | Если есть место |
| `prompt_short.txt` | 2.1 KB | Краткий промпт | Если ограничен размер |
| **`prompt_json.txt`** | 3.0 KB | **JSON промпт** | **⭐ РЕКОМЕНДУЕТСЯ!** |
### **2. ВОПРОСЫ (17 критериев без #6 Роскомнадзор):**
| Файл | Формат | Описание |
|------|--------|----------|
| `questions_17.txt` | Текст | 17 вопросов в текстовом формате |
| `questions_17.json` | JSON | 17 вопросов с keywords и patterns |
### **3. КОД ДЛЯ n8n CODE NODE:**
| Файл | Назначение |
|------|------------|
| `n8n_code_generate_questions.js` | Генерирует 17 items для Loop |
| `n8n_code_parse_json.js` | Парсит JSON ответы от AI Agent |
### **4. ПРИМЕРЫ И ДОКУМЕНТАЦИЯ:**
| Файл | Описание |
|------|----------|
| `n8n_example_json.json` | Примеры JSON ответов |
| `N8N_SETUP.md` | Инструкция по настройке |
---
## 🚀 **БЫСТРЫЙ СТАРТ:**
### **ШАГ 1: Настрой AI Agent**
```
1. Создай AI Agent Node в n8n
2. Вставь содержимое prompt_json.txt в System Message
3. Настрой модель: Ollama (llama3.2 или qwen2.5)
4. Temperature: 0.1
5. Max Tokens: 500
```
### **ШАГ 2: Подключи Vector Store**
```
1. Добавь Postgres Vector Store Node
2. Подключи к БД:
- Host: 147.45.189.234
- Database: default_db
- Table: hotel_website_chunks
- Embedding column: embedding
- Text column: text
3. Top K: 5
4. Similarity Threshold: 0.7
```
### **ШАГ 3: Создай Loop**
```
1. Добавь Code Node
2. Вставь код из n8n_code_generate_questions.js
3. Подключи к Loop Over Items
4. Loop будет перебирать 17 вопросов
```
### **ШАГ 4: Обработай ответы**
```
1. После AI Agent добавь Code Node
2. Вставь код из n8n_code_parse_json.js
3. Он распарсит JSON ответы
4. Получишь структурированные данные
```
### **ШАГ 5: Сохрани результаты**
```
1. Добавь PostgreSQL Node
2. Сохрани результаты в hotel_audit_results
3. Или экспортируй в Excel
```
---
## 📊 **СТРУКТУРА JSON ОТВЕТА:**
```json
{
"found": true,
"score": 1.0,
"quote": "ИНН: 8707003759, ОГРН: 1028700516476",
"url": "https://chrkh.ru/kontakty/",
"details": "ИНН (10 цифр): 8707003759",
"checked_pages": 5,
"confidence": "Высокая"
}
```
---
## ⚠️ **ВАЖНО:**
1. **Критерий #6 "Роскомнадзор (реестр)"** - проверяется **ОТДЕЛЬНО**, не через AI Agent
2. Всего критериев: **18**, но AI Agent проверяет только **17**
3. Используй **prompt_json.txt** для получения структурированных ответов
4. Vector Store должен быть подключен к `hotel_website_chunks` с эмбеддингами
---
## 🎯 **ПРЕИМУЩЕСТВА JSON ФОРМАТА:**
✅ Структурированные данные
✅ Легко парсить в n8n
✅ Автоматическая оценка (score 0.0-1.0)
✅ Цитаты и URL в отдельных полях
✅ Нет путаницы с текстовым форматом
✅ Готово для сохранения в БД
---
## 📞 **ПОДДЕРЖКА:**
Если что-то не работает:
1. Проверь что Vector Store подключен
2. Проверь что у отеля есть chunks в `hotel_website_chunks`
3. Проверь логи n8n
4. Убедись что AI Agent использует `prompt_json.txt`
5. Проверь что ответ - валидный JSON
**Удачи! 🚀**