🚀 Full project sync: Hotels RAG & Audit System

 Major Features:
- Complete RAG system for hotel website analysis
- Hybrid audit with BGE-M3 embeddings + Natasha NER
- Universal horizontal Excel reports with dashboards
- Multi-region processing (SPb, Orel, Chukotka, Kamchatka)

📊 Completed Regions:
- Орловская область: 100% (36/36)
- Чукотский АО: 100% (4/4)
- г. Санкт-Петербург: 93% (893/960)
- Камчатский край: 87% (89/102)

🔧 Infrastructure:
- PostgreSQL with pgvector extension
- BGE-M3 embeddings API
- Browserless for web scraping
- N8N workflows for automation
- S3/Nextcloud file storage

📝 Documentation:
- Complete DB schemas
- API documentation
- Setup guides
- Status reports
This commit is contained in:
Фёдор
2025-10-27 22:49:42 +03:00
parent 0cf3297290
commit 684fada337
94 changed files with 14891 additions and 911 deletions

71
REPORT_README.md Normal file
View File

@@ -0,0 +1,71 @@
# 📊 Генератор горизонтальных отчётов для аудита отелей
## Основной скрипт
**`create_horizontal_report.py`** - универсальный генератор отчётов для любого региона
## Как использовать
1. Откройте файл `create_horizontal_report.py`
2. Найдите блок настроек в начале файла:
```python
# ========== НАСТРОЙКИ РЕГИОНА ==========
REGION = 'г. Санкт-Петербург' # Измените на нужный регион
AUDIT_VERSION = 'v1.0_with_rkn' # Версия аудита
# =======================================
```
3. Измените `REGION` на нужный регион (например: `'Орловская область'`, `'Чукотский АО'`)
4. При необходимости измените `AUDIT_VERSION`
5. Запустите: `python3 create_horizontal_report.py`
## Результат
Скрипт создаст файл `experimental_report_YYYYMMDD_HHMMSS.xlsx` с двумя листами:
### Лист 1: "📊 Дашборд"
- Общая статистика по региону
- Статистика по 18 критериям
- Распределение по баллам
- Графики (круговые и столбчатые)
### Лист 2: "🏨 Аудит отелей" (горизонтальный формат)
- Базовые колонки: Отель, Запись в реестре (РКН), Владелец, ОГРН, ИНН и т.д.
- 18 критериев × 3 колонки каждый:
1. Статус (Да/Нет) с цветовой индикацией
2. URL (ссылка на страницу)
3. Комментарий (детали находки)
## Примеры использования
### Для Санкт-Петербурга (по умолчанию):
```python
REGION = 'г. Санкт-Петербург'
AUDIT_VERSION = 'v1.0_with_rkn'
```
### Для Орловской области:
```python
REGION = 'Орловская область'
AUDIT_VERSION = 'v1.0_with_rkn'
```
### Для Чукотского АО:
```python
REGION = 'Чукотский АО'
AUDIT_VERSION = 'v1.0_with_rkn'
```
## Технические детали
- Размер файла: ~1-2 MB в зависимости от количества отелей
- Цветовая индикация: зелёный (найдено), красный (не найдено)
- Автоматическая очистка недопустимых символов для Excel
- Автофильтры и замороженные заголовки
- Поддержка данных РКН реестра
## Другие скрипты
- `check_report_status.py` - проверка статуса отчётов
- `export_website_status_report.py` - экспорт статуса сайтов