🚀 Full project sync: Hotels RAG & Audit System
✨ Major Features: - Complete RAG system for hotel website analysis - Hybrid audit with BGE-M3 embeddings + Natasha NER - Universal horizontal Excel reports with dashboards - Multi-region processing (SPb, Orel, Chukotka, Kamchatka) 📊 Completed Regions: - Орловская область: 100% (36/36) - Чукотский АО: 100% (4/4) - г. Санкт-Петербург: 93% (893/960) - Камчатский край: 87% (89/102) 🔧 Infrastructure: - PostgreSQL with pgvector extension - BGE-M3 embeddings API - Browserless for web scraping - N8N workflows for automation - S3/Nextcloud file storage 📝 Documentation: - Complete DB schemas - API documentation - Setup guides - Status reports
This commit is contained in:
71
REPORT_README.md
Normal file
71
REPORT_README.md
Normal file
@@ -0,0 +1,71 @@
|
||||
# 📊 Генератор горизонтальных отчётов для аудита отелей
|
||||
|
||||
## Основной скрипт
|
||||
|
||||
**`create_horizontal_report.py`** - универсальный генератор отчётов для любого региона
|
||||
|
||||
## Как использовать
|
||||
|
||||
1. Откройте файл `create_horizontal_report.py`
|
||||
2. Найдите блок настроек в начале файла:
|
||||
|
||||
```python
|
||||
# ========== НАСТРОЙКИ РЕГИОНА ==========
|
||||
REGION = 'г. Санкт-Петербург' # Измените на нужный регион
|
||||
AUDIT_VERSION = 'v1.0_with_rkn' # Версия аудита
|
||||
# =======================================
|
||||
```
|
||||
|
||||
3. Измените `REGION` на нужный регион (например: `'Орловская область'`, `'Чукотский АО'`)
|
||||
4. При необходимости измените `AUDIT_VERSION`
|
||||
5. Запустите: `python3 create_horizontal_report.py`
|
||||
|
||||
## Результат
|
||||
|
||||
Скрипт создаст файл `experimental_report_YYYYMMDD_HHMMSS.xlsx` с двумя листами:
|
||||
|
||||
### Лист 1: "📊 Дашборд"
|
||||
- Общая статистика по региону
|
||||
- Статистика по 18 критериям
|
||||
- Распределение по баллам
|
||||
- Графики (круговые и столбчатые)
|
||||
|
||||
### Лист 2: "🏨 Аудит отелей" (горизонтальный формат)
|
||||
- Базовые колонки: Отель, Запись в реестре (РКН), Владелец, ОГРН, ИНН и т.д.
|
||||
- 18 критериев × 3 колонки каждый:
|
||||
1. Статус (Да/Нет) с цветовой индикацией
|
||||
2. URL (ссылка на страницу)
|
||||
3. Комментарий (детали находки)
|
||||
|
||||
## Примеры использования
|
||||
|
||||
### Для Санкт-Петербурга (по умолчанию):
|
||||
```python
|
||||
REGION = 'г. Санкт-Петербург'
|
||||
AUDIT_VERSION = 'v1.0_with_rkn'
|
||||
```
|
||||
|
||||
### Для Орловской области:
|
||||
```python
|
||||
REGION = 'Орловская область'
|
||||
AUDIT_VERSION = 'v1.0_with_rkn'
|
||||
```
|
||||
|
||||
### Для Чукотского АО:
|
||||
```python
|
||||
REGION = 'Чукотский АО'
|
||||
AUDIT_VERSION = 'v1.0_with_rkn'
|
||||
```
|
||||
|
||||
## Технические детали
|
||||
|
||||
- Размер файла: ~1-2 MB в зависимости от количества отелей
|
||||
- Цветовая индикация: зелёный (найдено), красный (не найдено)
|
||||
- Автоматическая очистка недопустимых символов для Excel
|
||||
- Автофильтры и замороженные заголовки
|
||||
- Поддержка данных РКН реестра
|
||||
|
||||
## Другие скрипты
|
||||
|
||||
- `check_report_status.py` - проверка статуса отчётов
|
||||
- `export_website_status_report.py` - экспорт статуса сайтов
|
||||
Reference in New Issue
Block a user