Files
hotels/REPORT_README.md
Фёдор 684fada337 🚀 Full project sync: Hotels RAG & Audit System
 Major Features:
- Complete RAG system for hotel website analysis
- Hybrid audit with BGE-M3 embeddings + Natasha NER
- Universal horizontal Excel reports with dashboards
- Multi-region processing (SPb, Orel, Chukotka, Kamchatka)

📊 Completed Regions:
- Орловская область: 100% (36/36)
- Чукотский АО: 100% (4/4)
- г. Санкт-Петербург: 93% (893/960)
- Камчатский край: 87% (89/102)

🔧 Infrastructure:
- PostgreSQL with pgvector extension
- BGE-M3 embeddings API
- Browserless for web scraping
- N8N workflows for automation
- S3/Nextcloud file storage

📝 Documentation:
- Complete DB schemas
- API documentation
- Setup guides
- Status reports
2025-10-27 22:49:42 +03:00

72 lines
2.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 📊 Генератор горизонтальных отчётов для аудита отелей
## Основной скрипт
**`create_horizontal_report.py`** - универсальный генератор отчётов для любого региона
## Как использовать
1. Откройте файл `create_horizontal_report.py`
2. Найдите блок настроек в начале файла:
```python
# ========== НАСТРОЙКИ РЕГИОНА ==========
REGION = 'г. Санкт-Петербург' # Измените на нужный регион
AUDIT_VERSION = 'v1.0_with_rkn' # Версия аудита
# =======================================
```
3. Измените `REGION` на нужный регион (например: `'Орловская область'`, `'Чукотский АО'`)
4. При необходимости измените `AUDIT_VERSION`
5. Запустите: `python3 create_horizontal_report.py`
## Результат
Скрипт создаст файл `experimental_report_YYYYMMDD_HHMMSS.xlsx` с двумя листами:
### Лист 1: "📊 Дашборд"
- Общая статистика по региону
- Статистика по 18 критериям
- Распределение по баллам
- Графики (круговые и столбчатые)
### Лист 2: "🏨 Аудит отелей" (горизонтальный формат)
- Базовые колонки: Отель, Запись в реестре (РКН), Владелец, ОГРН, ИНН и т.д.
- 18 критериев × 3 колонки каждый:
1. Статус (Да/Нет) с цветовой индикацией
2. URL (ссылка на страницу)
3. Комментарий (детали находки)
## Примеры использования
### Для Санкт-Петербурга (по умолчанию):
```python
REGION = 'г. Санкт-Петербург'
AUDIT_VERSION = 'v1.0_with_rkn'
```
### Для Орловской области:
```python
REGION = 'Орловская область'
AUDIT_VERSION = 'v1.0_with_rkn'
```
### Для Чукотского АО:
```python
REGION = 'Чукотский АО'
AUDIT_VERSION = 'v1.0_with_rkn'
```
## Технические детали
- Размер файла: ~1-2 MB в зависимости от количества отелей
- Цветовая индикация: зелёный (найдено), красный (не найдено)
- Автоматическая очистка недопустимых символов для Excel
- Автофильтры и замороженные заголовки
- Поддержка данных РКН реестра
## Другие скрипты
- `check_report_status.py` - проверка статуса отчётов
- `export_website_status_report.py` - экспорт статуса сайтов