Files
hotels/questions_17.json
Фёдор 684fada337 🚀 Full project sync: Hotels RAG & Audit System
 Major Features:
- Complete RAG system for hotel website analysis
- Hybrid audit with BGE-M3 embeddings + Natasha NER
- Universal horizontal Excel reports with dashboards
- Multi-region processing (SPb, Orel, Chukotka, Kamchatka)

📊 Completed Regions:
- Орловская область: 100% (36/36)
- Чукотский АО: 100% (4/4)
- г. Санкт-Петербург: 93% (893/960)
- Камчатский край: 87% (89/102)

🔧 Infrastructure:
- PostgreSQL with pgvector extension
- BGE-M3 embeddings API
- Browserless for web scraping
- N8N workflows for automation
- S3/Nextcloud file storage

📝 Documentation:
- Complete DB schemas
- API documentation
- Setup guides
- Status reports
2025-10-27 22:49:42 +03:00

122 lines
6.0 KiB
JSON
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"questions": [
{
"id": 1,
"name": "Юридическая идентификация и верификация",
"question": "Предоставлена ли Юридическая идентификация и верификация (ИНН, ОГРН, банковские реквизиты)?",
"keywords": ["инн", "огрн", "егрюл", "егрип", "организация", "ооо", "ип"],
"required_patterns": ["\\b\\d{10}\\b", "\\b\\d{12}\\b", "\\b\\d{13}\\b", "\\b\\d{15}\\b"]
},
{
"id": 2,
"name": "Адрес",
"question": "Указан ли Адрес местонахождения (юридический, фактический)?",
"keywords": ["адрес", "address", "местонахождение", "г.", "ул."],
"required_patterns": ["\\d{6}.*?ул\\.", "ул\\.\\s*[А-Яа-яёЁA-Za-z\\s]+,?\\s*\\d+"]
},
{
"id": 3,
"name": "Контакты",
"question": "Указаны ли Контакты (телефон, e-mail)?",
"keywords": ["телефон", "phone", "email", "@", "+7", "8-800"],
"required_patterns": ["(?:\\+7|8)\\s*\\(?\\d{3,5}\\)?\\s*\\d{1,3}[-\\s]?\\d{2}[-\\s]?\\d{2}", "[\\w\\.-]+@[\\w\\.-]+\\.\\w{2,}"]
},
{
"id": 4,
"name": "Режим работы",
"question": "Указан ли Режим работы (часы работы, график приема)?",
"keywords": ["часы работы", "график работы", "режим работы", "круглосуточно", "24/7"],
"required_patterns": ["(?:с|с\\s+)\\d{1,2}(?::|\\.)\\d{2}\\s*(?:до|по)\\s*\\d{1,2}(?::|\\.)\\d{2}", "круглосуточно", "24\\s*[/\\-]\\s*7"]
},
{
"id": 5,
"name": "Политика ПДн (152-ФЗ)",
"question": "Есть ли для ознакомления Политика ПДн (152-ФЗ)?",
"keywords": ["персональных данных", "пдн", "152-фз", "privacy"],
"required_patterns": ["152[-\\s]?фз", "политика\\s+в\\s+отношении\\s+обработки\\s+персональных\\s+данных"]
},
{
"id": 7,
"name": "Договор-оферта / Правила оказания услуг",
"question": "Есть ли Договор-оферта / Правила оказания услуг?",
"keywords": ["договор", "оферта", "правила", "условия", "услуг"],
"required_patterns": ["публичная\\s+оферта", "договор.*?оказани.*?услуг"]
},
{
"id": 8,
"name": "Рекламации и споры",
"question": "Есть ли указание как подать рекламацию/претензию или описание о порядке разрешения споров?",
"keywords": ["рекламация", "спор", "жалоба", "претензия", "конфликт"]
},
{
"id": 9,
"name": "Цены/прайс",
"question": "Представлены ли Цены/прайс на номера и услуги?",
"keywords": ["цена", "прайс", "тариф", "стоимость", "номер"],
"required_patterns": ["\\d+\\s*(?:руб|₽)"]
},
{
"id": 10,
"name": "Способы оплаты",
"question": "Указаны ли доступные Способы оплаты (наличные, карта, СБП)?",
"keywords": ["оплата", "платеж", "карта", "наличные", "способ"]
},
{
"id": 11,
"name": "Онлайн-оплата",
"question": "Есть ли возможность Онлайн-оплаты?",
"keywords": ["онлайн", "интернет", "платеж", "карта", "сайт"]
},
{
"id": 12,
"name": "Онлайн-бронирование",
"question": "Есть ли возможность Онлайн-бронирования?",
"keywords": ["бронирование", "заказ", "номер", "сайт", "онлайн"]
},
{
"id": 13,
"name": "FAQ",
"question": "Есть ли на сайте FAQ (часто задаваемые вопросы)?",
"keywords": ["faq", "вопрос", "ответ", "помощь", "часто"]
},
{
"id": 14,
"name": "Доступность для ЛОВЗ",
"question": "Есть ли информация о Доступности для ЛОВЗ (лиц с ограниченными возможностями здоровья)?",
"keywords": ["доступность", "инвалид", "ловз", "безбарьерная"]
},
{
"id": 15,
"name": "Партнёры/бренды",
"question": "Представлена ли информация о Партнёрах/брендах?",
"keywords": ["партнер", "бренд", "сотрудничество", "франшиза"]
},
{
"id": 16,
"name": "Команда/сотрудники",
"question": "Есть ли сведения о Команде/сотрудниках?",
"keywords": ["команда", "сотрудник", "персонал", "коллектив"]
},
{
"id": 17,
"name": "Уголок потребителя",
"question": "Есть ли на сайте Уголок потребителя?",
"keywords": ["потребитель", "права", "защита", "уголок"]
},
{
"id": 18,
"name": "Актуальность документов",
"question": "Актуальность документов — указана ли дата последнего обновления информации?",
"keywords": ["актуальность", "документ", "дата", "обновление", "свежая"]
}
],
"note": "Критерий #6 (Роскомнадзор - реестр операторов персональных данных) проверяется отдельно"
}