✨ Major Features: - Complete RAG system for hotel website analysis - Hybrid audit with BGE-M3 embeddings + Natasha NER - Universal horizontal Excel reports with dashboards - Multi-region processing (SPb, Orel, Chukotka, Kamchatka) 📊 Completed Regions: - Орловская область: 100% (36/36) - Чукотский АО: 100% (4/4) - г. Санкт-Петербург: 93% (893/960) - Камчатский край: 87% (89/102) 🔧 Infrastructure: - PostgreSQL with pgvector extension - BGE-M3 embeddings API - Browserless for web scraping - N8N workflows for automation - S3/Nextcloud file storage 📝 Documentation: - Complete DB schemas - API documentation - Setup guides - Status reports
3.7 KiB
3.7 KiB
📚 КАК ПОЛЬЗОВАТЬСЯ GIT
📍 РАСПОЛОЖЕНИЕ
- Репозиторий:
/root/engine/public_oversight/hotels/.git - Тип: Локальный (без GitHub/GitLab)
- Коммитов: 2
✅ УЖЕ ЗАКОММИЧЕНО
- ✅ Все Python скрипты (105 файлов)
- ✅ Документация (.md файлы)
- ✅ Конфигурация (docker-compose.yml, Dockerfile)
- ✅ Shell скрипты (.sh)
🚫 ИГНОРИРУЕТСЯ (в .gitignore)
venv/,embedding_env/,parser_env/- виртуальные окружения*.log- логи*.xlsx,*.xls- Excel отчёты__pycache__/,*.pyc- кеши PythonAPI_KEY.txt,*.env- секретные данные
📝 ОСНОВНЫЕ КОМАНДЫ
Посмотреть статус
cd /root/engine/public_oversight/hotels
git status
Добавить изменения
git add smart_crawler.py # Один файл
git add *.py # Все Python файлы
git add . # Всё (осторожно!)
Закоммитить
git commit -m "Описание изменений"
Посмотреть историю
git log # Полная история
git log --oneline # Кратко
git log -5 # Последние 5
Посмотреть изменения
git diff # Незакоммиченные изменения
git diff HEAD~1 # Сравнить с предыдущим коммитом
git show <commit_hash> # Конкретный коммит
Откатить изменения
git checkout -- <файл> # Откатить файл
git reset --hard HEAD # Откатить ВСЁ (осторожно!)
💾 БЭКАП НА S3
Ручной бэкап
./backup_to_s3.sh
Автоматический бэкап (cron)
Добавь в crontab:
0 3 * * * cd /root/engine/public_oversight/hotels && ./backup_to_s3.sh
(каждый день в 3:00)
🎯 ТИПИЧНЫЙ РАБОЧИЙ ПРОЦЕСС
- Поработал над кодом
- Проверяю что изменилось:
git status git diff - Добавляю файлы:
git add audit_orel_to_excel.py - Коммичу:
git commit -m "Исправлен баг с РКН данными в отчёте" - Проверяю историю:
git log --oneline
📊 ТЕКУЩЕЕ СОСТОЯНИЕ
# Посмотреть статистику
git log --stat
# Посмотреть кол-во коммитов
git rev-list --count HEAD
# Посмотреть размер репозитория
du -sh .git
🚀 ЕСЛИ ЗАХОЧЕШЬ ВЫЛОЖИТЬ НА GITHUB
# 1. Создай репозиторий на GitHub
# 2. Добавь remote:
git remote add origin https://github.com/YOUR_USERNAME/hotels.git
# 3. Отправь:
git push -u origin master
❓ ВОПРОСЫ
Q: Где физически хранятся данные git?
A: В папке .git/ внутри /root/engine/public_oversight/hotels/
Q: Можно ли удалить .git и начать заново?
A: Да, просто rm -rf .git и git init снова
Q: Занимает ли git много места?
A: Нет, только изменения. Сейчас ~1-2 MB
Q: Можно ли работать без коммитов?
A: Да, git не обязателен. Но с ним удобнее откатывать изменения