Files
breakpilot-compliance/document-crawler/Dockerfile
T
Benjamin Admin 60b86be706 feat(p83): wire BUILD_SHA through all Dockerfiles + compose + CI check
check-rebuild-needed.sh war seit Mai funktionsfähig nur fuer 3 von 10
Containern. Die anderen 7 Dockerfiles hatten kein ARG/ENV BUILD_SHA und
docker-compose.yml hat fuer KEINEN Service den Wert durchgereicht — daher
defaultete BUILD_SHA ueberall auf "unknown" und die Drift-Check war
zahnlos.

- ARG BUILD_SHA + ENV BUILD_SHA in 8 zusaetzlichen Dockerfiles
  (ai-compliance-sdk, developer-portal, document-crawler, dsms-gateway,
  compliance-tts-service, docs-src, docs-site, dsms-node)
- docker-compose.yml: BUILD_SHA: \${BUILD_SHA:-unknown} in jedem build:
  Block (10 Services)
- .gitea/workflows/ci.yaml: neuer Job build-sha-integrity validiert dass
  jedes Dockerfile ARG+ENV hat und jeder compose-build den Arg durchreicht.
  Faellt bei jedem PR/Push gegen master, der einen neuen Service oder
  Dockerfile ohne BUILD_SHA einfuehrt.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-22 18:29:03 +02:00

41 lines
1.1 KiB
Docker

# Document Crawler - Auto-Onboarding Service
FROM python:3.11-slim
LABEL maintainer="BreakPilot <dev@breakpilot.app>"
LABEL description="Document Crawler & Auto-Onboarding Service"
WORKDIR /app
# Install curl for healthcheck and system dependencies for document extraction
RUN apt-get update && apt-get install -y --no-install-recommends \
curl \
&& rm -rf /var/lib/apt/lists/*
# Install Python dependencies
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
# Copy application
COPY . .
# Environment variables
ENV PORT=8098
ENV DATABASE_URL=postgresql://breakpilot:breakpilot123@bp-core-postgres:5432/breakpilot_db
ENV LLM_GATEWAY_URL=http://ai-compliance-sdk:8090
ENV DSMS_GATEWAY_URL=http://dsms-gateway:8082
ENV CRAWL_BASE_PATH=/data/crawl
ENV MAX_FILE_SIZE_MB=50
# Expose port
ARG BUILD_SHA="unknown"
ENV BUILD_SHA=${BUILD_SHA}
EXPOSE 8098
# Health check
HEALTHCHECK --interval=30s --timeout=10s --start-period=15s --retries=3 \
CMD curl -f http://localhost:8098/health || exit 1
# Run application
CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8098"]