stripstream-librarian

Author	SHA1	Message	Date
Froidefond Julien	ee05df26c4	fix(indexer): corriger OOM lors du full rebuild (batching + limite threads) - Extraction par batches de 200 livres (libère mémoire entre chaque batch) - Limiter tokio spawn_blocking à 8 threads (défaut 512, chaque thread ~8MB stack) - Réduire concurrence extraction de 8 à 2 max - Supprimer raw_bytes.clone() inutile (passage par ownership) - Ajouter log RSS entre chaque batch pour diagnostic mémoire Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-15 13:34:14 +01:00
Froidefond Julien	0d60d46cae	feat(indexer,backoffice): logs par domaine, réduction fd, UI mobile - Ajout de targets de log par domaine (scan, extraction, thumbnail, watcher) contrôlables via RUST_LOG pour activer/désactiver les logs granulaires - Ajout de logs détaillés dans extracting_pages (per-book timing en debug, progression toutes les 25 books en info) - Réduction de la consommation de fd: walkdir max_open(20/10), comptage séquentiel au lieu de par_iter parallèle, suppression de rayon - Détection ENFILE dans le scanner: abort après 10 erreurs IO consécutives - Backoffice: settings dans le burger mobile, masquer "backoffice" et icône settings en mobile Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-15 11:57:49 +01:00
Froidefond Julien	6947af10fe	perf(api,indexer): optimiser pages, thumbnails, watcher et robustesse fd - Pages: mode Original (zero-transcoding), ETag/304, cache index CBZ, préfetch next 2 pages, filtre Triangle par défaut - Thumbnails: DCT scaling JPEG via jpeg-decoder (decode 7x plus rapide), img.thumbnail() pour resize, support format Original, fix JPEG RGBA8 - API fallback thumbnail: OutputFormat::Original + DCT scaling au lieu de WebP full-decode, retour (bytes, content_type) dynamique - Watcher: remplacement notify par poll léger sans inotify/fd, skip poll quand job actif, snapshots en mémoire - Jobs: mutex exclusif corrigé (tous statuts actifs, tous types exclusifs) - Robustesse: suppression fs::canonicalize (problèmes fd Docker), list_folders avec erreurs explicites, has_children default true - Backoffice: FormRow items-start pour alignement inputs avec helper text, labels settings clarifiés Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 23:07:42 +01:00
Froidefond Julien	fe54f55f47	feat(indexer,backoffice): ajouter warnings dans les stats de job, skip fichiers inaccessibles - Indexer: ajout du champ `warnings` dans JobStats pour les erreurs non-fatales (fichiers inaccessibles, permissions) - Indexer: skip les fichiers dont le stat échoue au lieu de faire crasher tout le scan de la library - Backoffice: affichage des warnings dans le détail job (summary, timeline, Index Statistics) et dans la popin jobs Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-13 13:44:48 +01:00
Froidefond Julien	7cca7e40c2	fix(parsers,api,indexer,backoffice): corriger CBZ Unicode extra fields, centraliser extraction, nettoyer Meili, fixer header - Parsers: raw ZIP reader (flate2) contournant la validation CRC32 des Unicode extra fields (0x7075) qui bloquait certains CBZ - Parsers: nouvelle API publique extract_page() pour extraire une page par index depuis CBZ/CBR/PDF avec fallbacks automatiques - API: suppression du code d'extraction dupliqué, délégation à parsers::extract_page() - API: retrait des dépendances directes zip/unrar/pdfium-render/natord - Indexer: nettoyage Meili systématique à chaque sync (au lieu de ~10%) avec pagination pour supporter les grosses collections — corrige les doublons dans la recherche - Indexer: retrait de la dépendance rand (plus utilisée) - Backoffice: popin jobs rendue via createPortal avec positionnement dynamique — corrige le débordement desktop et le header cassé en mobile Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-13 13:26:14 +01:00
Froidefond Julien	5db2a7501b	feat(books): ajouter le champ format en base et l'exposer dans l'API - Migration 0020 : colonne format sur books, backfill depuis book_files - batch.rs / scanner.rs : l'indexer écrit le format dans books - books.rs : format dans BookItem + filtre ?format= dans list_books - perf_pages.sh : benchmarks par format CBZ/CBR/PDF Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-13 08:55:18 +01:00
Froidefond Julien	efc2773199	chore(deps): mettre à jour zip 2.4→8.2, notify 6.1→8.2, lopdf 0.35→0.39 - zip 8.x résout nativement les extra fields NTFS (source du bug EOCD) - notify 8.x améliore le support inotify Linux - lopdf 0.39 contient des correctifs de parsing PDF Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 23:30:14 +01:00
Froidefond Julien	db11c62d2f	fix(analyzer): timeout sur analyze_book pour éviter les blocages indefinis Un fichier corrompu (RAR/ZIP/PDF qui ne répond plus) occupait un slot de concurrence indéfiniment, bloquant le pipeline à ex. 1517/1521. - Ajoute tokio::time::timeout autour de spawn_blocking(analyze_book) - Timeout lu depuis limits.timeout_seconds en DB (défaut 120s) - Le livre est marqué parse_status='error' en cas de timeout Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 22:44:48 +01:00
Froidefond Julien	358896c7d5	perf(indexer): éliminer le pre-count WalkDir en mode incrémental + concurrence adaptative - Incremental rebuild: remplace le WalkDir de comptage par un COUNT(*) SQL → incrémental 67s → 25s (-62%) sur disque externe - Full rebuild: conserve le WalkDir (DB vidée avant le comptage) - Concurrence par défaut: num_cpus/2 clampé [2,8] au lieu de 2 fixe - Ajoute num_cpus comme dépendance workspace - Backoffice jobs: un seul formulaire avec formAction par bouton (icônes rétablies) - infra/perf.sh: corrige l'endpoint /index/jobs/:id (pas /details), exporte BASE_API/TOKEN Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 22:15:41 +01:00
Froidefond Julien	1d10044d46	fix: plusieurs correctifs jobs et analyzer - cancel_job: ajouter 'extracting_pages' aux statuts annulables - cleanup_stale_jobs: couvrir 'extracting_pages' et 'generating_thumbnails' au redémarrage - analyzer: ne pas régénérer le thumbnail si déjà existant (skip sub-phase B) - analyzer: supprimer les dotfiles macOS (._*) encore en DB - SSE backoffice: réduire le spam de logs en cas d'API injoignable Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 21:41:52 +01:00
Froidefond Julien	8d98056375	fix: fallback for fake cbr	2026-03-12 14:17:21 +01:00
Froidefond Julien	3bd2fb7c1f	feat(jobs): introduce extracting_pages status and update job progress handling - Added a new job status 'extracting_pages' to represent the first sub-phase of thumbnail generation. - Updated the database schema to include a timestamp for when thumbnail generation starts. - Enhanced job progress components to handle the new status, including UI updates for displaying progress and status labels. - Refactored job-related logic to accommodate the two-phase process: extracting pages and generating thumbnails. - Adjusted SQL queries and job detail responses to include the new fields and statuses. This change improves the clarity of job processing states and enhances user feedback during the thumbnail generation process.	2026-03-11 17:50:48 +01:00
Froidefond Julien	6abaa96fba	perf(parsers): remplacer tous les subprocesses par des libs in-process CBR: remplace unrar/unar CLI par le crate `unrar` (bindings libunrar vendorisé, zéro dépendance système). Supprime XADRegexException, les forks de processus et les dossiers temporaires. PDF: remplace pdfinfo + pdftoppm par pdfium-render. Le PDF est ouvert une seule fois pour obtenir le nombre de pages ET rasteriser la première page. lopdf reste pour parse_metadata (page count seul). convert_cbr_to_cbz: reécrit sans subprocess ni dossier temporaire — les images sont lues en mémoire via unrar puis packées directement en ZIP. Dockerfile indexer: retire unrar-free, unar, poppler-utils. Télécharge libpdfium.so depuis bblanchon/pdfium-binaries au build. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-11 16:46:43 +01:00
Froidefond Julien	f2d9bedcc7	fix(parsers): corriger la génération de thumbnails CBR/CBZ/PDF - CBR: contourner le bug XADRegexException de unar en appelant unar avec un symlink à nom neutre (archive.cbr) au lieu du chemin réel, qui peut contenir des caractères regex spéciaux comme [ ] ( ) - CBR/CBZ: remplacer le tri lexicographique par natord (tri naturel) pour que page2.jpg soit trié avant page10.jpg - PDF: brancher pdftoppm -scale-to sur config.width.max(config.height) au lieu d'une valeur hardcodée (800px → 400px par défaut) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-11 16:17:20 +01:00
Froidefond Julien	3ab5b223a8	fix(indexer): détecter l'annulation de job pendant la phase 2 (analyzer) L'analyzer ne vérifiait jamais le statut cancelled en DB, ce qui faisait continuer le traitement des thumbnails jusqu'au bout, puis écraser le statut 'cancelled' avec 'success'. Ajout d'un poller background toutes les 2s avec AtomicBool partagé pour stopper proprement le stream concurrent. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-11 15:50:11 +01:00
Froidefond Julien	64347edabc	fix: thumbnails manquants dans les résultats de recherche - meili.rs: corrige la désérialisation de la réponse paginée de Meilisearch (attendait Vec<Value>, l'API retourne {results:[...]}) — la suppression des documents obsolètes ne s'exécutait jamais, laissant d'anciens UUIDs qui généraient des 404 sur les thumbnails - books.rs: fallback sur render_book_page_1 si le fichier thumbnail n'est plus accessible sur le disque (au lieu de 500) - pages.rs: retourne 404 au lieu de 500 quand le fichier CBZ est absent - search.rs + api.ts + BookCard: ajout série hits, statut lecture, pagination OFFSET, filtre reading_status, et placeholder onError Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-11 11:45:03 +01:00
Froidefond Julien	278f422206	feat(backoffice): améliorer les détails de job avec historique des phases - Ajoute migration 0015 : colonne phase2_started_at sur index_jobs - Indexer : renseigne phase2_started_at lors du passage à generating_thumbnails - API : expose phase2_started_at et book_id dans IndexJobDetailResponse - Page détail : timeline avec durée de chaque phase (Discovery / Thumbnails) - Page détail : banners contextuels (success/failed/cancelled) avec résumé en une ligne - Page détail : description textuelle du type de job, durée dans l'overview - Page détail : stats normalisées selon le type (index vs thumbnail-only) - JobRow : affiche le type via JobTypeBadge (cohérence visuelle) - Badge : labels lisibles pour tous les types de jobs Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-10 16:40:01 +01:00
Froidefond Julien	ff59ac1eff	fix(indexer): full_rebuild par library ne supprime plus les thumbnails des autres libraries cleanup_orphaned_thumbnails chargeait uniquement les book IDs de la library en cours de rebuild, considérant les thumbnails des autres libraries comme orphelins et les supprimant. La fonction charge désormais tous les book IDs toutes libraries confondues. Ajout d'un test de régression dans infra/smoke.sh qui vérifie que le full_rebuild d'une library ne réduit pas le nombre de thumbnails des autres. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-10 15:52:00 +01:00
Froidefond Julien	137e8ce11c	fix: slow thumbnail and analyser test	2026-03-09 23:16:21 +01:00
Froidefond Julien	e0b80cae38	feat: conversion CBR → CBZ via job asynchrone Ajoute la possibilité de convertir un livre CBR en CBZ depuis le backoffice. La conversion est sécurisée : le CBR original n'est supprimé qu'après vérification du CBZ généré et mise à jour de la base de données. - parsers: nouvelle fn `convert_cbr_to_cbz` (unar extract → zip pack → vérification → rename atomique) - api: `POST /books/:id/convert` crée un job `cbr_to_cbz` (vérifie format CBR, détecte collision) - indexer: nouveau `converter.rs` dispatché depuis `job.rs` - backoffice: bouton "Convert to CBZ" sur la page détail (visible si CBR), label dans JobRow - migrations: colonne `book_id` sur `index_jobs` + type `cbr_to_cbz` dans le check constraint Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-09 23:02:08 +01:00
Froidefond Julien	cfc896e92f	feat: two-phase indexation with direct thumbnail generation in indexer Phase 1 (discovery): walkdir + filename-only metadata, zero archive I/O. Books are visible immediately in the UI while Phase 2 runs in background. Phase 2 (analysis): open each archive once via analyze_book() to extract page_count and first page bytes, then generate WebP thumbnail directly in the indexer — removing the HTTP roundtrip to the API checkup endpoint. - Add parse_metadata_fast() (infallible, no archive I/O) - Add analyze_book() returning (page_count, first_page_bytes) in one pass - Add looks_like_image() magic bytes check for unrar p stdout validation - Add lsar fallback in list_cbr_images() for UTF-16BE encoded filenames - Add directory_mtimes table to skip unchanged dirs on incremental scans - Add analyzer.rs: generate_thumbnail, analyze_library_books, regenerate_thumbnails - Remove run_checkup() from API; indexer handles thumbnail jobs directly - Remove api_base_url/api_bootstrap_token from IndexerConfig and AppState - Add unar + poppler-utils to indexer Dockerfile - Fix smoke.sh: wait for job completion, check thumbnail_url field Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-09 22:13:05 +01:00
Froidefond Julien	0f5094575a	docs: add AGENTS.md per module and unify ports to 70XX - Add CLAUDE.md at root and AGENTS.md in apps/api, apps/indexer, apps/backoffice, crates/parsers with module-specific guidelines - Unify all service ports to 70XX (no more internal/external split): API 7080, Indexer 7081, Backoffice 7082 - Update docker-compose.yml, Dockerfiles, config.rs defaults, .env.example, backoffice routes, bench.sh, smoke.sh Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-09 13:57:39 +01:00
Froidefond Julien	6d4c400017	refactor: update AppState references to use state module - Change all instances of AppState to reference the new state module across multiple files for consistency. - Clean up imports in auth, books, index_jobs, libraries, pages, search, settings, thumbnails, and tokens modules. - Simplify main.rs by removing unused code and organizing middleware and route handlers under the new handlers module.	2026-03-08 21:19:22 +01:00
Froidefond Julien	539dc77d57	feat: enhance thumbnail management with full rebuild functionality - Extend thumbnail regeneration logic to support full rebuilds, allowing for the deletion of orphaned thumbnails. - Implement database updates to clear thumbnail paths for books during regeneration and full rebuild processes. - Improve logging to provide detailed insights on the number of deleted thumbnails and cleared database entries. - Refactor code for better organization and clarity in handling thumbnail files.	2026-03-08 21:10:34 +01:00
Froidefond Julien	9c7120c3dc	feat: enhance library scanning and metadata parsing - Introduce a structured approach to collect book file information before parsing. - Implement parallel processing for metadata extraction to improve performance. - Refactor file handling to utilize a new FileInfo struct for better organization. - Update database interactions to use collected file information for batch inserts. - Improve logging for scanning and parsing processes to provide better insights.	2026-03-08 21:07:03 +01:00
Froidefond Julien	e64848a216	feat: implement thumbnail generation and management - Remove unused image dependencies from Cargo.lock. - Update API to handle thumbnail generation and checkup processes. - Introduce new routes for rebuilding and regenerating thumbnails. - Enhance job tracking with progress indicators for thumbnail jobs. - Update front-end components to display thumbnail job status and progress. - Add backend logic for managing thumbnail jobs and integrating with the API. - Refactor existing code to accommodate new thumbnail functionalities.	2026-03-08 20:55:12 +01:00
Froidefond Julien	c93a7d5d29	feat: thumbnails : part1	2026-03-08 17:54:47 +01:00
Froidefond Julien	360d6e85de	feat: review cbr and unraring for image on api	2026-03-07 15:47:46 +01:00
Froidefond Julien	f0a967515b	fix: improve series detection and add detailed indexing logs - Fix series detection to handle path variations (symlinks, separators) - Add comprehensive logging for job processing and file scanning - Better error handling for path prefix stripping - Track files scanned, indexed, and errors per library	2026-03-06 22:35:11 +01:00
Froidefond Julien	d5d582db57	perf: optimize indexing speed with batching and incremental sync - Batching BDD: group INSERT/UPDATE operations in batches of 100 using UNNEST - Incremental MeiliSearch: only sync books modified since last sync - Optimized fingerprint: use only size+mtime+filename (100x faster) - Increased DB connections from 5 to 20 - Reduced progress update frequency (every 1s or 10 files) - Add sync_metadata table to track last MeiliSearch sync	2026-03-06 22:09:37 +01:00
Froidefond Julien	d0a29196dd	perf: add sccache to Docker builds for faster compilation - Install sccache in builder stage of both api and indexer Dockerfiles - Configure RUSTC_WRAPPER to use sccache - Use Docker cache mount (--mount=type=cache,target=/sccache) to persist cache - Reduces build time significantly on subsequent builds by caching compiled artifacts - Requires Docker BuildKit (enabled by default in Docker 23.0+) Note: First build will still be slow (installs sccache + populates cache) Subsequent builds will be much faster as dependencies are cached	2026-03-06 21:04:40 +01:00
Froidefond Julien	2b30ae47de	build: Docker compose build successful with all services - Fixed Dockerfiles (removed admin-ui references) - Updated Cargo.toml workspace - Added @tailwindcss/postcss dependency - All services building and running correctly	2026-03-06 15:18:03 +01:00
Froidefond Julien	5d7524f52e	fix(indexer): Progress bar stuck at 95% max - Fixed processed_count reset between libraries by using shared counter - Set progress_percent to 100 when job completes successfully - Progress now correctly tracks across all libraries in a job	2026-03-06 14:39:53 +01:00
Froidefond Julien	762587dcb3	fix(indexer): Book deletion not working due to path mismatch The existing HashMap stored local paths but seen HashMap stored /libraries paths. This caused the deletion logic to never find matching files. Now both use consistent local path format.	2026-03-06 14:28:57 +01:00
Froidefond Julien	b6cd8a895d	fix(indexer): File watcher not watching directories The setup_watcher function was creating a watcher object but never calling .watch() on the library directories. Now it properly watches all directories recursively and detects file changes.	2026-03-06 14:23:17 +01:00
Froidefond Julien	75f7de2e43	feat(watcher): Ajout watcher de fichiers temps réel - Migration 0006: colonne watcher_enabled - Crate notify pour surveillance FS temps réel (FSEvents/inotify) - Watcher redémarré toutes les 30s si config change - Détection instantanée création/modification/suppression - Création job immédiate quand fichier détecté - API: support watcher_enabled dans UpdateMonitoringRequest - Backoffice: toggle Watcher avec indicateur ⚡ - Fonctionne en parallèle du scheduler auto-scan Usage: Activer Watcher + Auto-scan pour réactivité max	2026-03-06 11:49:53 +01:00
Froidefond Julien	6e0a77fae0	feat(monitoring): T23 - Surveillance automatique des libraries - Ajout scheduler dans l'indexer (vérifie toutes les minutes) - Migration 0004: colonnes monitor_enabled, scan_mode, next_scan_at - API: GET /libraries avec champs monitoring - API: PATCH /libraries/:id/monitoring pour configuration - Composant MonitoringForm (client) avec checkbox et select - Badge Auto/Manual avec couleurs différentes - Affichage temps restant avant prochain scan - Proxy route /api/libraries/:id/monitoring Le scheduler crée automatiquement des jobs quand next_scan_at <= NOW()	2026-03-06 11:42:41 +01:00
Froidefond Julien	5f51955f4d	feat(indexing): Lot 4 - Progression temps reel, Full Rebuild, Optimisations - Ajout migrations DB: index_job_errors, library_monitoring, full_rebuild_type - API: endpoints progression temps reel (/jobs/:id/stream), active jobs, details - API: support full_rebuild avec suppression donnees existantes - Indexer: logs detailles avec timing [SCAN][META][PARSER][BDD] - Indexer: optimisation parsing PDF (lopdf -> pdfinfo) 235x plus rapide - Indexer: corrections chemins LIBRARIES_ROOT_PATH pour dev local - Backoffice: composants JobProgress, JobsIndicator (header), JobsList - Backoffice: SSE streaming pour progression temps reel - Backoffice: boutons Index/Index Full sur page libraries - Backoffice: highlight job apres creation avec redirection - Fix: parsing volume type i32, sync meilisearch cleanup Perf: parsing PDF passe de 8.7s a 37ms Perf: indexation 45 fichiers en ~15s vs plusieurs minutes avant	2026-03-06 11:33:32 +01:00
Froidefond Julien	82294a1bee	feat: change volume from string to integer type Parser: - Change volume type from Option<String> to Option<i32> - Parse volume as integer to remove leading zeros - Keep original title with volume info Indexer: - Update SQL queries to insert volume as integer - Add volume column to INSERT and UPDATE statements API: - Change BookItem.volume and BookDetails.volume to Option<i32> - Add natural sorting for books Backoffice: - Update volume type to number - Update book detail page - Add CSS styles	2026-03-05 23:32:01 +01:00
Froidefond Julien	d33a4b02d8	feat: add series support for book organization API: - Add /libraries/{id}/series endpoint to list series with book counts - Add series filter to /books endpoint - Fix SeriesItem to return first_book_id properly (using CTE with ROW_NUMBER) Indexer: - Parse series from parent folder name relative to library root - Store series in database when indexing books Backoffice: - Add Books page with grid view, search, and pagination - Add Series page showing series with cover images - Add Library books page filtered by series - Add book detail page - Add Series column in libraries list with clickable link - Create BookCard component for reusable book display - Add CSS styles for books grid, series grid, and book details - Add proxy API route for book cover images (fixing CORS issues) Parser: - Add series field to ParsedMetadata - Extract series from file path relative to library root Books without a parent folder are categorized as 'unclassified' series.	2026-03-05 22:58:28 +01:00
Froidefond Julien	20f9af6cba	add page streaming, admin ui flows, and runtime hardening	2026-03-05 15:26:47 +01:00
Froidefond Julien	6eaf2ba5dc	add indexing jobs, parsers, and search APIs	2026-03-05 15:05:34 +01:00
Froidefond Julien	88db9805b5	bootstrap rust services, auth, and compose stack	2026-03-05 14:51:02 +01:00

43 Commits