stripstream-librarian

Author	SHA1	Message	Date
Froidefond Julien	626e2e035d	feat: send book thumbnails in Telegram notifications Use Telegram sendPhoto API for conversion and metadata-approved events when a book thumbnail is available on disk. Falls back to text message if photo upload fails. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-21 17:43:01 +01:00
Froidefond Julien	81d1586501	feat: add Telegram notification system with granular event toggles Add notifications crate shared between API and indexer to send Telegram messages on scan/thumbnail/conversion completion/failure, metadata linking, batch and refresh events. Configurable via a new Notifications tab in the backoffice settings with per-event toggle switches grouped by category. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-21 17:24:43 +01:00
Froidefond Julien	736b8aedc0	feat: add EPUB format support with spine-aware image extraction Parse EPUB structure (container.xml → OPF → spine → XHTML) to extract images in reading order. Zero new dependencies — reuses zip + regex crates with pre-compiled regexes and per-file index cache for performance. Falls back to CBZ-style image listing when spine contains no images. Includes DB migration, API/indexer/backoffice updates. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-21 07:05:47 +01:00
Froidefond Julien	389d71b42f	refactor: replace Meilisearch with PostgreSQL full-text search Remove Meilisearch dependency entirely. Search is now handled by PostgreSQL ILIKE with pg_trgm indexes, joining series_metadata for series-level authors. No external search engine needed. - Replace search.rs Meilisearch HTTP calls with PostgreSQL queries - Remove meili.rs from indexer, sync_meili call from job pipeline - Remove MEILI_URL/MEILI_MASTER_KEY from config, state, env files - Remove meilisearch service from docker-compose.yml - Add migration 0027: drop sync_metadata, enable pg_trgm, add indexes - Remove search resync button/endpoint (no longer needed) - Update all documentation (CLAUDE.md, README.md, AGENTS.md, PLAN.md) API contract unchanged — same SearchResponse shape returned. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-18 10:59:25 +01:00
Froidefond Julien	b14accbbe0	fix(books): tri des séries par volume + suppression de l'ancienne extract_page - Ajout de `b.volume NULLS LAST` comme première clé de tri dans list_books et dans tous les ROW_NUMBER() OVER (...) des CTEs series, pour corriger l'ordre des volumes dont les titres varient en format (ex: "Round" vs "R") - Suppression de l'ancienne extract_page publique et de ses 4 helpers (extract_cbz_page_n, extract_cbz_page_n_streaming, extract_cbr_page_n, extract_pdf_page_n) remplacés par la nouvelle implémentation avec cache - Suppression de archive_index_cache dans AppState (remplacé par le cache statique CBZ_INDEX_CACHE dans parsers), import StdMutex nettoyé Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-16 12:08:03 +01:00
Froidefond Julien	bf5a20882b	perf(pages): cache de l'index d'archive en mémoire (-73% CBZ, -76% CBR cold) Chaque cold render ré-énumérait toutes les entrées ZIP/RAR pour construire la liste triée des images. Maintenant la liste est mise en cache dans l'AppState (LruCache<String, Arc<Vec<String>>>, std::sync::Mutex pour accès spawn_blocking). Nouvelles fonctions dans parsers : - list_archive_images(path, format) -> Vec<String> - extract_image_by_name(path, format, name) -> Vec<u8> Mesures avant/après (cache disque froid, n=20) : - CBZ cold : 43ms → 11.9ms (-73%) - CBR cold : 46ms → 11.0ms (-76%) - Warm/concurrent : identique Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-16 08:09:32 +01:00
Froidefond Julien	9153b0c750	refactor(pages): déléguer l'extraction de pages au crate parsers - Expose `extract_page(path, format, page_number, render_width)` dans parsers - Rend `is_image_name` publique, ajoute gif/bmp/tif/tiff - Supprime ~250 lignes dupliquées dans pages.rs (CBZ/CBR/PDF extract) - Retire zip/unrar/pdfium-render/natord de api, remplacé par parsers Perf avant/après : stable (±5%, dans le bruit de mesure). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-16 08:09:26 +01:00
Froidefond Julien	61bc307715	perf(parsers): optimiser listing CBZ avec file_names(), ajouter magic bytes check RAR - Remplacer by_index() par file_names() pour lister les pages ZIP (zero I/O) - Ajouter vérification magic bytes avant fallback RAR - Ajouter tracing debug logs dans parsers - Script docker-push avec version bump interactif Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-15 13:01:04 +01:00
Froidefond Julien	6947af10fe	perf(api,indexer): optimiser pages, thumbnails, watcher et robustesse fd - Pages: mode Original (zero-transcoding), ETag/304, cache index CBZ, préfetch next 2 pages, filtre Triangle par défaut - Thumbnails: DCT scaling JPEG via jpeg-decoder (decode 7x plus rapide), img.thumbnail() pour resize, support format Original, fix JPEG RGBA8 - API fallback thumbnail: OutputFormat::Original + DCT scaling au lieu de WebP full-decode, retour (bytes, content_type) dynamique - Watcher: remplacement notify par poll léger sans inotify/fd, skip poll quand job actif, snapshots en mémoire - Jobs: mutex exclusif corrigé (tous statuts actifs, tous types exclusifs) - Robustesse: suppression fs::canonicalize (problèmes fd Docker), list_folders avec erreurs explicites, has_children default true - Backoffice: FormRow items-start pour alignement inputs avec helper text, labels settings clarifiés Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 23:07:42 +01:00
Froidefond Julien	7cca7e40c2	fix(parsers,api,indexer,backoffice): corriger CBZ Unicode extra fields, centraliser extraction, nettoyer Meili, fixer header - Parsers: raw ZIP reader (flate2) contournant la validation CRC32 des Unicode extra fields (0x7075) qui bloquait certains CBZ - Parsers: nouvelle API publique extract_page() pour extraire une page par index depuis CBZ/CBR/PDF avec fallbacks automatiques - API: suppression du code d'extraction dupliqué, délégation à parsers::extract_page() - API: retrait des dépendances directes zip/unrar/pdfium-render/natord - Indexer: nettoyage Meili systématique à chaque sync (au lieu de ~10%) avec pagination pour supporter les grosses collections — corrige les doublons dans la recherche - Indexer: retrait de la dépendance rand (plus utilisée) - Backoffice: popin jobs rendue via createPortal avec positionnement dynamique — corrige le débordement desktop et le header cassé en mobile Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-13 13:26:14 +01:00
Froidefond Julien	85e0945c9d	fix(parsers,api): skipper les entrées ZIP corrompues au lieu d'échouer Une seule entrée illisible dans le central directory ne doit pas bloquer l'analyse de tout le livre. Le count et la première page lisible sont retournés même si certaines entrées sont endommagées. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-13 08:38:38 +01:00
Froidefond Julien	efc2773199	chore(deps): mettre à jour zip 2.4→8.2, notify 6.1→8.2, lopdf 0.35→0.39 - zip 8.x résout nativement les extra fields NTFS (source du bug EOCD) - notify 8.x améliore le support inotify Linux - lopdf 0.39 contient des correctifs de parsing PDF Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 23:30:14 +01:00
Froidefond Julien	1d9a1c76d2	fix(parsers,api): fallback streaming ZIP pour archives avec extra fields NTFS Les ZIP créés par des outils Windows (version 6.3) contiennent des extra fields NTFS (tag 0x000A) qui font échouer ZipArchive::new() avec "Could not find EOCD". Ajout d'un fallback via read_zipfile_from_stream qui lit les local file headers sans dépendre du central directory. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 23:24:36 +01:00
Froidefond Julien	3e3e0154fa	fix(parsers): corriger récursion infinie CBZ↔CBR causant un stack overflow analyze_cbz et analyze_cbr se rappelaient mutuellement sans garde quand un fichier échouait les deux formats → stack overflow à l'analyse. Ajout d'un paramètre allow_fallback=false pour briser la boucle. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 23:15:35 +01:00
Froidefond Julien	7346f1d5b7	fix(parsers): fallback CBR pour les .cbz qui sont en réalité des archives RAR Symétrique au fallback CBZ→RAR déjà existant dans analyze_cbr. Détecte les fichiers .cbz avec magic bytes RAR et les traite via le parser unrar. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-12 22:29:47 +01:00
Froidefond Julien	8d98056375	fix: fallback for fake cbr	2026-03-12 14:17:21 +01:00
Froidefond Julien	6abaa96fba	perf(parsers): remplacer tous les subprocesses par des libs in-process CBR: remplace unrar/unar CLI par le crate `unrar` (bindings libunrar vendorisé, zéro dépendance système). Supprime XADRegexException, les forks de processus et les dossiers temporaires. PDF: remplace pdfinfo + pdftoppm par pdfium-render. Le PDF est ouvert une seule fois pour obtenir le nombre de pages ET rasteriser la première page. lopdf reste pour parse_metadata (page count seul). convert_cbr_to_cbz: reécrit sans subprocess ni dossier temporaire — les images sont lues en mémoire via unrar puis packées directement en ZIP. Dockerfile indexer: retire unrar-free, unar, poppler-utils. Télécharge libpdfium.so depuis bblanchon/pdfium-binaries au build. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-11 16:46:43 +01:00
Froidefond Julien	f2d9bedcc7	fix(parsers): corriger la génération de thumbnails CBR/CBZ/PDF - CBR: contourner le bug XADRegexException de unar en appelant unar avec un symlink à nom neutre (archive.cbr) au lieu du chemin réel, qui peut contenir des caractères regex spéciaux comme [ ] ( ) - CBR/CBZ: remplacer le tri lexicographique par natord (tri naturel) pour que page2.jpg soit trié avant page10.jpg - PDF: brancher pdftoppm -scale-to sur config.width.max(config.height) au lieu d'une valeur hardcodée (800px → 400px par défaut) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-11 16:17:20 +01:00
Froidefond Julien	137e8ce11c	fix: slow thumbnail and analyser test	2026-03-09 23:16:21 +01:00
Froidefond Julien	e0b80cae38	feat: conversion CBR → CBZ via job asynchrone Ajoute la possibilité de convertir un livre CBR en CBZ depuis le backoffice. La conversion est sécurisée : le CBR original n'est supprimé qu'après vérification du CBZ généré et mise à jour de la base de données. - parsers: nouvelle fn `convert_cbr_to_cbz` (unar extract → zip pack → vérification → rename atomique) - api: `POST /books/:id/convert` crée un job `cbr_to_cbz` (vérifie format CBR, détecte collision) - indexer: nouveau `converter.rs` dispatché depuis `job.rs` - backoffice: bouton "Convert to CBZ" sur la page détail (visible si CBR), label dans JobRow - migrations: colonne `book_id` sur `index_jobs` + type `cbr_to_cbz` dans le check constraint Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-09 23:02:08 +01:00
Froidefond Julien	cfc896e92f	feat: two-phase indexation with direct thumbnail generation in indexer Phase 1 (discovery): walkdir + filename-only metadata, zero archive I/O. Books are visible immediately in the UI while Phase 2 runs in background. Phase 2 (analysis): open each archive once via analyze_book() to extract page_count and first page bytes, then generate WebP thumbnail directly in the indexer — removing the HTTP roundtrip to the API checkup endpoint. - Add parse_metadata_fast() (infallible, no archive I/O) - Add analyze_book() returning (page_count, first_page_bytes) in one pass - Add looks_like_image() magic bytes check for unrar p stdout validation - Add lsar fallback in list_cbr_images() for UTF-16BE encoded filenames - Add directory_mtimes table to skip unchanged dirs on incremental scans - Add analyzer.rs: generate_thumbnail, analyze_library_books, regenerate_thumbnails - Remove run_checkup() from API; indexer handles thumbnail jobs directly - Remove api_base_url/api_bootstrap_token from IndexerConfig and AppState - Add unar + poppler-utils to indexer Dockerfile - Fix smoke.sh: wait for job completion, check thumbnail_url field Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-09 22:13:05 +01:00
Froidefond Julien	0f5094575a	docs: add AGENTS.md per module and unify ports to 70XX - Add CLAUDE.md at root and AGENTS.md in apps/api, apps/indexer, apps/backoffice, crates/parsers with module-specific guidelines - Unify all service ports to 70XX (no more internal/external split): API 7080, Indexer 7081, Backoffice 7082 - Update docker-compose.yml, Dockerfiles, config.rs defaults, .env.example, backoffice routes, bench.sh, smoke.sh Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-03-09 13:57:39 +01:00
Froidefond Julien	e64848a216	feat: implement thumbnail generation and management - Remove unused image dependencies from Cargo.lock. - Update API to handle thumbnail generation and checkup processes. - Introduce new routes for rebuilding and regenerating thumbnails. - Enhance job tracking with progress indicators for thumbnail jobs. - Update front-end components to display thumbnail job status and progress. - Add backend logic for managing thumbnail jobs and integrating with the API. - Refactor existing code to accommodate new thumbnail functionalities.	2026-03-08 20:55:12 +01:00
Froidefond Julien	c93a7d5d29	feat: thumbnails : part1	2026-03-08 17:54:47 +01:00
Froidefond Julien	f0a967515b	fix: improve series detection and add detailed indexing logs - Fix series detection to handle path variations (symlinks, separators) - Add comprehensive logging for job processing and file scanning - Better error handling for path prefix stripping - Track files scanned, indexed, and errors per library	2026-03-06 22:35:11 +01:00
Froidefond Julien	5f51955f4d	feat(indexing): Lot 4 - Progression temps reel, Full Rebuild, Optimisations - Ajout migrations DB: index_job_errors, library_monitoring, full_rebuild_type - API: endpoints progression temps reel (/jobs/:id/stream), active jobs, details - API: support full_rebuild avec suppression donnees existantes - Indexer: logs detailles avec timing [SCAN][META][PARSER][BDD] - Indexer: optimisation parsing PDF (lopdf -> pdfinfo) 235x plus rapide - Indexer: corrections chemins LIBRARIES_ROOT_PATH pour dev local - Backoffice: composants JobProgress, JobsIndicator (header), JobsList - Backoffice: SSE streaming pour progression temps reel - Backoffice: boutons Index/Index Full sur page libraries - Backoffice: highlight job apres creation avec redirection - Fix: parsing volume type i32, sync meilisearch cleanup Perf: parsing PDF passe de 8.7s a 37ms Perf: indexation 45 fichiers en ~15s vs plusieurs minutes avant	2026-03-06 11:33:32 +01:00
Froidefond Julien	82294a1bee	feat: change volume from string to integer type Parser: - Change volume type from Option<String> to Option<i32> - Parse volume as integer to remove leading zeros - Keep original title with volume info Indexer: - Update SQL queries to insert volume as integer - Add volume column to INSERT and UPDATE statements API: - Change BookItem.volume and BookDetails.volume to Option<i32> - Add natural sorting for books Backoffice: - Update volume type to number - Update book detail page - Add CSS styles	2026-03-05 23:32:01 +01:00
Froidefond Julien	d33a4b02d8	feat: add series support for book organization API: - Add /libraries/{id}/series endpoint to list series with book counts - Add series filter to /books endpoint - Fix SeriesItem to return first_book_id properly (using CTE with ROW_NUMBER) Indexer: - Parse series from parent folder name relative to library root - Store series in database when indexing books Backoffice: - Add Books page with grid view, search, and pagination - Add Series page showing series with cover images - Add Library books page filtered by series - Add book detail page - Add Series column in libraries list with clickable link - Create BookCard component for reusable book display - Add CSS styles for books grid, series grid, and book details - Add proxy API route for book cover images (fixing CORS issues) Parser: - Add series field to ParsedMetadata - Extract series from file path relative to library root Books without a parent folder are categorized as 'unclassified' series.	2026-03-05 22:58:28 +01:00
Froidefond Julien	20f9af6cba	add page streaming, admin ui flows, and runtime hardening	2026-03-05 15:26:47 +01:00
Froidefond Julien	6eaf2ba5dc	add indexing jobs, parsers, and search APIs	2026-03-05 15:05:34 +01:00
Froidefond Julien	88db9805b5	bootstrap rust services, auth, and compose stack	2026-03-05 14:51:02 +01:00

31 Commits