Юрий Дайбов
Юрий Дайбов

// проект

OCR Studio

Self-hosted веб-сервис для OCR документов на базе PaddleOCR PPStructureV3. Полноценная интеграция AI — от GPU-инфраструктуры и Docker-деплоя до production-ready веб-интерфейса с отслеживанием прогресса в реальном времени.

OCR Studio — интерфейс распознавания документов

Зачем делать свой OCR-сервис?

Облачные OCR-сервисы создают вопросы к приватности данных и не всегда хорошо справляются со сложной вёрсткой — таблицы, формулы, документы на нескольких языках. Нужно было self-hosted решение с полным контролем над пайплайном и возможностью тонкой настройки качества распознавания.

Этот проект — практическое упражнение в интеграции AI/ML: деплой нейросетевых моделей на GPU-инфраструктуре, построение Python-бэкенда вокруг них и связка с отзывчивым TypeScript-фронтендом.

Особенности

psychology

AI на GPU

PaddleOCR PPStructureV3 с ускорением на NVIDIA GPU. Распознаёт таблицы, формулы и сложную структуру документов.

cloud_off

Self-hosted

Работает полностью на вашем оборудовании через Docker Compose. Данные не покидают вашу сеть — полная приватность.

description

Экспорт в Markdown и DOCX

Экспорт без потерь в Markdown (каноничный формат), TXT и DOCX. Собственный конвертер без зависимости от Pandoc.

monitoring

Прогресс в реальном времени

Отслеживание прогресса по страницам и стадиям с коллбэками от суб-моделей — реальное состояние пайплайна, не симуляция.

Стек технологий

Python FastAPI PaddleOCR PaddlePaddle GPU TypeScript Vite Tailwind CSS SQLite Docker NVIDIA CUDA

Контакт

Давайте поговорим

Открыт к предложениям по advisory, fractional CTO и стратегическим консультациям.

mail Написать