// проект
OCR Studio
Self-hosted веб-сервис для OCR документов на базе PaddleOCR PPStructureV3. Полноценная интеграция AI — от GPU-инфраструктуры и Docker-деплоя до production-ready веб-интерфейса с отслеживанием прогресса в реальном времени.
Зачем делать свой OCR-сервис?
Облачные OCR-сервисы создают вопросы к приватности данных и не всегда хорошо справляются со сложной вёрсткой — таблицы, формулы, документы на нескольких языках. Нужно было self-hosted решение с полным контролем над пайплайном и возможностью тонкой настройки качества распознавания.
Этот проект — практическое упражнение в интеграции AI/ML: деплой нейросетевых моделей на GPU-инфраструктуре, построение Python-бэкенда вокруг них и связка с отзывчивым TypeScript-фронтендом.
Особенности
AI на GPU
PaddleOCR PPStructureV3 с ускорением на NVIDIA GPU. Распознаёт таблицы, формулы и сложную структуру документов.
Self-hosted
Работает полностью на вашем оборудовании через Docker Compose. Данные не покидают вашу сеть — полная приватность.
Экспорт в Markdown и DOCX
Экспорт без потерь в Markdown (каноничный формат), TXT и DOCX. Собственный конвертер без зависимости от Pandoc.
Прогресс в реальном времени
Отслеживание прогресса по страницам и стадиям с коллбэками от суб-моделей — реальное состояние пайплайна, не симуляция.
Стек технологий
Контакт
Давайте поговорим
Открыт к предложениям по advisory, fractional CTO и стратегическим консультациям.
mail Написать