MinerU Linux Desktop Client

Um cliente desktop para a API do MinerU, desenvolvido em Python com PySide6.

Visão Geral

Este projeto fornece uma interface desktop amigável para o MinerU, permitindo operações eficientes de processamento e mineração de documentos em plataformas Linux.

Funcionalidades (MVP)

✅ Configuração segura de Token da API (via Linux Keyring)
✅ Upload de arquivos em lote com validação de tipo
✅ Upload paralelo para melhor desempenho (até 5 arquivos simultâneos)
✅ Barra de progresso durante uploads
✅ Polling automático de status de processamento (a cada 10 segundos)
✅ Download automático de resultados para pasta definida pelo usuário
✅ Botão para abrir a pasta de saída no gerenciador de arquivos
✅ Feedback de progresso em tempo real
✅ Tratamento robusto de erros
✅ Interface em Português
✅ Seleção de modelo (Pipeline ou VLM)
✅ Suporte otimizado para português com modelo Pipeline
✅ Extração automática de arquivos ZIP após download

Início Rápido

Para começar a usar o MinerU Desktop, você precisa construir o AppImage localmente:

# 1. Clone o repositório
git clone https://github.com/ozp/MinerU-linux-desktop.git
cd MinerU-linux-desktop

# 2. Instale as bibliotecas Qt do sistema (apenas uma vez)
./install_system_deps.sh

# 3. Construa o AppImage
./build_appimage.sh

# 4. Execute
./MinerU-x86_64.AppImage

O processo de build cria um AppImage portátil (~70 MB) que funciona em qualquer distribuição Linux. O AppImage inclui Python e todas as dependências Python.

Dica: Para instruções detalhadas de build, consulte BUILD.md.

Verificando a Versão

Para verificar a versão do aplicativo:

Abra o aplicativo e vá em Ajuda > Sobre no menu
A versão também é exibida no título da janela

Requisitos

Python 3.8 ou superior
Sistema operacional Linux
Linux Keyring (geralmente já instalado no sistema)
Bibliotecas do sistema para Qt/PySide6 (veja abaixo)

Dependências do Sistema

O aplicativo requer bibliotecas Qt específicas do sistema. Para instalá-las:

Opção 1: Script automático (recomendado)

./install_system_deps.sh

Opção 2: Instalação manual

apt-get install -y libxcb-cursor0 libxcb-icccm4 libxcb-keysyms1 \
    libxcb-shape0 libxcb-xkb1 libxkbcommon-x11-0 libegl1

Para mais detalhes sobre as dependências do sistema, consulte SYSTEM_DEPENDENCIES.md.

Instalação

1. Clone o repositório

git clone https://github.com/ozp/MinerU-linux-desktop.git
cd MinerU-linux-desktop

2. Instale as dependências do sistema

./install_system_deps.sh

3. Crie um ambiente virtual (recomendado)

python3 -m venv venv
source venv/bin/activate

4. Instale as dependências Python

pip install -r requirements.txt

Uso

1. Execute a aplicação

python main.py

2. Configure suas definições

Vá em Arquivo > Configurações (ou pressione Ctrl+,)
Digite seu Token da API do MinerU
- O token é armazenado de forma segura usando o Linux Keyring
- Nunca é salvo em arquivos de texto
Selecione a Pasta de Saída onde os resultados serão salvos
Configure as Opções de Processamento:
- Force OCR: Habilitar OCR para todos os documentos
- Enable Formula Recognition: Detectar e processar fórmulas matemáticas
- Enable Table Recognition: Detectar e processar tabelas
- MinerU Model: Escolha o modelo de processamento
  - Pipeline (Legado - Melhor para Português): Recomendado para documentos em português
  - VLM (Novo - Sem suporte a idioma): Modelo mais recente, mas sem configuração de idioma
- Select OCR Language: Escolha o idioma (Chinês, Inglês, Português)
  - ⚠️ Nota: A configuração de idioma está disponível apenas para o modelo Pipeline
Clique em Save

3. Processe documentos

Clique em "Adicionar Arquivos..."
Selecione os arquivos que deseja processar:
- Documentos: PDF, DOCX, PPTX
- Imagens: JPG, PNG
Clique em "Iniciar Processamento"
Acompanhe o progresso:
- A barra de progresso mostra o upload
- O status de cada arquivo é atualizado automaticamente
- Downloads acontecem automaticamente quando prontos
- Os arquivos são automaticamente extraídos para pastas individuais
Quando concluído, clique em "Abrir Pasta de Saída" para ver os resultados
- Cada documento processado estará em sua própria pasta
- Exemplo: documento.pdf → pasta documento/ com arquivos markdown, imagens, etc.

Arquitetura

Componentes Principais

main.py: Interface gráfica principal (PySide6)
- MainWindow: Janela principal da aplicação
- UploadWorker: Thread worker para uploads não-bloqueantes
settings_dialog.py: Diálogo de configurações
- Gerenciamento seguro de token via keyring
- Configuração de pasta de saída
- Opções de processamento
mineru_client.py: Cliente da API MinerU
- upload_batch(): Upload paralelo com ThreadPoolExecutor
- get_batch_status(): Verificação de status de processamento
- download_result(): Download automático de resultados
- Tratamento robusto de erros de rede

Fluxo de Trabalho

1. Usuário configura token e pasta de saída
   ↓
2. Usuário seleciona arquivos
   ↓
3. Upload em paralelo (até 5 simultâneos)
   ↓
4. Polling automático a cada 10s
   ↓
5. Download automático quando pronto
   ↓
6. Extração automática de ZIP para pastas
   ↓
7. Notificação ao usuário

Segurança

Token da API: Armazenado com segurança no Linux Keyring
config.ini: Contém APENAS configurações não-sensíveis
Nunca versionado: Token nunca é salvo em arquivos de texto

Configuração

As configurações são armazenadas em dois locais:

1. Linux Keyring (Seguro)

API Token

2. config.ini (Não-sensível)

[Settings]
is_ocr = True
enable_formula = False
enable_table = True
language = pt
model_version = pipeline

[Paths]
output_directory = ~/Documentos/MinerU_Output

Tipos de Arquivo Suportados

Documentos: .pdf, .docx, .pptx
Imagens: .jpg, .png

Suporte a Idiomas

Modelo Pipeline (Recomendado para Português)

O modelo Pipeline oferece suporte completo a múltiplos idiomas através do parâmetro language:

✅ Português (pt): Otimizado para documentos em português brasileiro
✅ Inglês (en): Suporte completo
✅ Chinês (ch): Suporte completo
✅ Outros idiomas suportados pelo PaddleOCR

Recomendação: Para documentos em português, utilize sempre o modelo Pipeline com o idioma definido como Português (pt) para obter os melhores resultados.

Modelo VLM (Experimental)

O modelo VLM é mais recente, mas:

⚠️ Não suporta configuração de idioma
⚠️ Pode ter dificuldades com texto em português
⚠️ Recomendado apenas para documentos em inglês

Problema Conhecido: Textos em português podem aparecer com caracteres corrompidos (ex: "içãç b iv ç c d iibiçãaçãçã") ao usar o modelo VLM.

Tratamento de Erros

A aplicação inclui tratamento robusto de erros para:

✅ Falhas de conexão de rede
✅ Timeouts de API
✅ Token inválido ou expirado
✅ Permissões negadas
✅ Falhas de upload de arquivos individuais
✅ Falhas de download
✅ Pasta de saída inválida

Todas as mensagens de erro são exibidas de forma amigável ao usuário.

Desenvolvimento

Estrutura do Projeto

MinerU-linux-desktop/
├── main.py                 # Aplicação principal
├── settings_dialog.py      # Diálogo de configurações
├── mineru_client.py        # Cliente da API
├── version.py              # Informações de versão
├── requirements.txt        # Dependências Python
├── config.ini.example      # Exemplo de configuração
├── build_appimage.sh       # Script de build do AppImage
├── release.sh              # Script de release automatizado
├── install_system_deps.sh  # Instalador de dependências do sistema
├── .gitignore             # Arquivos ignorados pelo git
├── README.md              # Esta documentação
├── RELEASE_PROCESS.md     # Documentação do processo de release
├── CHANGELOG.md           # Histórico de mudanças
├── BUILD.md               # Guia de build
├── WORKFLOW.md            # Workflow de desenvolvimento
└── SYSTEM_DEPENDENCIES.md # Documentação de dependências

Dependências

PySide6: Framework de GUI Qt para Python
requests: Cliente HTTP para chamadas de API
keyring: Armazenamento seguro de credenciais

Versionamento e Releases

O projeto utiliza um sistema de versionamento que garante consistência entre versões e changelog.

Criando uma Nova Versão

# Correção de bugs (1.0.0 → 1.0.1)
./release.sh patch "Descrição das mudanças"

# Nova funcionalidade (1.0.0 → 1.1.0)
./release.sh minor "Descrição das mudanças"

# Breaking changes (1.0.0 → 2.0.0)
./release.sh major "Descrição das mudanças"

O script release.sh automaticamente:

✅ Atualiza a versão em version.py
✅ Atualiza o CHANGELOG.md
✅ Cria commit e tag Git

Para mais detalhes, consulte RELEASE_PROCESS.md.

Versionamento

O projeto segue Semantic Versioning:

MAJOR: Mudanças incompatíveis na API
MINOR: Novas funcionalidades de forma compatível
PATCH: Correções de bugs compatíveis

A versão é definida centralmente em version.py e usada por toda a aplicação.

Solução de Problemas

Token não é salvo

Certifique-se de que o keyring do sistema está funcionando:
```
python3 -c "import keyring; print(keyring.get_keyring())"
```

Pasta de saída não abre

Verifique se a pasta existe e você tem permissões de leitura
Tente criar manualmente: mkdir -p ~/Documentos/MinerU_Output

Erro de conexão

Verifique sua conexão com a internet
Confirme que https://mineru.net está acessível
Verifique se há firewalls ou proxies bloqueando

Documentação

O projeto inclui documentação detalhada na pasta docs/:

📚 Documentação Disponível

API.md: Documentação completa da API interna
- Referência de todas as classes e métodos públicos
- Exemplos de uso detalhados
- Estruturas de dados e códigos de erro
- Guias de uso completo
ARCHITECTURE.md: Arquitetura do projeto
- Visão geral da estrutura
- Padrões de design utilizados
- Fluxo de dados e comunicação entre componentes
PATTERNS.md: Padrões e boas práticas
- Padrões de código recomendados
- Tratamento de erros
- Validação de entrada
- Logging e debugging
TESTING.md: Guia de testes
- Como executar os testes
- Estrutura de testes (unit, integration, UI)
- Cobertura de código
- Mocking e fixtures
CONTRIBUTING.md: Guia de contribuição
- Como contribuir para o projeto
- Padrões de código
- Processo de revisão de código
- Configuração do ambiente de desenvolvimento
I18N.md: Internacionalização
- Suporte a múltiplos idiomas
- Como adicionar novos idiomas
- Localização da interface

💡 Começando com a Documentação

Para desenvolvedores que querem entender o código:

Comece com ARCHITECTURE.md para visão geral
Consulte API.md para detalhes de implementação
Veja PATTERNS.md para boas práticas

Para contribuidores:

Leia CONTRIBUTING.md primeiro
Configure ambiente de desenvolvimento
Consulte TESTING.md antes de fazer mudanças

Contribuição

Contribuições são bem-vindas! Por favor:

Leia o Guia de Contribuição
Fork o repositório
Crie uma branch para sua feature
Siga os Padrões de Código
Adicione testes (veja TESTING.md)
Commit suas mudanças
Push para a branch
Abra um Pull Request

Licença

A determinar.

Suporte

Para problemas ou dúvidas, abra uma issue no repositório do GitHub.

Name		Name	Last commit message	Last commit date
Latest commit History 101 Commits
docs		docs
old_code		old_code
src		src
tests		tests
.coveragerc		.coveragerc
.gitignore		.gitignore
ARCHITECTURE_ANALYSIS.md		ARCHITECTURE_ANALYSIS.md
BUILD.md		BUILD.md
CHANGELOG.md		CHANGELOG.md
EXECUTE_MIGRATION.md		EXECUTE_MIGRATION.md
LICENSE		LICENSE
MIGRATION_UI_FEATURES.md		MIGRATION_UI_FEATURES.md
MinerU-1.0.1-x86_64.AppImage		MinerU-1.0.1-x86_64.AppImage
MinerU.desktop		MinerU.desktop
MinerU.spec		MinerU.spec
README.md		README.md
README_MIGRATION.md		README_MIGRATION.md
README_REFACTORING.md		README_REFACTORING.md
REFACTORING.md		REFACTORING.md
RELEASE_PROCESS.md		RELEASE_PROCESS.md
START_HERE.md		START_HERE.md
SYSTEM_DEPENDENCIES.md		SYSTEM_DEPENDENCIES.md
WORKFLOW.md		WORKFLOW.md
build_appimage.sh		build_appimage.sh
config.ini.example		config.ini.example
install_system_deps.sh		install_system_deps.sh
main.py		main.py
mineru_icon.svg		mineru_icon.svg
pytest.ini		pytest.ini
release.sh		release.sh
requirements-dev.txt		requirements-dev.txt
requirements.txt		requirements.txt
run_tests.sh		run_tests.sh
version.py		version.py

Folders and files

Latest commit

History

Repository files navigation

MinerU Linux Desktop Client

Visão Geral

Funcionalidades (MVP)

Início Rápido

Verificando a Versão

Requisitos

Dependências do Sistema

Instalação

1. Clone o repositório

2. Instale as dependências do sistema

3. Crie um ambiente virtual (recomendado)

4. Instale as dependências Python

Uso

1. Execute a aplicação

2. Configure suas definições

3. Processe documentos

Arquitetura

Componentes Principais

Fluxo de Trabalho

Segurança

Configuração

1. Linux Keyring (Seguro)

2. config.ini (Não-sensível)

Tipos de Arquivo Suportados

Suporte a Idiomas

Modelo Pipeline (Recomendado para Português)

Modelo VLM (Experimental)

Tratamento de Erros

Desenvolvimento

Estrutura do Projeto

Dependências

Versionamento e Releases

Criando uma Nova Versão

Versionamento

Solução de Problemas

Token não é salvo

Pasta de saída não abre

Erro de conexão

Documentação

📚 Documentação Disponível

💡 Começando com a Documentação

Contribuição

Licença

Suporte

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages