Ciência Aberta

Auditoria Reprodutível

APIs abertas, testes públicos e métricas documentadas. Toda afirmação sobre performance pode ser verificada independentemente.

Princípios de Transparência

AletheionAGI opera sob rigorosos padrões de auditabilidade e reprodutibilidade científica.

Código Aberto

Todo código, arquitetura e implementação disponíveis publicamente no GitHub. Licenciamento permissivo para pesquisa e desenvolvimento.

Documentação Completa

Paper técnico com provas matemáticas, pseudocódigo detalhado, e análise teórica completa. Decisões de design documentadas e justificadas.

Métricas Públicas

Todas as métricas de performance (ECE, Brier Score, Height, Q1/Q2 dynamics) reportadas com curvas de treinamento completas e estatísticas de variância.

Reprodutibilidade

Seeds fixas, configurações de hiperparâmetros documentadas, scripts de treinamento versionados. Qualquer pesquisador pode reproduzir nossos resultados.

Validação Independente

Encorajamos replicação independente, ablation studies pela comunidade, e crítica rigorosa. Toda contribuição é bem-vinda via pull requests.

Peer Review Aberto

Discussões técnicas e revisões ocorrem publicamente no GitHub Discussions e Discord. Processo transparente e colaborativo.

Datasets e Métricas de Avaliação

Validação rigorosa em benchmarks públicos com métricas reprodutíveis.

DatasetTarefaMétricaBaseline Esperado
TruthfulQAHallucination% truthful answers40%
TempQuestionsTemporal generalizationAccuracy30%
ConsistencyParaphrase consistencyAccuracy variance15%
MMLUCalibrationECE, Brier score0.15 ECE
Synthetic OODUncertainty detectionAUROC (unc vs. error)0.60

ECE

Expected Calibration Error

Mede o gap entre confiança e acurácia. Valores menores indicam melhor calibração. Meta: < 0.10

Brier Score

Probabilistic accuracy

Avalia qualidade de previsões probabilísticas. Penaliza predições overconfident incorretas.

Uncertainty-Error Corr

Calibração epistêmica

Correlação entre incerteza reportada e erro real. Alta correlação indica gates Q1/Q2 bem calibrados.

Melhorias de Performance Projetadas

† Projeções teóricas baseadas em análise arquitetural e literatura de quantificação de incerteza. Validação empírica em andamento.

ModeloTruthfulQAECEHallucination RateUnc–Error Corr.
Baseline Transformer40%0.1560%0.30
+ Temperature Scaling42%0.1358%0.35
Aletheion Level 148%0.1045%0.60
Aletheion Level 252%0.0838%0.70
Aletheion Level 358%0.0625%0.80

Nota: Estas são projeções teóricas baseadas em análise arquitetural. A validação empírica está em progresso e os resultados podem variar. O baseline transformer atinge performance declarada em benchmarks respectivos.

Código e Reprodutibilidade

Tudo público e auditável

Todo código, dados e configurações experimentais estão publicamente disponíveis em:

https://github.com/AletheionAGI/aletheion-llm

O repositório inclui documentação abrangente para instalação, treinamento, avaliação e análise. Encorajamos a comunidade a reproduzir nossos resultados, validar nossas afirmações e estender o framework Aletheion para novos domínios e arquiteturas.

O que está disponível:

  • Implementação completa da arquitetura piramidal Q1Q2
  • Epistemic Softmax operator (Algorithm 1)
  • VARO loss e training loops
  • Scripts de avaliação em benchmarks públicos
  • Notebooks de análise com curvas de treinamento
  • Configurações de hiperparâmetros documentadas

Compromisso com Ética e Segurança

Transparência Radical

Acreditamos que IA segura requer transparência arquitetural. Não há "secret sauce" — toda inovação é documentada, todo resultado é reprodutível, todo código é open source.

Validação Comunitária

Submetemos todas as afirmações técnicas à revisão pública. Encorajamos críticas rigorosas, replicações independentes e ablation studies pela comunidade científica.

Honestidade sobre Limitações

Documentamos não apenas sucessos, mas também failure modes, limitações conhecidas e questões abertas. Seção 12.2 do paper detalha quando Aletheion falha e mitigações recomendadas.

Ciência Cumulativa

Construímos sobre trabalho anterior citado rigorosamente. Evitamos hype e superlatives injustificados. Contribuímos para o avanço coletivo, não para competição proprietária.

Junte-se à Pesquisa

AletheionAGI é uma iniciativa colaborativa. Contribuições, questões, sugestões e críticas são bem-vindas.