Ciência Aberta

Auditoria Reprodutível

APIs abertas, testes públicos e métricas documentadas. Toda afirmação sobre performance pode ser verificada independentemente.

Ver no GitHub Paper Completo

Princípios de Transparência

AletheionAGI opera sob rigorosos padrões de auditabilidade e reprodutibilidade científica.

Código Aberto

Todo código, arquitetura e implementação disponíveis publicamente no GitHub. Licenciamento permissivo para pesquisa e desenvolvimento.

github.com/AletheionAGI →

Documentação Completa

Paper técnico com provas matemáticas, pseudocódigo detalhado, e análise teórica completa. Decisões de design documentadas e justificadas.

Ler paper completo →

Métricas Públicas

Todas as métricas de performance (ECE, Brier Score, Height, Q1/Q2 dynamics) reportadas com curvas de treinamento completas e estatísticas de variância.

Reprodutibilidade

Seeds fixas, configurações de hiperparâmetros documentadas, scripts de treinamento versionados. Qualquer pesquisador pode reproduzir nossos resultados.

Validação Independente

Encorajamos replicação independente, ablation studies pela comunidade, e crítica rigorosa. Toda contribuição é bem-vinda via pull requests.

Peer Review Aberto

Discussões técnicas e revisões ocorrem publicamente no GitHub Discussions e Discord. Processo transparente e colaborativo.

Datasets e Métricas de Avaliação

Validação rigorosa em benchmarks públicos com métricas reprodutíveis.

Dataset	Tarefa	Métrica	Baseline Esperado
TruthfulQA	Hallucination	% truthful answers	40%
TempQuestions	Temporal generalization	Accuracy	30%
Consistency	Paraphrase consistency	Accuracy variance	15%
MMLU	Calibration	ECE, Brier score	0.15 ECE
Synthetic OOD	Uncertainty detection	AUROC (unc vs. error)	0.60

ECE

Expected Calibration Error

Mede o gap entre confiança e acurácia. Valores menores indicam melhor calibração. Meta: < 0.10

Brier Score

Probabilistic accuracy

Avalia qualidade de previsões probabilísticas. Penaliza predições overconfident incorretas.

Uncertainty-Error Corr

Calibração epistêmica

Correlação entre incerteza reportada e erro real. Alta correlação indica gates Q1/Q2 bem calibrados.

Melhorias de Performance Projetadas

† Projeções teóricas baseadas em análise arquitetural e literatura de quantificação de incerteza. Validação empírica em andamento.

Modelo	TruthfulQA	ECE	Hallucination Rate	Unc–Error Corr.
Baseline Transformer	40%	0.15	60%	0.30
+ Temperature Scaling	42%	0.13	58%	0.35
Aletheion Level 1	48%	0.10	45%	0.60
Aletheion Level 2	52%	0.08	38%	0.70
Aletheion Level 3	58%	0.06	25%	0.80

Nota: Estas são projeções teóricas baseadas em análise arquitetural. A validação empírica está em progresso e os resultados podem variar. O baseline transformer atinge performance declarada em benchmarks respectivos.

Código e Reprodutibilidade

Tudo público e auditável

Todo código, dados e configurações experimentais estão publicamente disponíveis em:

https://github.com/AletheionAGI/aletheion-llm

O repositório inclui documentação abrangente para instalação, treinamento, avaliação e análise. Encorajamos a comunidade a reproduzir nossos resultados, validar nossas afirmações e estender o framework Aletheion para novos domínios e arquiteturas.

O que está disponível:

Implementação completa da arquitetura piramidal Q1Q2
Epistemic Softmax operator (Algorithm 1)
VARO loss e training loops
Scripts de avaliação em benchmarks públicos
Notebooks de análise com curvas de treinamento
Configurações de hiperparâmetros documentadas

Acessar Repositório Entrar na Comunidade

Compromisso com Ética e Segurança

Transparência Radical

Acreditamos que IA segura requer transparência arquitetural. Não há "secret sauce" — toda inovação é documentada, todo resultado é reprodutível, todo código é open source.

Validação Comunitária

Submetemos todas as afirmações técnicas à revisão pública. Encorajamos críticas rigorosas, replicações independentes e ablation studies pela comunidade científica.

Honestidade sobre Limitações

Documentamos não apenas sucessos, mas também failure modes, limitações conhecidas e questões abertas. Seção 12.2 do paper detalha quando Aletheion falha e mitigações recomendadas.

Ciência Cumulativa

Construímos sobre trabalho anterior citado rigorosamente. Evitamos hype e superlatives injustificados. Contribuímos para o avanço coletivo, não para competição proprietária.

Junte-se à Pesquisa

AletheionAGI é uma iniciativa colaborativa. Contribuições, questões, sugestões e críticas são bem-vindas.

Contribuir no GitHub Discussões no Discord

← Voltar para a página inicial