Stress-test — Résultats définitifs (corpus complet)

Trois critiques formulées par NotebookLM (Deep Dive IA, 10 juin 2026) testées d’abord par Desktop en Python préliminaire (126 mots), puis par Code sur le corpus complet (39 969 mots uniques, 23 206 versets).
Source : 0-Inbox/2026-06-10_note-notebookllm-CLG.md + ticket 38bd6263

⚠️ Retournement majeur — Outil 1

Le test préliminaire Desktop (n=45 mots avec Shin) donnait ratio 3,6×, p=0,023.
Le corpus complet (n=8 437 mots avec Shin) donne ratio 1,02×, p=0,308 — non significatif.

Le résultat préliminaire était un artefact classique de petit échantillon. C’est précisément pour ça qu’on a fait le test complet.

Tableau de synthèse finale

Critique NotebookLM	Outil	Résultat corpus complet	Verdict
« 189+189 non comparée aux alphabets voisins »	`gematria_equipartition_comparative`	T(22)=253 impair → impossible · p≈1/55 · 1/10 finales	✅ Réfutée
« Formule Miryam = biais post-hoc »	`gematria_prime_formula_control`	67 unique sur 95 premiers ≤500 · réseau touché 3,16%	⚠️ Valide — niveau 3, correspondance isolée
« Cascade Shin = tautologie »	`gematria_letter_density_test`	4,82% vs 4,76% attendu · p=0,308 · 1,02×	❌ Critique CONFIRMÉE au niveau lexical

Outil 1 — `gematria_letter_density_test` : critique CONFIRMÉE

Résultats corpus complet (39 969 mots uniques, Tanakh massorétique)

Groupe Shin : 407/8 437 = 4,82 %
Groupe non-Shin : 1 478/31 532 = 4,69 %
Baseline global : 4,72 % ≈ 1/21 = 4,76 % (attendu par hasard)
Enrichissement = 1,02× · Fisher p = 0,308 · NON significatif
Contrôles : Aleph 5,04 %, Guimel 4,83 %, Resh ~4,8 % — tous au niveau du hasard

Pourquoi ce résultat est mathématiquement prévisible

Pour un mot contenant la lettre de valeur V, la probabilité que la valeur totale soit divisible par V est ~1/V. Pour le Shin (V=21), l’attendu théorique est 1/21 ≈ 4,76 %. L’observé est 4,82 %. Les deux sont identiques à la précision de mesure.

La critique « tautologie » de NotebookLM est donc confirmée au niveau lexical : les mots hébraïques contenant Shin ne sont PAS plus souvent des multiples de 21 que les mots contenant n’importe quelle autre lettre. Le phénomène est arithmétique, pas lexical.

Ce que ça change pour la présentation

Ce qu’on ne peut plus écrire :

« Le lexique hébreu surreprésente les mots-avec-Shin autour des multiples de 21. »

Ce qu’on peut écrire :

« Parmi les mots hébraïques que la tradition et l’étude ont retenus pour leur signification théologique, plusieurs portent la valeur du Shin (21) ou de ses multiples — אהיה=21, שלום=63=3×Shin, וְשָׁכַנְתִּי=84=4×Shin. Ces correspondances arithmétiques sont un outil d’analyse structurelle sur ces mots spécifiques, non une propriété statistique du lexique général. »

Reformulation correcte de la cascade Shin :

Les mots sélectionnés par le père pour leur portée théologique
…dont la valeur est un multiple de 21 et qui contiennent Shin
…présentent une structure arithmétique : Shin + reste = (N-1)×Shin
Cette structure est arithmétiquement certaine (pas remarquable en elle-même) mais théologiquement lisible sur ces mots précis

La cascade est un outil herméneutique, non une statistique.

Outil 2 — `gematria_equipartition_comparative` : confirmé rigoureusement ✅

Monte Carlo 50 000 tirages, seed fixé, reproductible.

Alphabet	n lettres	T(n)	T(n) pair ?	Radicales	Serviles	Équipartition
Bardet 27	27	378	✓	189	189	Exacte ✓
Hébreu 22	22	253	✗	136	117	Impossible
Phénicien 22	22	253	✗	136	117	Impossible
Araméen 22	22	253	✗	136	117	Impossible

P(équipartition | permutation aléatoire 1-27) = 0,01803 (exact) ≈ 1/55
Monte Carlo concordant : 0,01846.

Analyse des 5 finales :

C(5,3)=10 façons d’assigner 3 finales aux serviles parmi {23,24,25,26,27}
1 seule produit l’équipartition : serviles={23,24,25}, radicales={26,27}
Somme serviles finales = 72 ; somme radicales finales = 53 ; correction = 72−53 = +19 = déficit exact des 22 lettres
P(bonne classification | assignation aléatoire des types) = 1/10

Argument consolidé :
T(22)=253 est impair → l’équipartition parfaite est mathématiquement impossible sans les finales. Les 5 formes finales, dont la classification grammaticale (ך ם ן serviles · ף ץ radicales) est déterminée linguistiquement et non numériquement, produisent l’unique correction possible de 19 points. Parmi les 10 classifications grammaticales possibles des finales, une seule fonctionne.

Outil 3 — `gematria_prime_formula_control` : correspondance isolée ⚠️

95 premiers Bardet testés (1–500)
67 = seul premier tel que p − rang_Bardet(p) = 47
Formule touchant le réseau {21,26,47,71,97,131,199,227,229,293} : 3,16 % des premiers

Corpus complet :

9 138 mots uniques à valeur première
9,65 % touchent une valeur du réseau
Note : ce taux est mécaniquement biaisé (7 des 10 valeurs du réseau sont premières → réseau biaisé vers les premiers). Taux non corrigé, à ne pas surinterpréter.
Catégorisation théologique automatique non disponible en base (pas de champ sémantique)

Verdict : La correspondance Miryam(67)→47 est statistiquement isolée sur l’intervalle testé. Elle reste épistémologiquement de niveau 3 (3 étapes : valeur → rang → soustraction) et doit être étiquetée comme telle dans le livre.

Conséquences pour le catéchisme

Tableau des arguments par niveau de solidité

Argument	Solidité	Traitement recommandé
Équipartition 189+189	★★★★★ Solide	Présenter avec le tableau comparatif + p=1/55 + 1/10 finales
Correspondance Miryam 67→47	★★★ Isolée	Niveau 3 explicite, note méthodologique
Cascade Shin (structure arithmétique)	★★★ Herméneutique	Outil d’analyse sur mots sélectionnés, non statistique lexicale
Cascade Shin (enrichissement lexical)	✗ Non confirmé	Ne pas avancer — le corpus complet ne le soutient pas

Leçon méthodologique à intégrer au livre

Le test sur 126 mots donnait p=0,023 (significatif). Le même test sur 39 969 mots donne p=0,308 (bruit). C’est un exemple réel de biais du petit échantillon (winner’s curse) appliqué à la numérologie. La discipline pré-enregistrement + test sur corpus complet a fonctionné exactement comme prévu : elle a protégé le projet d’un faux positif qui aurait été défendu en publication.

Cette leçon peut elle-même figurer dans l’introduction méthodologique du catéchisme : le projet a les outils pour se corriger lui-même.

Infrastructure créée (ticket 38bd6263)

Commit 0f5bcf4 — branche feature/stress-tests-38bd6263 → à merger sur master.

Outil MCP	Endpoint API	État
`gematria_letter_density_test`	`/api/v1/stress-tests/letter-density`	✅ déployé
`gematria_equipartition_comparative`	`/api/v1/stress-tests/equipartition`	✅ déployé
`gematria_prime_formula_control`	`/api/v1/stress-tests/prime-formula`	✅ déployé

15 tests unitaires purs ✓ — Fisher exact vérifié à la main.

Liens

Résultats définitifs — 10 juin 2026
Tests préliminaires Desktop → résultats complets Code (ticket 38bd6263)

Nombres Bibliques — Notes

Explorateur

Stress-test — Résultats définitifs (corpus complet 39 969 mots)

Stress-test — Résultats définitifs (corpus complet)

⚠️ Retournement majeur — Outil 1

Tableau de synthèse finale

Outil 1 — `gematria_letter_density_test` : critique CONFIRMÉE

Résultats corpus complet (39 969 mots uniques, Tanakh massorétique)

Pourquoi ce résultat est mathématiquement prévisible

Ce que ça change pour la présentation

Outil 2 — `gematria_equipartition_comparative` : confirmé rigoureusement ✅

Outil 3 — `gematria_prime_formula_control` : correspondance isolée ⚠️

Conséquences pour le catéchisme

Tableau des arguments par niveau de solidité

Leçon méthodologique à intégrer au livre

Infrastructure créée (ticket 38bd6263)

Liens

Vue Graphique

Table des Matières

Liens retour

Nombres Bibliques — Notes

Explorateur

Stress-test — Résultats définitifs (corpus complet 39 969 mots)

Stress-test — Résultats définitifs (corpus complet)

⚠️ Retournement majeur — Outil 1

Tableau de synthèse finale

Outil 1 — gematria_letter_density_test : critique CONFIRMÉE

Résultats corpus complet (39 969 mots uniques, Tanakh massorétique)

Pourquoi ce résultat est mathématiquement prévisible

Ce que ça change pour la présentation

Outil 2 — gematria_equipartition_comparative : confirmé rigoureusement ✅

Outil 3 — gematria_prime_formula_control : correspondance isolée ⚠️

Conséquences pour le catéchisme

Tableau des arguments par niveau de solidité

Leçon méthodologique à intégrer au livre

Infrastructure créée (ticket 38bd6263)

Liens

Vue Graphique

Table des Matières

Liens retour

Outil 1 — `gematria_letter_density_test` : critique CONFIRMÉE

Outil 2 — `gematria_equipartition_comparative` : confirmé rigoureusement ✅

Outil 3 — `gematria_prime_formula_control` : correspondance isolée ⚠️