Stress-test — Résultats définitifs (corpus complet)
Trois critiques formulées par NotebookLM (Deep Dive IA, 10 juin 2026) testées d’abord par Desktop en Python préliminaire (126 mots), puis par Code sur le corpus complet (39 969 mots uniques, 23 206 versets).
Source :0-Inbox/2026-06-10_note-notebookllm-CLG.md+ ticket38bd6263
⚠️ Retournement majeur — Outil 1
Le test préliminaire Desktop (n=45 mots avec Shin) donnait ratio 3,6×, p=0,023.
Le corpus complet (n=8 437 mots avec Shin) donne ratio 1,02×, p=0,308 — non significatif.
Le résultat préliminaire était un artefact classique de petit échantillon. C’est précisément pour ça qu’on a fait le test complet.
Tableau de synthèse finale
| Critique NotebookLM | Outil | Résultat corpus complet | Verdict |
|---|---|---|---|
| « 189+189 non comparée aux alphabets voisins » | gematria_equipartition_comparative | T(22)=253 impair → impossible · p≈1/55 · 1/10 finales | ✅ Réfutée |
| « Formule Miryam = biais post-hoc » | gematria_prime_formula_control | 67 unique sur 95 premiers ≤500 · réseau touché 3,16% | ⚠️ Valide — niveau 3, correspondance isolée |
| « Cascade Shin = tautologie » | gematria_letter_density_test | 4,82% vs 4,76% attendu · p=0,308 · 1,02× | ❌ Critique CONFIRMÉE au niveau lexical |
Outil 1 — gematria_letter_density_test : critique CONFIRMÉE
Résultats corpus complet (39 969 mots uniques, Tanakh massorétique)
- Groupe Shin : 407/8 437 = 4,82 %
- Groupe non-Shin : 1 478/31 532 = 4,69 %
- Baseline global : 4,72 % ≈ 1/21 = 4,76 % (attendu par hasard)
- Enrichissement = 1,02× · Fisher p = 0,308 · NON significatif
- Contrôles : Aleph 5,04 %, Guimel 4,83 %, Resh ~4,8 % — tous au niveau du hasard
Pourquoi ce résultat est mathématiquement prévisible
Pour un mot contenant la lettre de valeur V, la probabilité que la valeur totale soit divisible par V est ~1/V. Pour le Shin (V=21), l’attendu théorique est 1/21 ≈ 4,76 %. L’observé est 4,82 %. Les deux sont identiques à la précision de mesure.
La critique « tautologie » de NotebookLM est donc confirmée au niveau lexical : les mots hébraïques contenant Shin ne sont PAS plus souvent des multiples de 21 que les mots contenant n’importe quelle autre lettre. Le phénomène est arithmétique, pas lexical.
Ce que ça change pour la présentation
Ce qu’on ne peut plus écrire :
« Le lexique hébreu surreprésente les mots-avec-Shin autour des multiples de 21. »
Ce qu’on peut écrire :
« Parmi les mots hébraïques que la tradition et l’étude ont retenus pour leur signification théologique, plusieurs portent la valeur du Shin (21) ou de ses multiples — אהיה=21, שלום=63=3×Shin, וְשָׁכַנְתִּי=84=4×Shin. Ces correspondances arithmétiques sont un outil d’analyse structurelle sur ces mots spécifiques, non une propriété statistique du lexique général. »
Reformulation correcte de la cascade Shin :
- Les mots sélectionnés par le père pour leur portée théologique
- …dont la valeur est un multiple de 21 et qui contiennent Shin
- …présentent une structure arithmétique : Shin + reste = (N-1)×Shin
- Cette structure est arithmétiquement certaine (pas remarquable en elle-même) mais théologiquement lisible sur ces mots précis
La cascade est un outil herméneutique, non une statistique.
Outil 2 — gematria_equipartition_comparative : confirmé rigoureusement ✅
Monte Carlo 50 000 tirages, seed fixé, reproductible.
| Alphabet | n lettres | T(n) | T(n) pair ? | Radicales | Serviles | Équipartition |
|---|---|---|---|---|---|---|
| Bardet 27 | 27 | 378 | ✓ | 189 | 189 | Exacte ✓ |
| Hébreu 22 | 22 | 253 | ✗ | 136 | 117 | Impossible |
| Phénicien 22 | 22 | 253 | ✗ | 136 | 117 | Impossible |
| Araméen 22 | 22 | 253 | ✗ | 136 | 117 | Impossible |
P(équipartition | permutation aléatoire 1-27) = 0,01803 (exact) ≈ 1/55
Monte Carlo concordant : 0,01846.
Analyse des 5 finales :
- C(5,3)=10 façons d’assigner 3 finales aux serviles parmi {23,24,25,26,27}
- 1 seule produit l’équipartition : serviles={23,24,25}, radicales={26,27}
- Somme serviles finales = 72 ; somme radicales finales = 53 ; correction = 72−53 = +19 = déficit exact des 22 lettres
- P(bonne classification | assignation aléatoire des types) = 1/10
Argument consolidé :
T(22)=253 est impair → l’équipartition parfaite est mathématiquement impossible sans les finales. Les 5 formes finales, dont la classification grammaticale (ך ם ן serviles · ף ץ radicales) est déterminée linguistiquement et non numériquement, produisent l’unique correction possible de 19 points. Parmi les 10 classifications grammaticales possibles des finales, une seule fonctionne.
Outil 3 — gematria_prime_formula_control : correspondance isolée ⚠️
- 95 premiers Bardet testés (1–500)
- 67 = seul premier tel que p − rang_Bardet(p) = 47
- Formule touchant le réseau {21,26,47,71,97,131,199,227,229,293} : 3,16 % des premiers
Corpus complet :
- 9 138 mots uniques à valeur première
- 9,65 % touchent une valeur du réseau
- Note : ce taux est mécaniquement biaisé (7 des 10 valeurs du réseau sont premières → réseau biaisé vers les premiers). Taux non corrigé, à ne pas surinterpréter.
- Catégorisation théologique automatique non disponible en base (pas de champ sémantique)
Verdict : La correspondance Miryam(67)→47 est statistiquement isolée sur l’intervalle testé. Elle reste épistémologiquement de niveau 3 (3 étapes : valeur → rang → soustraction) et doit être étiquetée comme telle dans le livre.
Conséquences pour le catéchisme
Tableau des arguments par niveau de solidité
| Argument | Solidité | Traitement recommandé |
|---|---|---|
| Équipartition 189+189 | ★★★★★ Solide | Présenter avec le tableau comparatif + p=1/55 + 1/10 finales |
| Correspondance Miryam 67→47 | ★★★ Isolée | Niveau 3 explicite, note méthodologique |
| Cascade Shin (structure arithmétique) | ★★★ Herméneutique | Outil d’analyse sur mots sélectionnés, non statistique lexicale |
| Cascade Shin (enrichissement lexical) | ✗ Non confirmé | Ne pas avancer — le corpus complet ne le soutient pas |
Leçon méthodologique à intégrer au livre
Le test sur 126 mots donnait p=0,023 (significatif). Le même test sur 39 969 mots donne p=0,308 (bruit). C’est un exemple réel de biais du petit échantillon (winner’s curse) appliqué à la numérologie. La discipline pré-enregistrement + test sur corpus complet a fonctionné exactement comme prévu : elle a protégé le projet d’un faux positif qui aurait été défendu en publication.
Cette leçon peut elle-même figurer dans l’introduction méthodologique du catéchisme : le projet a les outils pour se corriger lui-même.
Infrastructure créée (ticket 38bd6263)
Commit 0f5bcf4 — branche feature/stress-tests-38bd6263 → à merger sur master.
| Outil MCP | Endpoint API | État |
|---|---|---|
gematria_letter_density_test | /api/v1/stress-tests/letter-density | ✅ déployé |
gematria_equipartition_comparative | /api/v1/stress-tests/equipartition | ✅ déployé |
gematria_prime_formula_control | /api/v1/stress-tests/prime-formula | ✅ déployé |
15 tests unitaires purs ✓ — Fisher exact vérifié à la main.
Liens
- Ticket :
38bd6263 - Serie-multiplicative-Shin
- Operateur-entourage_2-21-1_racine-sabav
- 47 · 21 · 189
- 2026-06-10_note-notebookllm-CLG
Résultats définitifs — 10 juin 2026
Tests préliminaires Desktop → résultats complets Code (ticket 38bd6263)