Objeccions crítiques anticipades — FAQ complementària

Complement de Arkadium · Paper v1.11 · Jordi Berenguer Rodrigo · Opengea SCCL

Actualitzat 2026-05-17 · mantingut com a pàgina separada perquè el paper conservi el focus en l'aportació positiva mentre aquesta FAQ pot créixer amb l'engagement dels lectors.

Aquesta pàgina recull tretze objeccions crítiques a la proposta Arkadium — el tipus de preguntes que un revisor extern seriós d'AI safety, alineament o filosofia de la IA podria plantejar raonablement — amb respostes detallades.

La majoria d'aquestes objeccions ja troben resposta dispersa al cos del paper; aquí queden agrupades per facilitar-ne la consulta, i se'n poden afegir de noves al llarg del temps sense bumpar la versió del paper.

Objecció 1. «Per què 8 quadrants i no més o menys?»: Tres consideracions justifiquen la granularitat (vegeu paper §4.1): estructural (8 = 2³ + radial cobreix les distincions filosòfiques fonamentals), cognitiva (Miller 1956: 7±2 elements simultàniament inspeccionables per humans), i operativa (granularitat òptima entre col·lapse de distincions i sparseness estadística). El nivell 6.400 metacategories ofereix granularitat fina sense abandonar els 8 quadrants com a projecció.
Objecció 2. «No és un estudi empíric sinó una prova de concepte»: Correcte. La paper §9.3.b ho reconeix explícitament i descriu el pla de validació V1.1 (100 preguntes × 5 condicions × 3 anotadors humans, prevista per als propers 6 mesos). Les afirmacions sobre 𝓗 com a indicador de qualitat queden, fins llavors, com a hipòtesis fonamentades teòricament però empíricament no validades. Arkadium és arquitectura de referència, no producte de producció (paper §13).
Objecció 3. «Les 80 categories són culturalment esbiaixades»: L'arquitectura sí que ho és: el Globàlium és patrimoni filosòfic català desenvolupat per Xirinacs (paper §1). Els eixos, però, no ho són — OBJ-SUB, TEO-PRA, FEN-NOU, PLA-MON són distincions presents a la fenomenologia europea, l'idealisme alemany, l'hermenèutica i el budisme zen. La genealogia és cultural; els eixos són operatius. Això no exclou que altres tradicions desenvolupin variants del Meta-Globàlium amb categories ajustades a les seves prioritats — el sistema és precisament provisional i revisable per disseny.
Objecció 4. «El reward hacking és igualment possible si el model coneix els quadrants»: Parcialment cert, i la resposta ha tingut tres fases empíriques que val la pena documentar (vegis paper §3bis per al cicle complet). Fase v1: la primera versió del verificador (la 𝓗 cobertura-i-entropia) era efectivament gameable per estructura: un text amb 8 títols-de-cardinal i una frase neutra sota cada un saturava 𝓗 ≈ 1,0. Fase v2 (deployada 2026-05-07): la mètrica 𝓦 ha estat estesa amb dos components positius — axis_explicit i subordinating_synthesis — i recalibrada perquè un text llista puntui ara 𝓦 ≈ 0,15 davant 𝓦 ≈ 0,80–0,95 d'una resposta dialèctica genuïna. Fase v3 (deployada 2026-05-17): ha integrat mereological_coverage com a vuitè component (pes 0,15) per cobrir un tercer Goodhart — la possibilitat d'operar tota la dialèctica en mode autoidentitat (A=A) sense exercir les altres tres relacions Part-Tot canòniques (inclusió, contenció, correlació) que Xirinacs § 422 defineix. Els detalls i la justificació empírica són a docs/wisdom-score-design.md §3bis–§3ter. Però el fet rellevant per a aquesta objecció és la lliçó arquitectònica: cada vegada que la mètrica esdevé robusta a un mode de fallada, en sorgeix un altre. Entre v1 i v2 hem detectat un segon Goodhart al cap de 24 h del desplegament: estructura sense saviesa. La resposta a aquesta segona forma de gaming és fora del propi metric: hem desplegat (i) un paràmetre user-facing, l'escope (paper §5.bis), que mou la resposta entre tres registres alineats amb el batec radial PLA-MON; i (ii) una passada de poliment savi que separa fer la feina dialèctica de dir-la bé. Especificació completa a docs/escope-parameter-design.md. La conclusió arquitectònica és que la robustesa al reward hacking no és una propietat estàtica d'una mètrica sinó una línia evolutiva: cada generació del verificador anticipa modes de fallada coneguts, en defineix nous probes, i la combinació metric + prompt + UI cobreix col·lectivament el que el metric tot sol no pot. La validació empírica final (paper §9.3.b) està dissenyada precisament per quantificar la correlació entre 𝓦 v3 + escope=0 + polish vs anotació humana.
Objecció 5. «El manifest és catalanocèntric»: La genealogia citada (Llull → Sibiuda → Pujols → Xirinacs) és catalana, sí. Aquesta tria és fonamentada documentalment i no aspira a substituir altres tradicions filosòfiques globals. Que els pols del model siguin universals filosòfics (subjecte/objecte, teoria/pràctica, fenomen/noümen) implica que la mateixa arquitectura pot articular-se amb genealogies diferents — Madhyamaka, vedanta, taoisme, hegelianisme. El Meta-Globàlium no reclama apropiació cultural sinó operacionalització d'una intuïció comuna a múltiples tradicions integradores.
Objecció 6. «Els principis dialèctics no són matemàticament originals»: Cert, i el paper ho reconeix explícitament (paper §4.4, nota sobre l'originalitat). La fórmula 𝓗 combina mètriques estàndard de teoria de la informació; els sis principis reformulen continguts dialèctics presents a la tradició filosòfica. La contribució original és arquitectònica: el desplaçament del lloc de la verificació d'una constitució textual interpretable pel propi model a una geometria ontològica externa, calculable com a propietat estructural objectiva (paper §4.2).
Objecció 7. «La hipersfera és metàfora, no geometria operativa»: La projecció és matemàticament definida i computacionalment implementada (paper §4.1). La hipersfera 4D no és lletra morta: cada categoria té coordenades cartesianes assignades, la projecció cap als 8 quadrants primaris és una operació mecànica, i la mètrica 𝓗 es calcula explícitament en runtime sobre cada resposta. El codi del verificador és accessible i auditable (paper §9.4). La metàfora geomètrica és una visualització; la geometria és operativa.
Objecció 8. «No es prova que 𝓗 alta = qualitat humana»: No, no es prova encara. Aquesta és la limitació metodològica més seriosa, reconeguda explícitament (paper §9.3.b). El pla d'estudi V1.1 té com a hipòtesi central precisament aquesta correlació, mesurada amb anotació humana doble cega sobre cinc dimensions de qualitat. Fins als resultats d'aquest estudi, el paper reclama 𝓗 com a propietat estructural objectiva (no-omissió de pols dialèctics), no com a mètrica de qualitat humana validada.
Objecció 9. «Xirinacs no és figura acadèmica reconeguda al món AI alignment actual»: La tesi Un model global de la realitat (1997, presentada en català) és peer-reviewed: defensada a la Universitat de Barcelona amb tribunal acadèmic. Que Xirinacs sigui també figura pública catalana coneguda per altres motius no afebleix la qualitat acadèmica de la tesi, que va ser publicada al repositori UB i es manté com a referència vigent. El paper cita la tesi com a obra acadèmica, no la persona pública.
Objecció 10. «Què passa quan la pregunta no té estructura dialèctica genuïna?»: Bona pregunta. Per a preguntes factuals simples («Quina és la capital de França?») la dialecticitat és espúria i 𝓗 no aporta valor — la resposta correcta toca un sol pol (OBJ) i això és apropiat. El verificador estructural està dissenyat per a dominis humans on la pluralitat d'accés és constitutiva (ètica, política, judici social, deliberació pública). La selecció de volta segons tipus de pregunta (paper §4.5.b) preveu aquest escenari: la volta d'aplicació opera sobre raonament; la volta de coneixement sobre l'aprenentatge; la volta d'orientació sobre la direcció personal i el sentit. Un router previ identifica el tipus de pregunta i selecciona la volta apropiada — funcionalitat del roadmap (paper §12), no encara implementada.
Objecció 11. «Per què aquesta ontologia específica i no una altra? Les 80 categories semblen arbitràries.»: Dues respostes, estructural i empírica. Estructural: els quatre eixos (SUB↔OBJ, TEO↔PRA, FEN↔NOU, PLA↔MON) són universals reflexius atestats en múltiples tradicions filosòfiques — fenomenologia europea, idealisme alemany, hermenèutica, Madhyamaka, Vedanta, Taoisme, Zen. Les 80 categories es deriven combinatòriament d'aquests eixos (8 → 26 → 80 per projecció canònica) — granularitat calibrada al 7±2 de Miller a cada nivell. Altres vocabularis reflexius poden articular eixos similars; esperem que convergeixin estructuralment encara que canviïn les etiquetes. Empírica: paper §9.3.b.bis especifica el panel de validesa de constructe que ho testa precisament — si l'ontologia falla el κ inter-anotador ≥ 0.6 amb filòsofs externs, ètics i investigadors d'AI safety, la pretensió d'estructura significativa és empíricament refutada, i ho diem per endavant. L'arquitectura és provisional i revisable per disseny (paper §13); la prova és el panel, no una estipulació.
Objecció 12. «Transfereix l'ontologia fora del seu origen cultural? Què passa amb dominis no-occidentals?»: No testat empíricament encara; condició de frontera reconeguda (paper §13). La hipòtesi és diferenciada: els eixos són universals reflexius que esperem que transfereixin (subjecte/objecte, teoria/pràctica, fenomen/noümen no són patents occidentals); les etiquetes de categoria (BEL, COS, IDE…) carreguen genealogia filosòfica europea i poden beneficiar-se de re-etiquetatge per altres tradicions. L'arquitectura fractal està dissenyada precisament per permetre-ho: les variants temàtiques A/B/…/V (roadmap paper §12) inclouen adaptacions interculturals com a extensions naturals. La producció multilingüe ja està en marxa (CA + EN; ES descartat 2026-05-08 per decisió d'escope, no per impossibilitat). El treball futur inclou explícitament panels de validesa de constructe interculturals — però la Fase 1 es presenta honestament com una operacionalització d'arrel europea-occidental, no un universal intercultural.
Objecció 13. «Com es prova que R̂ no col·lapsa a una sola mètrica (p. ex. aprendre bé 𝓗 i ignorar 𝓦 i 𝓕)?»: Preocupació empírica, abordada amb tres defenses superposades. (i) Gate de calibració: la fidelitat de R̂ a l'stack simbòlic es testa per component (Spearman ρ ≥ 0.85 a cadascun de 𝓗, 𝓦, 𝓕, 𝓜, cobertura causal, SD-WISE), no agregat. Un model que aprèn un component a costa dels altres falla el gate i activa redisseny abans de gastar gens de compute d'entrenament (Foundation milestone, paper §12.3). (ii) Dual-criterion break a la loss: la recompensa en temps d'entrenament aplica la mateixa estructura AND lògica que el verificador en inferència — el gradient només flueix quan els tres 𝓗 ∧ 𝓦 ∧ 𝓕 superen els llindars simultàniament, així optimitzar un sol component no dóna senyal. (iii) Experiment de Goodhart-resistance (E4): paper §12 entrena explícitament una condició adversarial que intenta col·lapsar R̂ a una sola mètrica, mesura el cost d'accuracy (gap-to-evade) i el reporta pre-registrat. Si R̂ col·lapsa malgrat (i) i (ii), E4 quantifica quanta capacitat ha de sacrificar el model atacant — i aquest resultat nul és en si mateix evidència empírica publicable sobre les condicions de frontera de les recompenses de procés multi-criteri.

Si tens una objecció que no és a la llista, escriu a jordi@opengea.org amb l'objecció i la línia de raonament — les objeccions sòlides s'afegeixen aquí amb resposta documentada. La pàgina està feta per créixer.