← Tornar a l'inici

Tots els Episodis del Podcast

Episodi 010: Reconstrucció 3D amb COLMAP i mòbils

19:18

Com pot un simple telèfon mòbil capturar espais exteriors gegantins en 3D sense drons ni GPS? En aquest tercer episodi de la sèrie sobre COLMAP — en català — repassem tot el pipeline de reconstrucció 3D des de la perspectiva pràctica: extracció SIFT amb descriptors de 128 dimensions, distorsió radial de lents (K1/K2), estratègies d'emparellament (exhaustiva, seqüencial, arbre de vocabulari), triangulació i paral·laxi, bundle adjustment, el drama CPU vs GPU, GLOMAP amb loop closures, i una reflexió final sobre privacitat i reconstrucció 3D de fotos turístiques.

Episodi 009: Construir mons 3D sense drons

45:35

Podem construir mons tridimensionals a partir de simples fotos fetes amb el mòbil, sense drons ni GPS? En aquest episodi — en anglès — aprofundim en el pipeline complet de COLMAP des de la perspectiva de la captura a peu: extracció SIFT, mascarament de soroll dinàmic, model de càmera amb distorsió radial, estratègies de matching (seqüencial, vocab tree, espacial), verificació geomètrica, reconstrucció incremental, bundle adjustment, el drama CPU vs GPU, i la revolució de GLOMAP amb les seves espectaculars fallades en forma de 'Borg cubes'.

Episodi 008: Com COLMAP reconstrueix el món en 3D

16:03

Com pot un ordinador reconstruir un espai tridimensional a partir de simples fotografies planes? Analitzem a fons COLMAP, el programari de codi obert creat per Johannes Schönberger que s'ha convertit en l'estàndard de la indústria per a la reconstrucció 3D a partir d'imatges. Des de l'algorisme SIFT fins al bundle adjustment, passant pel drama CPU vs GPU i l'alternativa moderna GLOMAP.

Episodi 007: Com domar el geni trampós

37:21

La intel·ligència artificial d'avui és com un geni dels contes antics: immensament poderós, però trampós, descuidat i perillosament literal. Basant-nos en 'El geni trampós', una adaptació accessible dels patrons Augmented Coding de Lada Kessler, explorem per quin motiu la IA pateix amnèsia digital, per què una conversa es 'podreix', com evitar el biaix de complacència i les al·lucinacions, i com aplicar l'enginyeria de la conversa pas a pas per obtenir resultats d'excel·lència.

Episodi 006: El raonament autònom de Claude Mythos

13:58

Una filtració massiva des de l'interior d'Anthropic ha exposat Claude Mythos, un model de llenguatge especulatiu de 10 bilions de paràmetres que combina Mixture of Experts ultradispers amb recurrència latent. Un sistema que rumia en silenci en el seu espai vectorial intern, aconsegueix un 97.6% al benchmark USAMO de matemàtiques i és capaç de trobar zero-days de 27 anys amagats en codi revisat 5 milions de vegades.

Episodi 005: Ouro, la IA que pensa en bucle

13:02

Quin seria el proper gran salt en IA si en lloc de construir models cada vegada més grans i cars, ensenyéssim a un de petit a pensar en bucle? Explorem Ouro, un model de llenguatge en bucle (LoopLM) de només 2.6 bilions de paràmetres que supera models de 12 bilions en raonament matemàtic, fent el processament en l'espai latent i sense generar text fins a tenir la resposta definitiva.

Episodi 004: Domar la IA per programar amb precisió

32:43

Com domesticar la IA per programar amb precisió? Basant-nos en la presentació 'Augmented Coding' d'Ada Kessler, explorem la podridura del context, per què els superagents generalistes fallen, la importància de la fricció intencionada, el DOOM semàntic i com els desenvolupadors passem de ser creadors de codi a directors d'orquestra d'agents especialitzats.

Episodi 002: L'Origen del Caos Ortogràfic Anglès

15:02

Per què l'anglès té una ortografia tan caòtica? Explicació de la Gran Rotació Vocàlica (Great Vowel Shift): un terratrèmol lingüístic dels segles XIV-XVIII que va transformar totes les vocals de l'anglès. Dos mecanismes rivals (cadena d'arrossegament vs. cadena d'empenta), el context social de la Pesta Negra i les migracions a Londres, i com la impremta de Caxton va congelar la pronunciació del 1476, creant fòssils ortogràfics com 'knight'.

Episodi 001: Com funciona l'API d'Ollama per dins

20:04

Anàlisi a fons de l'API d'Ollama: com gestiona recursos GPU/CPU, els endpoints Generate i Chat, paràmetres de control (temperatura, top_k, top_p), streaming NDJSON, Tool Calling, sortides estructurades i l'emulació d'OpenAI. Tot executant-se localment al teu ordinador.