Extracción de Información Estructurada de Imágenes con LangChain y LLMs Multimodales
The Machine Learning Engineer via YouTube
The Fastest Way to Become a Backend Developer Online
AI, Data Science & Cloud Certificates from Google, IBM & Meta
Overview
AI, Data Science & Cloud Certificates from Google, IBM & Meta — 40% Off
One plan covers every Professional Certificate on Coursera. 40% off Coursera Plus Annual.
Unlock All Certificates
Aprende a extraer información estructurada de archivos PDF utilizando LangChain y modelos de lenguaje multimodales en este tutorial técnico de 51 minutos. Explora dos implementaciones diferentes: una solución local empleando OLLAMA con LLama 3.2 Vision 11B y otra utilizando el modelo comercial Gemini Pro 1.5 flash. Accede al código fuente completo a través del notebook proporcionado en GitHub para seguir paso a paso la implementación de estas técnicas de procesamiento de documentos con capacidades de visión artificial.
Syllabus
RAG: Como Extraer Información Estructurada de Imágenes LangChain y Multimodal LLM #machinelearning
Taught by
The Machine Learning Engineer