Extracción de Información Estructurada de Imágenes con LangChain y LLMs Multimodales
The Machine Learning Engineer via YouTube
Power BI Fundamentals - Create visualizations and dashboards from scratch
Build the Finance Skills That Lead to Promotions — Not Just Certificates
Overview
Google, IBM & Meta Certificates — All 10,000+ Courses at 40% Off
One annual plan covers every course and certificate on Coursera. 40% off for a limited time.
Get Full Access
Aprende a extraer información estructurada de archivos PDF utilizando LangChain y modelos de lenguaje multimodales en este tutorial técnico de 51 minutos. Explora dos implementaciones diferentes: una solución local empleando OLLAMA con LLama 3.2 Vision 11B y otra utilizando el modelo comercial Gemini Pro 1.5 flash. Accede al código fuente completo a través del notebook proporcionado en GitHub para seguir paso a paso la implementación de estas técnicas de procesamiento de documentos con capacidades de visión artificial.
Syllabus
RAG: Como Extraer Información Estructurada de Imágenes LangChain y Multimodal LLM #machinelearning
Taught by
The Machine Learning Engineer