- Level Foundation
- المدة 13 ساعات hours
- الطبع بواسطة Universidad Austral
-
Offered by
عن
Este curso te brindará los conocimientos necesarios para la extracción, limpieza y preparación de distintas fuentes de datos para ser incluidos en un proceso de NLP. Para realizar este curso es necesario contar con conocimientos de programación de nivel básico a medio, deseablemente conocimiento básico del lenguaje Python y es recomendable conocer el entorno de Jupyter Notebooks del entorno Anaconda. Para desarrollar aplicaciones se va a utilizar Python 3.6 o superior. Alternativamente se puede utilizar el entorno de Anaconda con la misma versión de Python. Como editor de código, los ejemplos van a ser editados en el Notebook de Anaconda, pero el alumno puede utilizar cualquier editor de texto que reconozca notebooks de Anaconda. Librerías que es necesario tener instaladas para realizar el curso: NLTK, Pandas, Scikit-learn y librerías de extracción de datos.الوحدات
Bienvenida
1
Videos
- Universidad Austral
1
Readings
- Bienvenidos a la Universidad Austral
Introducción al Web Scraping
1
Assignment
- Test de la lección
1
Videos
- Introducción al curso
3
Readings
- Dinámica del curso
- Glosario
- Nociones básicas de Web Scraping. 3 técnicas para extracción de distintos formatos de páginas web
Etapas del Web Scraping
1
Assignment
- Test de la lección
1
Discussions
- Analizando las etapas del Web Scrapping
1
Videos
- Etapas del Web Scraping
1
Readings
- Principales etapas del Web Scraping
Problemas que pueden resolverse con Web Scraping
1
Assignment
- Evaluación del módulo
1
Discussions
- El Web Scarping y NLP
2
Videos
- Problemas que pueden resolverse con Web Scraping
- Problemas que pueden resolverse con Web Scraping - Conclusiones
1
Readings
- Material complementario
HTML Parsing
1
Assignment
- Test de la lección
1
Videos
- HTML Parsing
1
Readings
- Revisión exhaustiva del proceso de Parsing en páginas HTML
Construcción de un parser
1
Assignment
- Test de la lección
1
Discussions
- El Parsing y sus tipos de técnica
1
Videos
- Construcción de un parser
1
Readings
- Diseño de un parser
Tipos de Parsing
1
Assignment
- Evaluación del módulo
1
Videos
- Tipo de Parsing
2
Readings
- Principales formas de hacer parsing en páginas HTML
- Material complementario
Parsing Avanzado
1
Assignment
- Test de la lección
1
Videos
- Parsing avanzado
1
Readings
- Metodologías de parsing avanzado
Análisis y arquitectura de parsers
1
Assignment
- Test de la lección
1
Discussions
- Analizando el grado de concurrencia que debe poseer el parser
1
Readings
- Apuntes de ingeniería de software para la construcción de parsers
Programación de parsers avanzados
1
Assignment
- Evaluación del módulo
2
Videos
- Programación concurrente y programación distribuida
- Programación de parsers avanzados
2
Readings
- ¿Cómo evaluar el lenguaje de programación más apropiado para la construcción del parser?
- Material complementario Selección de links parser avanzado.
Otros orígenes de datos
1
Assignment
- Test de la lección
1
Videos
- Presentación de las distintas fuentes de datos
1
Readings
- Principales alternativas de fuentes de datos en NLP
Construcción de conectores para diversas fuentes de datos
1
Assignment
- Test de la lección
1
Discussions
- Analizando el origen de los datos
1
Videos
- Construcción de conectores para diversas fuentes de datos
1
Readings
- ¿Cómo debe ser construido un conector?
Alternativas en la construcción de conectores
1
Assignment
- Evaluación del módulo
2
Videos
- Conectores de Web Scraping
- Alternativas en la construcción de conectores
2
Readings
- Como se puede construir conectores modulares
- Material complementario
Auto Summary
This foundational course in Data Science & AI, taught by Coursera, focuses on data cleaning and preparation for Natural Language Processing (NLP). Learners will gain essential skills in extracting and preparing data using Python 3.6+, with hands-on practice in Anaconda's Jupyter Notebooks. Basic to intermediate programming knowledge, particularly in Python, is recommended. The course spans 780 minutes and is available through the Starter subscription, making it ideal for those looking to enhance their data processing capabilities for NLP applications.

Hernán Daniel Merlino