Capítulo 4 Análisis de datos con R (II)

Introducción y objetivos

En el tema anterior presentamos una serie de técnicas básicas de análisis de datos con R. Estas técnicas estaban centradas en el análisis de datos de naturaleza numérica, normalmente recogidos en estructuras de datos complejas, como las tablas.

Sin embargo, R también nos permite llevar a cabo el análisis de otros tipos datos mediante el uso de paquetes específicos. El objetivo fundamental de este tema es ofrecer una breve introducción a algunos de estos paquetes y familiarizarnos con el uso de los mismos a nivel básico. En particular, centraremos nuestra atención en dos aspectos:

  • Aprenderemos a llevar a cabo tareas simples de minería de texto, utilizando para ello las funcionalidades ofrecidas por la librería tm (text mining).

  • Presentaremos el paquete de extensión igraph, que nos permitirá llevar a cabo el análisis de información con estructura de grafo.

Para ello, dividiremos el tema en dos secciones específicas, cada una de ellas dedicada a un paquete concreto. En cada una de estas secciones comenzaremos ofreciendo una breve introducción al paquete, con la finalidad de motivar y contextualizar su uso.

A continuación, veremos cómo utilizar el paquete en la práctica, lo que incluirá tanto la creación de las estructuras de datos específicas para representar documentos de texto y grafos en R, como su manipulación, utilizando algunas de las técnicas de análisis disponibles en cada paquete.

Así pues, cuando hayas finalizado con los contenidos de este tema:

  • Habrás aprendido qué son y por qué son útiles las técnicas de minería de texto y análisis de grafos.

  • Habrás instalado los paquetes necesarios (tm, igraph) en tu computador.

  • Conocerás las principales estructuras de datos y funcionalidades ofrecidas por dichos paquetes.

  • Sabrás cómo utilizarlos para llevar a cabo tareas básicas de minería de texto y análisis de grafos.