Nuestro canal de SlideShare

image

Aquí os dejamos el enlace a nuestro canal de SlideShare:

http://www.slideshare.net/ValenciaRUsers

Encontrareis las ponencias de Lidia Contreras y David Hervás del pasado 9 de marzo:

 

Materiales reunión 9 de marzo

En la reunión del pasado marzo tuvimos dos presentaciones muy interesantes, la primera a cargo de David Hervás, de la Unidad de Bioestadística del Instituto de Investigación Sanitaria de La Fe. David nos mostró uno de los problemas típicos a los que se enfrenta, el exceso en el número de variables para un análisis dado. Comentó las distintas técnicas para reducir el número de variables a un nivel óptimo, los diferentes problemas y errores que puede cometer un analista, y sobretodo, cómo solventarlos.

Tenéis la presentación completa aquí y el código para reproducir en este script separado (wordpress no permite el formato .R).

La segunda presentación corrió a cargo de Lidia Contreras, del Departament de Sistemes de Computació de la UPV, que nos explicó cómo predecir la contaminación atmosférica en la ciudad de Valencia completando la información que recogen las estaciones de contaminación con los datos de tráfico, datos disponibles en abierto y mucho más abundantes.

Un ejemplo muy completo de obtención/creacion de datos, tratar datos sobre mapas, análisis exploratorio, patrones temporales, modelización-predicción… La presentación con el código en este pdf.

Echadle un vistazo a las presentaciones y no os perdáis las próximas!

Reunión 9 de marzo

El próximo 9 de marzo  a las 19:00h celebraremos una reunión en la que se presentarán dos trabajos muy interesantes realizados con R.

Una situación habitual en el análisis de datos es la sobreabundancia de variables a estudiar. Para solventarlo, se han desarrollado diversas soluciones de selección y reducción de variables. David Hervás presentará su ponencia sobre “Selección de variables en modelización”, un paso imprescindible en estas situaciones, antes de aplicar modelos predictivos.

Lidia Contreras presentará su trabajo de “Predicción de contaminación con técnicas de machine learning”. La app está basada en los datos abiertos sobre contaminación de la ciudad de Valencia, aplicando técnicas de random forest para obtener predicciones que presenta sobre el mapa de la ciudad. Un trabajo que cubre muy bien distintas facetas a las que puede tener que enfrentarse un analista de datos.

El lugar elegido es la sala Josep Renau, en la planta baja del edificio 1G de la Universitat Politècnica de València.

¡Os esperamos!

Primera reunión

El próximo miércoles 9 de diciembre a las 19hrs celebraremos  la primera reunión del Grupo de Usuarios de R de Valencia. El lugar elegido será la sala Josep Renau, en la planta baja del edificio 1G de la Universitat Politècnica de València.

First_Birthday_Candle_Cupcake-310x310

En esta primera reunión el objetivo es muy sencillo, ponernos en contacto con los primeros interesados en participar de forma activa como organizadores así como definir unos primeros pasos, esbozando un calendario para los próximos meses.

Estás invitado, además te pedimos que extiendas esta convocatoria a todos aquellos que creas que pueden estar interesados en participar de forma activa en el grupo como organizadores.

Todos los interesados escribid un email a valenciarusers@gmail.com, para así poder dimensionar bien la reunión.

Editado: la reunión se ha trasladado del día 3 al 9.

Materiales de las VII Jornadas de Usuarios de R

Ya tenemos disponibles los materiales de las VII Jornadas de Usuarios de R que se celebraron los pasados días 5 y 6 de noviembre en Salamanca.

  1. Big Data
  2. Gráficos y visualizaciones
  3. Modelización y técnicas de Machine Learning
  4. Ecología
  5. Ideas de negocio
  6. Enseñanza
  7. Encuestas

La temática relativa a Big Data se contempló fundamentalmente en:

  • SparkR (R on Spark). El código usado en el taller está disponible en GitHub
  • Técnicas Big Data en la optimización del problema de búsqueda de homologías
    en bases de batos biológicas, (enlace)

Los aspectos gráficos y de visualizaciones ocuparon una parte muy importante de las charlas:

  • ¿Necesitamos un interfaz gráfico de usuario en R? (enlace)
  • Desarrollo de interfaces gráficas para librerías de R: OpenCPU y la librería
    spdynmod, (enlace)
  • Análisis de coincidencias mediante web con R-shiny, (enlace)
  • MultBiplotR: Multivariate Analysis using biplots in R, (enlace)
  • Creación de gráficos interactivos en R: aplicación al análisis de datos genómicos
    de Gliomas, (enlace)
  • Análisis de redes en R con el paquete igraph, (enlace)

La modelización y técnicas de Machine Learning aplicadas a diversos sectores (investigación médica, fijación de precios, análisis de textos…) se trataron en diversas ponencias.

  • Clasificación de textos científicos con R, (enlace y código)
  • Review Manager + R: la combinación perfecta para presentar los resultados
    de un metanálisis, (enlace)
  • Reduciendo el error Monte Carlo en la estimación bayesiana de los riesgos
    relativos usando modelos de regresión binomial, (enlace)
  • Técnicas y paquetes de R para la evaluación o diagnóstico de modelos de
    regresión, (enlace)
  • Cómo enfrentarse a datos complejos. Introducción al análisis multivariante:
    técnicas básicas de ordenación y clasificación en R, (enlace)
  • Aplicación de LASSO en modelos mixtos. Un enfoque bayesiano (enlace)
  • Price Sensitivity Meter (PSM) en R ,(enlace)
  • Análisis de Supervivencia con Datos de Alta Dimensionalidad, (enlace)

El uso de R en Ecología es común

  • Comparación de técnicas para la obtención de modelos de distribución de
    especies con R. (enlace)
  • Entendiendo la beta diversidad y su relación con los patrones de distribución
    espacial en ecología de comunidades. Aplicación de los paquetes
    betapart y BAT para R. (enlace)

Ideas de negocio usando R

  • Utilizando R en la vida diaria: comprar un coche, (enlace)
  • Frecuencias de búsquedas en Wikipedia como estrategia de inversión en el
    IBEX35, (enlace)

La enseñanza de R en la Universidad también tuvo su espacio

  • Enseñando R en el Grado en Estadística, (enlace)

El uso de R en encuestas

  • Análisis de encuestas con datos provenientes de teléfonos fijos y teléfonos
    móviles, (enlace)
  • Paquetes para el tratamiento de datos provenientes de encuestas aleatorizadas, (enlace)
  • Bye, bye SPSS (y SAS): hola R para encuestas, (enlace)

El programa completo está disponible aquí.

Agradecer a los organizadores y a la Comunidad R-Hispano el esfuerzo realizado.