class: inverse, middle,center background-image: url("data:image/png;base64,#MochoBlanco.jpg") background-size: cover .right[ <img src="data:image/png;base64,#logor.png" width="30%" style="display: block; margin: auto 0 auto auto;" /> ] ## Taller - Introducción al Webscraping con R ### Manual de Instalación LibrerĆa RSelenium **VĆctor Caquilpan** victor.caquilpan@gmail.com āļø <style> body { text-align: justify} </style> --- ## RSelenium RSelenium es una librerĆa disponible en R que nos permite explorar pĆ”ginas Webs de forma automatizada. A su vez, es una librerĆa que funciona de una manera un poco compleja ya que tiene dependencias externas a R. En el taller de "Introducción al Webscraping con R" se realizarĆ”n ejercicios prĆ”cticos con RSelenium por lo que se recomienda seguir los pasos de este manual para instalar de forma satisfactoria dicha librerĆa. La instalación de la librerĆa consta de 6 pasos y lleva en promedio unos **5 a 10 minutos**. Se sugiere disponer de una versión de R que sea [4.0 o mayor](https://cran.dcc.uchile.cl/). --- ## Pasos de la Instalación **1) Instalación de Java**. Java en palabras sencillas es una aplicación que me permite trabajar y desarrollar otras aplicaciones/programas que operan en la Web. Para descargarlo, pueden ingresar a este [enlace](https://www.java.com/es/download/manual.jsp). **2) Actualización de Coogle Chroome**. En la clase vamos a ocupar el navegador Google Chrome por lo que se recomienda disponer de su versión mĆ”s actualizada. Para eso pueden descargarlo accediendo al siguiente [enlace](https://www.google.com/intl/es/chrome/). --- ## Pasos de la Instalación **3) Instalación de RTools**. Rtools es un conjunto de herramientas de R, que permite entre otras cosas, trabajar con librerĆas que estĆ”n en desarrollo o en otras fuentes (no CRAN). Para la instalación, simplemente pueden descargarlo en esta [pĆ”gina](https://cran.r-project.org/bin/windows/Rtools/). Una vez que lo descarguen e instalen, tienen que abrir una sesión de R/Rstudio y en la consola introducir la siguiente lĆnea de código (para R 4.0 o mayor): ```r writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con = "~/.Renviron") ``` **En el caso de Mac**, no es necesario instalar RTools. Solo se requiere chequear si la herramienta de lĆnea de comando de Xcode ya estĆ” instalada. Si no estĆ” instalada, se recomienda seguir los pasos de este [blog](https://johnmuschelli.com/neuroc/installing_devtools/index.html). --- ## Pasos de la Instalación **4) Instalación de librerĆa devtools**. Devtools nos permite desarrollar librerĆas y trabajar con librerĆas externas a CRAN. Para su instalación, esto se puede realizar directamente en R a travĆ©s de la siguiente función: ```r install.packages("devtools") ``` --- ## Pasos de la Instalación **5) Instalación de librerĆa RSelenium**. Podemos utilizar las siguientes lĆneas de código en R: ```r library(devtools) devtools::install_github("ropensci/RSelenium") ``` En este punto lo mĆ”s probable es que en la consola de R, les aparezca un listado de librerĆas que se requieren instalar. En esta parte se debe ingresar en la consola el valor numĆ©rico uno ("1") para ordenar que todas las dependecias sean instaladas. Es posible que les aparezca algĆŗn problema con respecto a otras librerĆas previamente instaladas. Si les ocurre esto les recomiendo correr en R las siguientes lĆneas de código: ```r install.packages("curl") install.packages("Rcpp") install.packages("XML", type = "binary") install.packages("RSelenium",dependencies = TRUE) ``` --- ## Pasos de la Instalación **6) Chequeo**. Para probar que todo estĆ© correctamente instalado, deben correr en una sesión de R lo siguiente: ```r library(RSelenium) rsDriver(port = 4568L, browser = "chrome", chromever = "93.0.4577.63") ``` Esto puede demorar un par de minutos. Si se les abre una ventana de Google Chrome en blanco, significa que RSelenium estĆ” funcionando. Ahora Pueden cerrar tanto la ventana que se abrió como la sesión de R/RStudio. <img src="data:image/png;base64,#ConsolaWeb.jpg" width="450px" style="display: block; margin: auto;" /> --- ## Potenciales problemas **1) Puerto en uso**. Si al correr el script anterior les aparece un error relativo al puerto (*port*), pueden utilizar otro puerto tal como **4569L** o **4570L** y volver a correr el código. **2) Version de driver no coincide**. Puede que al correr el script anterior se les genere un error que haga mención a la versión de Google Chrome a utilizar. ```r Error in chrome_ver(chromecheck[["platform"]], chromever) : version requested doesnt match versions available = 94.0.4606.61,95.0.4638.54,96.0.4664.18" ``` En este caso, deben modificar el argumento **chromever** para que estĆ© referenciado a una de las versiones que les aparecen en pantalla (ojala nunca usar la mĆ”s actual, porque tiende a presentar ciertos inconvenientes). Ejemplo: ```r library(RSelenium) rsDriver(port = 4568L, browser = "chrome", chromever = "94.0.4606.61") ``` --- class: inverse, left, bottom background-image: url("data:image/png;base64,#MochoBlanco.jpg") background-size: cover .center[#Ā”Listo!] .center[##Nos vemos el dĆa del Taller š] Si detectas algĆŗn problema en la instalación, por favor, contactarme al correo **victor.caquilpan@gmail.com**.