Hola a todos!,
Estoy ejecutando el cuaderno de estas cápsulas. En la primera hay una descarga de un excel a partir de una web. No puedo acceder a los datos porque me dicen que la web no existe. Copio el código.
¿A alguien más la ha pasado?
La verdadque se puede seguir el trabajo sin problema, pero me gustaría saber qué pasa porque al meter el link en mi navegador me arroja el error 404.
"El aspecto de una matriz de expresión es el que muestra la siguiente celda de código. Observa la
disposición matricial con un gen por cada fila (19947 en total - numeradas desde la fila 0 a la fila
19946) y una muestra por cada columna (473 en total).
# Esto ya es código de Python (observa que no aparece el %%R)
# la variable "data" de python contiene la matriz de expresión
import pandas as pd
pd.DataFrame(data)
{"type":"dataframe"}
En la siguiente cápsula iniciaremos un análisis exploratorio de estos datos y abordaremos dos
pasos imprescindibles antes de cualquier análisis computacional: el preprocesamiento y la
normalización de los datos.
5.2. Datos clínicos y resultados de estudios -ómicos
Además de los datos de expresión genética, también estaban disponibles datos clínicos de las
muestras y otros resultados derivados de distintos estudios -ómicos que pueden ser
interesantes para identificar patrones o relaciones novedosas en los datos.
El siguiente código ilustra como descargar una tabla en formato excel desde una URL, guardar la
tabla en una variable (base_datos) y visualizar su contenido para una primera exploración
# Importamos la librería pandas con el alias 'pd'
import pandas as pd
# Almacenamos el enlace a nuestros datos en la variable 'url_datos'
url_datos = '
https://drive.google.com/uc?id=1Wjyktizno4tUt8bjnBxpXXUZDAWXWa4'
# El método read_excel permite leer un libro de Excel
# El parámetro 'sheet_name' indica la hoja que nos interesa y
'usecols' nos permite
# especificar el conjunto de columnas que queremos leer (ambos son
parámetros opcionales)
base_datos = pd.read_excel(url_datos, sheet_name='Supplemental Table
S1D', header=1, na_values='-')
# Mostramos la tabla completa
base_datos"
-------------------------------------------------------------------------------------------------------------------------------
Hi there!
I was executing the code above, however a worng answer was showed after the promp was executed. I have check the website address on my web navigator and a 404 error appeared. Does anyone have the same problem?
It is not essential for the process however I would like to sove it.