1. ¿Cuál es el primer paso recomendado al explorar un nuevo dataset en Python?  A) Calcular la asimetría de las variables.  B) Mostrar las primeras filas y las dimensiones del dataset. C) Realizar una validación cruzada k-folds. D) Estandarizar las variables numéricas. 2. ¿En qué tipo de problemas de Machine Learning se utiliza la métrica R² (coeficiente de determinación)?  A) Problemas de clasificación.  B) Problemas de clustering.  C) Problemas de regresión. D) Todos los anteriores. 3. ¿Qué métrica se utiliza para evaluar la precisión de un modelo de clasificación?  A) MSE (Error Cuadrático Medio).  B)  R² (Coeficiente de determinación).  C) Precisión. D) MAPE (Error Porcentual Absoluto Medio). 4. ¿Qué métrica se utiliza para evaluar el rendimiento de un modelo de clasificación binario?  A) Área bajo la curva ROC. B) Matriz de confusión.  C)  Precisión.  D) Todas las anteriores. 5. ¿Qué tipo de validación cruzada es computacionalmente más costoso?  A) k-folds. B) Leave one out. C) Holdout.  D) Todas son igual de costosas. 6. ¿Qué función de Python se utiliza para realizar validación cruzada k-folds?  A) cross_val()  B) KFold() C)  split_data() D) validate() 7. ¿Cuál es la principal ventaja de la validación cruzada leave one out?  A) Es más rápida que la validación cruzada k-folds.  B) Es menos propensa al sobreajuste. C) Es adecuada para datasets pequeños. D) Es más fácil de implementar. 8. ¿Qué métrica se utiliza para evaluar la calidad de los clusters en el algoritmo K-means?  A) Precisión.  B) Puntuación de silueta. C) R².  D) MSE. 9. ¿Qué técnica de preprocesamiento se aplica a los datos antes de realizar el clustering K-means?  A) Estandarización. B) Normalización.  C) Binarización.  D) No se aplica ninguna técnica de preprocesamiento. 10. ¿Qué librería de Python se utiliza para usar el algoritmo K-means?  A) pandas  B) numpy  C) sklearn.cluster D) matplotlib.pyplot 11. ¿Qué función de Python se utiliza para obtener un resumen estadístico de un dataset?  A) pd.summary()  B) df.describe() C)  pd.statistics()  D) df.info() 12. ¿Qué visualización se utiliza en las fuentes para representar los clusters generados por K-means?  A) Diagrama de caja y bigotes.  B) Histograma.  C) Gráfico de dispersión. D) Dendrograma. 13. En el contexto de las redes neuronales, ¿qué función se utiliza para calcular el error entre las predicciones y los valores reales?  A) Función de activación.  B) Función de pérdida. C) Función de optimización.  D) Función de regularización. 14. ¿Qué algoritmo de optimización se utiliza para entrenar la red neuronal en el ejemplo de regresión con redes neuronales?  A) Gradiente descendente estocástico (SGD).  B) Adam. C) RMSprop. D) Adagrad. 15.¿Qué tipo de validación cruzada se utiliza para ajustar los hiperparámetros de la red neuronal en el código de Python?  A) Validación cruzada simple.  B)  Validación cruzada anidada (doble). C)  Leave one out.  D) Holdout. 16. ¿Qué métrica se utiliza para evaluar el rendimiento del modelo de regresión con redes neuronales en el código de Python?  A) MSE (Error Cuadrático Medio). B)  MAPE (Error Porcentual Absoluto Medio). C) Coeficiente de correlación (r). D) Todas las anteriores. 17. ¿En qué lenguaje de programación se utiliza la función feedforwardnet para crear una red neuronal?  A) Python. B) MATLAB. C) R.  D) Java. 18.¿Cuál es la función de la función cvpartition en MATLAB?  A) Crear particiones para la validación cruzada. B) Entrenar una red neuronal.  C) Calcular la precisión de un modelo. D) Visualizar los clusters. 19. ¿Qué función se utiliza en MATLAB para estandarizar las variables de entrada? A) normalize()  B) standardize()  C) zscore() D) scale() 20. ¿Cuál es la principal ventaja de usar la validación cruzada anidada al entrenar una red neuronal?  A) Reduce el tiempo de entrenamiento. B) Evita la necesidad de un conjunto de prueba separado.  C) Permite una evaluación más precisa del rendimiento del modelo. D) Simplifica el proceso de selección de hiperparámetros. 21. ¿Qué tipo de modelo se utiliza en el ejemplo de clasificación en MATLAB?  A) Regresión logística.  B) Máquinas de vectores de soporte (SVM).  C)  K-vecinos más cercanos (k-NN). D) Árbol de decisión. 22. ¿Cuál es el propósito principal del coeficiente de correlación de Pearson?  A) Medir la dispersión de los datos.  B) Determinar la asimetría de una variable.  C) Evaluar la relación lineal entre dos variables. D)  Identificar outliers en un dataset. 23.¿Qué función de Python se utiliza para visualizar la matriz de confusión de un modelo de clasificación?  A) confusion_chart()  B) ConfusionMatrixDisplay() C) plot_confusion_matrix()  D) show_confusion() 24. ¿Qué valor del coeficiente de correlación de Pearson indica una correlación negativa perfecta?  A) 0 B) 1 C) -1 D) 0,5 25. ¿Cuál de las siguientes opciones NO es una técnica común para reducir la asimetría en los datos?  A) Transformación logarítmica.  B) Transformación Box-Cox.  C) Aplicación de la raíz cuadrada.  D) Calcular la matriz de covarianza. 26. ¿Qué visualizaciones son útiles para identificar outliers en un dataset?  A) Histogramas.  B) Diagramas de dispersión.  C) Diagramas de caja y bigotes. D) Todas las anteriores. 27. ¿Qué técnica de preprocesamiento se utiliza para que los datos tengan una media de 0 y una desviación estándar de 1? A) Normalización.  B) Estandarización C) Binarización.  D) Discretización. 28. ¿Cuál es el propósito de dividir un dataset en conjuntos de entrenamiento y prueba en Machine Learning?  A) Evaluar el rendimiento del modelo en datos no vistos. B)  Reducir el tiempo de entrenamiento del modelo.  C) Simplificar el proceso de preprocesamiento de datos.  D) Aumentar la complejidad del modelo. 29. ¿Qué función de Python se utiliza para dividir los datos en conjuntos de entrenamiento y prueba?  A) data.split()  B) train_test_split() C) cross_validation.split()  D) dataset.partition() 30. ¿Los resultados de generalización se deben calcular con ...? A) patrones de training B) patrones de test C) patrones de validación D) ninguna es correcta