Revista de Ciencias de Revista de Ciencias de
Administración y EconomíaAdministración y Economía
Retos, 13(26), 2023 Revista de Ciencias de la Administración y Economía
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
www.retos.ups.edu.ec
octubre 2023-marzo 2024
pp.273-289
https://doi.org/10.17163/ret.n26.2023.06
Optimización de hiperparámetros de regresión del proceso
gaussiano para predecir problemas financieros
Gaussian process regression´s hyperparameters optimization to
predict financial distress
Amine Sabek
Profesor e investigador de la Universidad de Tamanrasset, Argelia
sabek.amine@univ-tam.dz
https://orcid.org/0000-0002-6970-4183
Jakub Horák
Profesor e investigador del Instituto de Tecnología y Empresas de České Budějovice, República Checa
horak@mail.vstecb.cz
https://orcid.org/0000-0001-6364-9745
Recibido: 07/06/23 Revisado: : 06/07/23 Aprobado: 03/08/23 Publicado: 1/10/23
Resumen: la predicción de las dificultades financieras se ha convertido en uno de los temas más importantes en el área contable y financiera
debido a su correlación significativa con el desarrollo de la ciencia y la tecnología. El objetivo principal de este trabajo es predecir la dificultad
financiera con base en la Regresión de Procesos Gaussianos (GPR) y luego comparar los resultados de este modelo con los resultados de otros
modelos de aprendizaje profundo (SVM, LR, LD, DT, KNN). El análisis se basa en un conjunto de datos de 352 empresas extraídos de la base de
datos de Kaggle. En cuanto a los predictores, se utilizaron 83 ratios financieros. El estudio concluyó que el uso de la GPR logra resultados muy
relevantes. Además, superó al resto de los modelos de aprendizaje profundo y logró el primer lugar por igual con el modelo SVM con una pre-
cisión de clasificación del 81 %. Los resultados contribuyen al mantenimiento del sistema integrado y a la prosperidad de la economía del país,
a la predicción de las dificultades financieras de las empresas y, por lo tanto, a la posible prevención de perturbaciones del sistema en cuestión.
Palabras clave: dificultades financieras, regresión del proceso gaussiano, aprendizaje profundo, financiamiento de inversiones, predicción del
riesgo financiero, regresión gaussiana, coeficientes financieros, modelos de aprendizaje profundo.
Abstract: predicting financial distress has become one of the most important topics of the hour that has swept the accounting and financial field
due to its significant correlation with the development of science and technology. The main objective of this paper is to predict financial distress
based on the Gaussian Process Regression (GPR) and then compare the results of this model with the results of other deep learning models (SVM,
LR, LD, DT, KNN). The analysis is based on a dataset of 352 companies extracted from the Kaggle database. As for predictors, 83 financial ratios
were used. The study concluded that the use of GPR achieves very relevant results. Furthermore, it outperformed the rest of the deep learning
models and achieved first place equally with the SVM model with a classification accuracy of 81%. The results contribute to the maintenance of
the integrated system and the prosperity of the country’s economy, the prediction of the financial distress of companies and thus the potential
prevention of disruption of the given system.
Keywords: financial distress, Gaussian process regression, deep learning, investment financing, financial risk prediction, Gaussian regression,
financial ratios, deep learning models.
Cómo citar: Sabek, A. y Horák, J. (2023). Optimización de hiperparámetros de regresión del proceso gaussia-
no para predecir problemas financieros. Retos Revista de Ciencias de la Administración y Economía, 13(26), 273-289.
https://doi.org/10.17163/ret.n26.2023.06
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
274 Amine Sabek y Jakub Horák
Introducción
El conocimiento nanciero es esencial para
una entidad comercial determinada. La salud
nanciera expresa la buena situación nanciera
de la empresa. Una empresa es nancieramente
sana si garantiza los fondos invertidos (rendi-
miento, rentabilidad), es nancieramente esta-
ble, no está limitada en su toma de decisiones
por otras entidades (endeudamiento, estructura
nanciera), puede pagar sus obligaciones y, por
lo tanto, garantizar la existencia y la apreciación
de los fondos invertidos (Gavurova et al., 2020;
Krulicky y Horak, 2021).
Por otra parte, la crisis nanciera puede de-
nirse como una situación en la que el ujo de caja
de una empresa se restringe por alguna razón.
Esta restricción puede ser temporal si los direc-
tores tienen la oportunidad y la capacidad de
llevar a cabo procedimientos correctivos (Liew
et al., 2023). Horak et al. (2020) mencionan carac
-
terísticas similares de dicultades nancieras,
y la denen como un estado en el que la salud
nanciera de la empresa se debilita signicativa-
mente. Los autores añaden que, en caso de existir
dicultades nancieras, es difícil para la empresa
establecer un calendario de pagos y pagar sus
obligaciones nancieras a tiempo dentro de las fe-
chas de vencimiento pre-acordadas, lo que expo-
ne a la empresa al posible riesgo de intervención
legal. En tal situación, la empresa muestra graves
problemas de liquidez (capacidad de pago), y la
solución equivale a cambios signicativos en las
actividades operativas de la empresa y el método
de nanciación (Vochozka et al., 2020). La crisis
nanciera es también la etapa nal del deterioro
organizacional antes de la bancarrota. Por lo tan-
to, la dicultad nanciera diere de la quiebra ya
que prescribe un momento en el que el prestatario
no puede pagar las deudas al acreedor (Hantono,
2019). Todavía no se ha determinado la denición
exacta de dicultades nancieras, sin embargo,
se sabe que las dicultades económicas poseen
diversos grados. La dicultad nanciera leve se
reere a la dicultad temporal en el ujo de caja
y conceptos como insolvencia, impago, etc. El
más peligroso de estos grados es la bancarrota o
el fracaso empresarial (Shi y Li, 2019).
La importancia de predecir las dicultades
nancieras ha evolucionado gradualmente des-
de hace casi medio siglo cuando se observó este
fenómeno contemporáneo que apareció con el
desarrollo de los establecimientos comerciales,
donde el repentino quiebre de muchas empresas
resultaba incomprensible. Kliestik et al. (2018)
arman que existen varios trabajos cientícos
que han estudiado el tema de la predicción de
las dicultades nancieras, con el n de predecir
el quiebre de la empresa y clasicar la empresa
de acuerdo con su salud nanciera. Para ello,
se han utilizado varios métodos que dieren en
sus supuestos y complejidad. Sin embargo, an-
ticiparse a las dicultades nancieras antes de
que ocurran sigue siendo una de las soluciones
que han demostrado ser ecaces para evitarlas.
Inicialmente, se utilizaron técnicas estadísticas
para construir modelos con capacidad predictiva,
y la construcción de modelos se asoció con el
desarrollo de la ciencia y la tecnología. Cuanto
más se desarrolla la ciencia, hay más cientí-
cos e investigadores que diseñan modelos más
complejos, precisos y de calidad que llenan los
vacíos de los estudios anteriores. El desarrollo
de la ciencia ha llevado a una revolución en el
campo del pronóstico, donde se han explotado
técnicas de inteligencia articial en este campo,
logrando resultados impresionantes que son casi
perfectos (Bonello et al., 2018). Las técnicas de
inteligencia articial para pronosticar proble-
mas nancieros se hicieron comunes en los años
90, con el desarrollo de las técnicas informáticas
(Paule-Vianez, 2019). El aprendizaje profundo ha
surgido y está evolucionando progresivamente
hacia una técnica robusta para diversos usos, y
ha ayudado a resolver varios problemas en la
economía y los negocios, como el reconocimiento
de voz, el procesamiento del lenguaje natural, la
conducción automática, la visión por computa-
dora, la predicción de dicultades nancieras y
la evaluación del crédito (Qu et al., 2019).
Existen varios estudios cientícos sobre el
tema de las dicultades nancieras y la predic-
ción de quiebras, que han propuesto diversos
modelos predictivos con ese n. La mayoría
de los estudios publicados utilizaron datos de
un año antes de la crisis. Solo algunos estudios
usaron datos de 2-3 años antes de la crisis. Los
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
275
resultados mostraron que los datos que corres-
ponden a dos años antes de crisis redujeron la
capacidad del modelo para predecir dicultades
nancieras (Fernández-Gámez et al., 2016), con
precisiones de 72,0 % y 95,5 %, 86,2 %, 100 %
utilizando algoritmos genéticos y red neuronal
de uno, dos y tres años antes del hecho. Algunos
autores compararon la precisión de clasicación
de los modelos de pronóstico basados en empre-
sas industriales polacas. Mediante programas
de R, la investigación probó redes neuronales,
regresión logística, máquinas vectoriales de apo-
yo, árboles de clasicación, algoritmos k-NN,
ensacado, bosques aleatorios, análisis discrimi-
natorio, potenciación y Bayes ingenuos (Costa
et al., 2022). Otros autores han estudiado varios
modelos inteligentes y estadísticos, como la op-
timización de enjambres de partículas integrada
en las máquinas virtuales semiconductoras, los
árboles de decisión, el discriminante lineal y los
algoritmos genéticos, utilizando regresión logís-
tica de las máquinas virtuales semiconductoras,
mapas auto-organizados y cuanticación de vec-
tores de aprendizaje. Los resultados muestran
que las técnicas estadísticas son más adecuadas
para grandes conjuntos de datos, y las técnicas
inteligentes son más adecuadas para conjuntos
de datos más pequeños (Zhou et al., 2019). Este
método mejorado combina características de
conjuntos difusos, y el aprendizaje automático
se puede comparar con las redes neuronales
probabilísticas en términos de rendimiento de
agrupamiento. El objetivo del estudio consiste
en predecir la decadencia mediante el método
GP y su posterior comparación con máquinas
de regresión logística y vectores de soporte. La
investigación se basa en datos precisos sobre
quiebras, y concluyó que los procesos gaussianos
superan a otros métodos en la predicción de la
quiebra con alta precisión (Liu et al., 2023).
El objetivo de este estudio es establecer una
idea general de las ventajas que se pueden aplicar
a los diversos actores, tanto académicos como
profesionales. La economía de un Estado funcio-
na como un sistema interconectado que abarca
numerosos factores que contribuyen al estable-
cimiento de una sociedad sólida y próspera. Si
alguno de estos factores no cumple con sus obje-
tivos, se producirá el fracaso de todo el sistema.
Dado que las empresas económicas desempeñan
un rol fundamental en la economía de un país,
resulta necesario garantizar su continuidad por
todos los medios posibles. En consecuencia, la im-
portancia de predecir las dicultades nancieras
surge como un método basado en el avance de
técnicas estadísticas e inteligentes que ayudan a
las empresas a evitar el quiebre y el cese de sus
operaciones.
Nuestro trabajo destaca entre el limitado -
mero de publicaciones cientícas que abordan
este tema, distinguiéndose por su enfoque en la
predicción de dicultades nancieras utilizando
el modelo GPR, por lo tanto, se realizaron prue-
bas preliminares sobre el modelo GPR. Nuestro
objetivo principal es mejorar la investigación
académica y hacer contribuciones signicativas
a su avance. Para esta investigación se denieron
dos preguntas de investigación: ¿Es el modelo
GPR adecuado para predecir las dicultades -
nancieras? ¿Se contrapone el modelo GPR con el
modelo de regresión logística para predecir las
dicultades nancieras?
El artículo se estructura de la siguiente manera.
En la sección 1 se presenta una breve revisión de la
literatura, en la sección 2 se proporciona informa
-
ción sobre el procedimiento de investigación, los
datos y las variables, en la sección 3 se presentan
los resultados obtenidos, en la sección 4 se analizan
los resultados obtenidos y se ofrece un resumen
general de los resultados de la investigación, in-
cluidas las recomendaciones propuestas.
Metodología
Datos y variables
Este conjunto de datos abarca dos tipos distin-
tos de variables. En primer lugar, está la variable
independiente X, que es una variable cuantitativa
que engloba un rango de 83 ratios nancieros. La-
mentablemente, los nombres especícos de estas
relaciones no se proporcionaron de forma explícita;
en su lugar, se denominaron X1, X2, ..., X83. Si bien
esta falta de identicación precisa es un inconve-
niente, se optó por utilizar estos datos debido a su
alineación con el objetivo principal del estudio, que
implica evaluar la capacidad predictiva del modelo
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
276 Amine Sabek y Jakub Horák
para dicultades nancieras posteriores a la opti-
mización de sus hiperparámetros. La identicación
del conjunto de ratios nancieros que ejercen la
mayor inuencia sobre la variable dependiente
sirvió como objetivo secundario, especialmente
después de la aplicación de la técnica PCA para
mejorar la calidad de los datos.
El segundo tipo de variables corresponde a la
variable dependiente, denominada Y, que es una
variable cualitativa que representa las salidas del
modelo y abarca dos escenarios fundamentales:
dicultades nancieras, que se denominan 0, y
dicultades no nancieras, que se denominan 1.
Estos datos ofrecen una descripción precisa de
las circunstancias reales de todos los casos nan-
cieros, teniendo en cuenta la importancia de los
indicadores (83). En consecuencia, este conjunto
de datos nos permite entrenar efectivamente el
modelo y evaluar su capacidad predictiva.
Nos basamos en un conjunto de datos ya es-
tablecidos que incluye datos de 352 empresas ex-
traídas de la base de datos de Kaggle. Dividimos
estos datos en una muestra de capacitación y una
muestra de prueba, donde la muestra de capaci-
tación contenía los datos de 187 empresas para
diferentes años, y el número de casos nancieros
(años scales) alcanzó 2001 casos nancieros di-
vididos en 896 casos de dicultades nancieras y
1105 casos de dicultades no nancieras, mientras
que la muestra de prueba incluyó los datos de
165 empresas para un período de cuatro años,
donde se excluyeron los datos del resto de años.
El número de casos nancieros (ejercicios scales)
en la muestra de prueba alcanzó los 660 casos
nancieros, divididos en 351 casos de dicultades
nancieras y 309 casos de dicultades no nan-
cieras. En cuanto a los predictores utilizados en
este estudio, se incluyen 83 ratios nancieros, que
representan un número considerable de variables
independientes, lo cual es deseable, ya que nos
ayudará a extraer los componentes más inu-
yentes en la variabilidad dependiente después
de activar la técnica de Análisis de Componentes
Principales (PCA). En la tabla 1 se muestran las
variables más importantes en las que se basa este
estudio.
Tabla 1
Principales variables de estudio
Variable Función
Regresión del
proceso gaussiano
Modelo probabilístico no paramétrico basado en el núcleo. Existe una variable latente f(xi)
introducida para cada observación xi, lo que hace que el modelo GPR no sea paramétrico. En
forma vectorial, este modelo es equivalente a
P(y\f,X) ~ N(y\Ηβ + f, σ2I),
Donde
La distribución conjunta de las variables latentes f(x1), f(x2), ..., f(xn) en el modelo GPR es la
siguiente:
P(f\X) ~ N(f\0, k(X, X)),
cerca de un modelo de regresión lineal, donde K(X,X) tiene el siguiente aspecto:
Función Kernel
En el aprendizaje supervisado se espera que los puntos con valores predictores similares xi,
tengan valores de respuesta cercana (objetivo) yi. En los procesos gaussianos, la función de
covarianza expresa esta similitud. Esto especifica la covarianza entre las dos variables latentes
f(xi) y f(xj), donde xi y xj son vectores de xd-by-1. Es decir, determina cómo la respuesta en un
punto xi se ve afectada por las respuestas en otros puntos xj, i ≠ j, i = 1, 2, ..., n. La función de
covarianza k(xi,xj) se puede definir mediante varias funciones del núcleo. Se puede analizar
en términos de los parámetros del núcleo en el vector θ. Por lo tanto, es posible expresar la
función de covarianza como k(xi,xj\θ).
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
277
Variable Función
Optimización de
hiperparámetros Cambiar las funciones del modelo para mejorar su rendimiento.
Análisis de los
componentes
principales
El análisis de los componentes principales es un método cuantitativamente riguroso para
lograr esta simplificación. El método genera un nuevo conjunto de variables, denominadas
componentes principales. Cada componente principal es una combinación lineal de las varia-
bles originales. Todos los componentes principales son ortogonales entre sí, por lo que no hay
información redundante. Los componentes principales en su conjunto constituyen una base
ortogonal para el espacio de los datos.
Núcleo cuadrático
racional
Esta función de covarianza se define mediante
cuando l es la escala de longitud característica, α es un parámetro de mezcla de escala con
valor positivo, y
Núcleo exponencial
cuadrado
Esta es una de las funciones de covarianza más utilizadas. La función exponencial cuadrada
del núcleo se define como
donde α l es la escala de longitud característica y f es la desviación típica de la señal.
Kernel Matern 5/2
Esta función de covarianza se define mediante
donde
Núcleo exponencial
Esta función de covarianza se define mediante
siendo α l la escala de longitud característica, y
Kernel Matern 3/2
Esta función de covarianza se define mediante
donde
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
278 Amine Sabek y Jakub Horák
Métodos
En este estudio se utilizó una metodología
descriptiva en la sección teórica, recurriendo a
fuentes acreditadas y revisadas por pares de re-
vistas académicas indexadas. Por otro lado, la
sección aplicada tuvo un enfoque comparativo
utilizando un método analítico. Se realizaron dos
indagaciones primarias, y luego de extraer los re-
sultados relacionados con la mejora de la calidad
del modelo de GPR, se hizo una comparación
con modelos de aprendizaje profundo. Las con-
clusiones se debatieron a fondo y se abordaron
las principales investigaciones.
El Matlab se utilizó para construir el modelo,
optimizando sus hiperparámetros y poder mostrar
los grácos resultantes. Se utilizó Excel para calcu-
lar las medidas de error (MSE, RMSE, MAE), así
como para determinar los elementos de la matriz
de confusión (Sensibilidad, Especicidad, Preci-
sión). Se empleó el SPSS para realizar la prueba
estadística R2. La evaluación estadística del modelo
se realizó utilizando la medida R2, la cual es am-
pliamente considerada como una de las pruebas
estadísticas más signicativas debido a su capa-
cidad para evaluar la correlación entre los valores
reales y los predichos. No se realizaron pruebas
estadísticas adicionales, a excepción de la prueba
R
2
, ya que el investigador creía que la prueba R
2
capturaba adecuadamente la signicación estadís-
tica del modelo. Además, cabe señalar que el PCA
se consideró inecaz. El modelo fue sometido a
una evaluación matemática utilizando diversas
medidas matemáticas signicativas, incluyendo
MAE, RMSE y MSE, para cuanticar el error del
modelo. Adicionalmente, la evaluación involucró
el examen de la matriz de confusión y sus métricas
asociadas, tales como Exactitud, Sensibilidad y
Especicidad. Estas medidas se emplearon para
comparar el desempeño del modelo GPR con el
de los modelos de aprendizaje profundo.
El alcance temporal y espacial de este estudio
no están disponibles, y como se indicó previamen-
te, estos datos se extrajeron de la base de datos de
Kaggle, y están disponibles en el siguiente enlace:
https://bit.ly/3DZxGr1. Lamentablemente, a
pesar de la importancia de estos dos aspectos,
los datos de que se disponen no proporcionan
información especíca sobre el alcance temporal
y espacial. Sin embargo, debido a la necesidad
de obtener resultados valiosos y signicativos y
a la ausencia de alternativas superiores, hemos
optado por conar en este conjunto de datos. El
conjunto de datos es notable, ya que su propie-
tario informa que posee los siguientes atributos:
datos bien documentados, bien mantenidos,
limpios y originales. Además, abarca un amplio
intervalo temporal, aunque no se especica el
período exacto. Este alcance nos permite eva-
luar la capacidad predictiva de los modelos en
el pronóstico de dicultades nancieras cuatro
años antes de su ocurrencia.
En la primera fase de este estudio se formulan
cinco tipos de modelos GPR, cada uno distin-
guido por el tipo de función Kernel empleado.
Posteriormente, estos modelos serán sometidos a
entrenamiento utilizando la muestra de entrena-
miento proporcionada, tras lo cual se realizará un
análisis comparativo para identicar el modelo
más óptimo que exhiba el valor mínimo de error.
A continuación, el modelo seleccionado pasará a
la segunda fase para su comprobación. Adicio-
nalmente, tras la evaluación de este modelo, se
formularán tipos adicionales de modelos utilizan-
do la misma función Kernel que logró los mejores
resultados en la fase anterior, pero variando en
términos de la función base empleada. Una vez
más, se llevará a cabo un proceso de selección
para determinar el modelo más óptimo, que luego
avanzará a la fase nal que requiere comparar
entre los modelos extraídos y los modelos de
aprendizaje automático comúnmente utilizados.
Al usar procesos gaussianos, se puede pro-
porcionar un buen marco para la regresión de
probabilidad (Yang et al., 2023). El método de
proceso Gaussiano ha resurgido recientemente
debido a la llegada de la inteligencia articial y el
aprendizaje automático basado en el núcleo. Estos
modelos proporcionan diversos usos en varias
áreas de la investigación y un método bayesiano
no lineal completo (Antunes et al., 2017). El GPR
es un modelo no paramétrico que depende de
la distribución de probabilidad de Gauss y se
dene como un conjunto de variables aleatorias.
Cada número nito GP de esta variable aleatoria
tiene una distribución gaussiana común. Por lo
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
279
tanto, el GP se especica completamente por la
estadística de segundo orden:
f(x) ~ GP(m (x), k (x, x′)) (1)
Donde m(x) y k(x,x′) son las funciones de co-
varianza y media de un proceso real f(x), respec-
tivamente (Ferkousl et al., 2021). Solo dene las
funciones de covarianza y media para simplicar
una función de un proceso gaussiano. La función
de la covarianza k modela la variabilidad articu-
lar de las variables aleatorias del proceso gaus-
siano, y devuelve la covarianza modelada entre
el par de entradas (Herfurth, 2020). El proceso
gaussiano es un método robusto no paramétrico
con modelos de incertidumbre precisos, utiliza-
do principalmente en temas de clasicación y
regresión. No es paramétrico porque el proceso
gaussiano trata de inferir cómo todos los datos
medidos están correlacionados en lugar de ajustar
los parámetros de las funciones de base elegidas
(Wang et al., 2023). Un proceso Gaussiano es un
método de regresión probabilístico operativo,
originalmente pionero en estadística y geofísica,
que desde entonces ha encontrado una sólida
base de usuarios en el aprendizaje automático.
Un proceso gaussiano, considerado una técnica
de regresión probabilística, toma un núcleo y un
conjunto de datos como entrada y da la distribu-
ción de una función como salida (Asante-Okyere
et al., 2018).
La GPR puede considerarse como una gene-
ralización de la regresión lineal bayesiana más
estándar, y de manera similar, la clasicación
del proceso Gaussiano puede considerarse como
una generalización de la regresión logística. La
activación de la función logística fue dada por a
= wT φ (x). Por lo tanto, se puede permitir que
los procesos gaussianos no linealicen la función
manipulando directamente el espacio de funcio-
nes (Hamoudi et al., 2023). Por lo tanto, podemos
reemplazar el modelo lineal wT φ (x(n)) con un
proceso gaussiano f considerando el conjunto
de variables latentes para n {1, N}. Además,
estamos interesados en la probabilidad de perte-
nencia de π (x) = p (y = 1| x) = σ (f (x)) dada
una observación x. El proceso de inferencia se
realiza de forma similar al anterior, por lo que la
distribución de f se calcula como:
p (f|D) = ʃ p (f|D,f) p (f|D) ∂f (2)
Donde p (f|D) p (D|f) p(f) es la posterior
obtenida mediante la aplicación de la regla de
Bayes (Taki et al., 2018).
Debido a la función de la covarianza, hacer
predicciones para nuevos puntos de prueba es
sencillo, porque se trata de manipular matrices
algebraicas. Sin embargo, en la aplicación proce-
sal, puede ser necesario reconocer qué función
de covarianza utilizar. Por supuesto, la conabi-
lidad de la regresión depende de qué tan bien se
seleccionaron los parámetros requeridos por la
función de covarianza elegida (Wang et al., 2023).
Resultados
En esta sección, presentaremos los resultados
obtenidos a través de la experimentación y discu-
tiremos estos resultados con claridad. Después de
haber organizado y distribuidos los datos en una
muestra de capacitación y una muestra de prueba,
procederemos a construir y desarrollar múltiples
modelos para evaluar su capacidad para predecir
dicultades nancieras. Sin embargo, en primer
lugar, se llevará a cabo un examen exhaustivo
de los datos. Para ilustrar los datos se utilizan
diagramas de cajas por varias razones. En primer
lugar, los diagramas de cajas ofrecen información
valiosa sobre la dispersión o variabilidad de los
datos. En segundo lugar, proporcionan abili-
dad de la distribución de los valores. En tercer
lugar, ayudan a identicar las regiones en las
que los valores de la muestra están más densa-
mente agrupados o son más escasos. Debido al
gran número de variables independientes, con-
cretamente 83, no es práctico crear un diagrama
de caja independiente para cada variable. Por lo
tanto, mostraremos selectivamente el diagrama
de caja para un conjunto especíco de variables, a
saber, X1, X2, X6, X24, X30 y X81, elegidos al azar
solo con nes ilustrativos. La gura 1 muestra
los valores atípicos, representados en rojo, que
se observan en dos áreas de la gura, ya sea que
superen el valor máximo después de excluir los
valores atípicos o que estén por debajo del valor
mínimo después de excluir los valores atípicos.
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
280 Amine Sabek y Jakub Horák
Figura 1
Diagrama de cajas de Whiskers
La tabla 2 ilustra las características de diseño
de los modelos GPR y ofrece una visión gene-
ral clara de todos los detalles, como se indica a
continuación.
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
281
Tabla 2
Variables del proceso de diseño
Función Kernel Función de
base
Sigma del
núcleo
Núcleo
isotrópico Estandarizado Optimiza parámetros
numéricos
Cuadrática racional Constante 0,3517075 Verdadero Verdadero Verdadero
Cuadrado
Exponencial Constante 0,3517075 Verdadero Verdadero Verdadero
Matern 5/2 Constante 0,3517075 Verdadero Verdadero Verdadero
Exponencial Constante 0,3517075 Verdadero Verdadero Verdadero
Matern 3/2 Constante 0,3517075 Verdadero Verdadero Verdadero
La tabla 2 presenta el objetivo principal de la
investigación en el diseño de diversos modelos
de GPR con el n de comparar sus resultados e
identicar el modelo más óptimo. Es importante
resaltar que a lo largo de la fase de diseño, todos
los parámetros permanecieron jos y no se vieron
afectados por las variaciones en el tipo de función
Kernel. Además, se omitieron del análisis varios
campos no esenciales, como la velocidad de pre-
dicción y el tiempo de entrenamiento, ya que
tuvieron menos importancia. Como se muestra
en la tabla 2, durante la primera fase, se utilizó
la función PCA para extraer los componentes
principales y reducir el número de predictores,
debido a la incorporación sustancial de ratios
nancieros. Al usar esta técnica ampliamente
reconocida e indispensable, se pueden eliminar
efectivamente las variables que no contribuyen a
los objetivos de la investigación y que dicultan
el logro de predicciones precisas con respecto a
las dicultades nancieras. Los resultados ob-
tenidos del entrenamiento de los modelos GPR
posteriores a la activación de la técnica PCA se
presentan en la tabla 3.
Tabla 3
Resultados del entrenamiento utilizando la técnica PCA
Función Kernel RMSE MSE MAE R2
Cuadrática racional 0,497 0,247 0,494 0,00
Cuadrado Exponencial 0,497 0,247 0,494 0,00
Matern 5/2 0,497 0,247 0,494 0,00
Exponencial 0,492 0,242 0,483 0,02
Matern 3/2 0,497 0,247 0,494 0,00
Para medir el valor de error se utilizaron
los valores de raíz de error cuadrático medio
(RMSE), error cuadrático medio (MSE) y error
absoluto medio (MAE). Se empleó el coeciente
de determinación, denominado R
2
, como métrica
estadística para evaluar la calidad del modelo
y comprender la correlación entre las variables
independientes y la variable dependiente, así
como la correlación entre los valores observados
y los valores predichos. Al analizar la tabla 3, se
observó que los resultados obtenidos podrían
haber sido más satisfactorios. Sin embargo, estos
resultados son inadecuados para ir a la segunda
fase, es decir, a las “pruebas”. En esta fase, se
observó que las medidas de precisión de pre-
dicción eran excesivamente elevadas y eran casi
idénticas en todos los modelos. De igual forma,
los valores de R2 fueron casi nulos para todos
los modelos, indicando una falta de correlación
entre los predictores y la variable dependiente,
haciendo que los modelos sean estadísticamente
insignicantes. Por lo tanto, esto sugiere la posi
-
bilidad de un desequilibrio producto del uso de
la técnica de análisis de componentes principales
(PCA), pero es contradictorio, ya que la técnica
PCA normalmente contribuye a reducir el error y
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
282 Amine Sabek y Jakub Horák
mejorar la calidad de la predicción. Por lo tanto,
hay que investigar las causas de las medidas de
error y la ausencia del coeciente de determina-
ción, por lo que el siguiente paso es descartar la
técnica de PCA y evaluar si los resultados mejo-
ran o empeoran. Posteriormente, en la tabla 4, se
descarta la técnica PCA, lo que arroja el siguiente
conjunto de resultados.
Tabla 4
Resultados del entrenamiento sin utilizar la técnica PCA
Kernel, función RMSE MSE MAE R2
Cuadrática racional 0,369 0,136 0,297 0,45
Exponencial cuadrado 0,372 0,138 0,303 0,44
Matern 5/2 0,371 0,138 0,299 0,44
Exponencial 0,370 0,137 0,295 0,45
Matern 3/2 0,371 0,137 0,298 0,44
Al analizar la tabla 4, se observa una dismi-
nución notable de los valores de las medidas de
precisión de la predicción, lo que sugiere una
disminución de las tasas de error. Esto signica
una mejora en la calidad de la predicción de los
modelos, que se ve corroborada por el aumento
sustancial de los valores de R2. Sin embargo, es
importante señalar que estos valores no se acer-
caron a 1, sino que se mantuvieron considera-
blemente alejados de cero. En consecuencia, los
modelos han alcanzado signicancia estadísti-
ca y pueden explicar efectivamente la relación
entre los predictores y la variable dependiente
con un coeciente de correlación de 0,444. Por
lo tanto, podemos inferir que el uso del Análi-
sis de Componentes Principales (PCA) contri-
buyó principalmente al desempeño por debajo
del estándar de los modelos. Al comparar las
medidas de precisión de predicción, es evidente
que el modelo inicial que utiliza la función de
núcleo cuadrático racional presenta valores de
error más bajos en comparación con los otros
modelos, así como valores R2 más altos. Además,
este modelo alcanza el nivel más alto de signi-
cación estadística. Por lo tanto, no tendremos en
cuenta los modelos restantes y optaremos por
emplear este modelo para realizar pruebas en
la fase posterior. Los resultados de las pruebas
del modelo cuadrático racional, basados en las
mismas medidas mencionadas anteriormente, se
presentan en la tabla 5.
Tabla 5
Resultados de las pruebas (globales)
Función Kernel RMSE MSE MAE R2Precisiónn
Cuadrática racional 0,380 0,144 0,318 0,42 0,80
En la tabla 5 se muestran los resultados obte-
nidos tras probar el modelo cuadrático racional
utilizando la muestra de prueba. Se observó que
las medidas de precisión de la predicción aumen-
taron en comparación con la fase de capacitación,
lo que era de esperarse. Por otro lado, resulta
positivo porque los valores de error aumentaron
solo ligeramente, y esto indica que el modelo fue
capaz de construir la fórmula adecuada que sirva
al objetivo del estudio, y esto se puede conrmar
por la tasa de precisión de predicción del 80 %,
que es una tasa muy apropiada y reeja la forta-
leza del modelo en la predicción de dicultades
nancieras. Para aclarar aún más los resultados
de la prueba del modelo, nos basaremos en la
gura 2 y la tabla 6 para proporcionar informa-
ción más detallada.
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
283
Figura 2
Trazado Previsto Vs. Real (RQ-Constante)
Tabla 6
Resultados de las pruebas (en particular)
Función Kernel Año RMSE MSE MAE R2
Cuadrática
racional
N-1 0206 0042 0087 0,31
N-2 0183 0033 0075 0,45
N-3 0174 0,0305 0072 0,52
N-4 0194 0037 0082 0,39
Se evaluó la precisión del modelo para pre-
decir las dicultades nancieras en diferentes
momentos: un año antes de que se produjeran,
dos años después, tres años después y cuatro
años después. Cabe destacar que los valores de
error fueron más altos en el primer año, junto
con una clara disminución en el valor R2, lo que
resulta inquietante pues se esperaba que el des-
empeño del modelo de clasicación en el año
inicial fuera superior a los años subsiguientes,
y luego comenzara a disminuir gradualmente,
sin embargo, la calidad de la predicción mejoró
cuanto más lejos se encontraba la posibilidad de
que se produjera la crisis. Por lo tanto, se puede
decir que el modelo es prometedor porque logró
resultados relevantes, y por lo tanto optimizare
-
mos los hiperparámetros del modelo para mejorar
los resultados. Matlab nos permite realizar varias
modicaciones en la fase de diseño del modelo
y antes de entrenarlo. Tal vez una característica
esencial que se puede modicar está relacionada
con la función principal porque hemos hecho
varias otras modicaciones. Sin embargo, sin
obtener resultados deseados, por lo que no es
necesario comentar sobre estas modicaciones.
Como se muestra en la tabla 7, el programa ofrece
tres tipos de funciones de base, lo que permite
la construcción de tres nuevos modelos de GPR
basados en estas funciones. Sin embargo, solo se
crearán dos nuevos modelos, ya que el modelo
cuadrático racional que utiliza la función de base
constante ya se ha construido en la fase anterior.
Tabla 7
Optimización de hiperparámetros GPR-RQ (resultados del entrenamiento)
Función de base RMSE MSE MAE R2
Constante 0,369 0,136 0,297 0,45
Cero 0,368 0,136 0,296 0,45
Lineal 267,13 71356 11,273 -287973
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
284 Amine Sabek y Jakub Horák
Los resultados de capacitación del modelo de
relaciones lineales arrojaron resultados insatis-
factorios, por lo que se omiten. Con base en los
resultados de entrenamiento de los dos modelos
restantes, se observa que tanto los valores de error
como los valores de R2 muestran convergencia,
aunque el modelo Cero ha mostrado un desem-
peño ligeramente superior. Estos hallazgos nos
llevan a la fase de prueba y al análisis compara-
tivo de los dos modelos, ya que los resultados de
la capacitación han indicado el potencial para me-
jorar la precisión del modelo cuadrático racional.
Los resultados descritos en la tabla 8 presentan
los siguientes resultados.
Tabla 8
Resultados de las pruebas (globales)
Función de base RMSE MSE MAE R2Sensibilidad Especificidad Precisión
Constante 0,380 0,144 0,318 0,42 0,82 0,78 0,80
Cero 0377 0142 0315 0,43 0,83 0,79 0,81
Cabe señalar que el modelo RQ-Cero mostró
un rendimiento superior en comparación con
el modelo RQ-Constante en todas las métricas
presentadas en la tabla 7. Por lo tanto, los resul-
tados han mejorado, aunque marginalmente.
Para obtener una visión más completa de los
resultados de las pruebas para ambos modelos,
utilizaremos la gura 3 y la tabla 9 para presen-
tar información más compleja y detallada. Pre-
sentamos las cifras de los modelos Constant-GPR
y Zero-GPR, porque los resultados de estos dos
modelos resultaron valiosos en comparación
con los modelos anteriores. Esperamos aclarar
la diferencia entre los dos modelos a través del
gráco residual, pero como se observa, la gura
3 no muestra una diferencia signicativa entre
los dos modelos debido a la convergencia de
los resultados.
Figura 3
Trazado residual
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
285
Tabla 9
Resultados de los ensayos (en particular)
Función de base Año RMSE MSE MAE R2
Constante
N-1 0206 0042 0087 0,31
N-2 0183 0033 0075 0,45
N-3 0174 0,0305 0072 0,52
N-4 0194 0037 0082 0,39
Cero
N-1 0204 0042 0086 0,32
N-2 0182 0033 0075 0,45
N-3 0172 0029 0072 0,53
N-4 0193 0037 0081 0,40
De acuerdo con los datos presentados en la
tabla 9, toda la evidencia disponible sugiere la
superioridad del modelo RQ-Cero. Vale la pena
señalar que un problema similar encontrado en
el primer modelo también ocurrió en el modelo
RQ-Cero, donde los valores de error fueron más
altos en el primer año. Esta tendencia también
puede observarse en el valor R2, ya que se pre-
veía que la capacidad de clasicación del modelo
sería mayor en el primer año y disminuiría gra-
dualmente en los años siguientes. En este caso
se observó lo contrario. En la etapa nal, una
vez identicado el modelo óptimo a partir de
los modelos GPR, se procedió a comparar este
modelo seleccionado con modelos de aprendizaje
profundo como el modelo del árbol de decisiones,
discriminante lineal, regresión logística, máquina
de vectores de soporte y K-vecino más cercano.
Tabla 10
Comparación de los modelos de aprendizaje profundo
Modelo RMSE MSE MAE R2Sensibilidad Especificidad Precisión
GPR-RQ-Cero 0377 0142 0315 0,43 0,83 0,79 0,81
Árbol de decisión 0539 0290 0290 0,17 0,68 0,73 0,71
Discriminante lineal 0503 0253 0253 0,24 0,78 0,71 0,75
Regresión logística 0506 0256 0256 0,24 0,72 0,77 0,74
Svm 0436 0190 0190 0,38 0,87 0,74 0,81
K-nn 0539 0290 0290 0,17 0,65 0,71 0,68
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
286 Amine Sabek y Jakub Horák
Este resultado fue inesperado, particularmente
en el contexto de la comparación del modelo de
GPR con los modelos de aprendizaje profundo
comúnmente utilizados para clasificar. Cabe
destacar que el modelo RQ-Cero demostró un
mejor rendimiento, situándolo a la vanguardia
de los rankings junto al modelo Svm. Este logro
es signicativo, ya que los modelos RQ-Cero han
demostrado su capacidad para aprender efec-
tivamente y lograr resultados de clasicación
apropiados. Además, se han observado ligeras
distinciones entre los modelos Svm y RQ-Cero, lo
que diculta la determinación del modelo óptimo
entre ellos, especialmente debido a la precisión
de clasicación equivalente que muestran.
Discusión y conclusión
Se encontró que resulta necesario realizar más
encuestas que se centren en la predicción de di-
cultades nancieras utilizando el método de
regresión de Gauss. Por esta razón, el siguiente
texto se centrará en los resultados de las encues-
tas dedicadas a predecir la crisis nanciera de la
empresa a través de diversos métodos. En primer
lugar, podemos mencionar el estudio de Jeong y
Kim (2022), que diseñaron un modelo para pre-
decir las dicultades nancieras de las empresas
constructoras, considerando tres, cinco y siete
años antes del punto de predicción. Para cons-
truir el modelo de predicción, eligieron la razón
nanciera como variable de entrada adicional,
adoptada en estudios existentes de predicciones
de mediano a largo plazo en otras industrias.
Analizaron el desempeño de modelos monomá-
quicos y de ensamble para comparar el desempe-
ño de modelos de predicción. Esta comparación
se basó en el valor promedio del rendimiento
de la predicción y los resultados de la prueba de
Friedman. El desarrollo de la comparación deter-
minó que el modelo del subespacio aleatorio (RS)
mostró el mejor desempeño en la predicción de la
situación nanciera de las empresas constructoras
en el mediano a largo plazo.
Rahman et al. (2021), a su vez, investigaron
la aplicación de un modelo predictivo de di-
cultades nancieras, que utiliza el método de
puntuación F incluidos sus componentes, con el
n de identicar a las empresas con un alto riesgo
de fracaso. El conjunto de datos se creó sobre la
base de datos de investigación de quiebres de
UCLA-LoPucki, donde 81 empresas estadou-
nidenses con cotización ocial en dicultades
nancieras fueron monitoreadas especícamente
durante el período 2009-2017. La encuesta conclu-
que la relación entre la puntuación F y la pro-
babilidad de que una empresa sufra dicultades
nancieras es signicativa. Entre otras cosas, los
resultados también muestran que las empresas
en crisis tienen un ujo de caja negativo de las
operaciones (CFO) y muestran una disminución
más signicativa en la rentabilidad de los activos
(ROA) en el año anterior al quiebre.
Como parte de su investigación, Chen y Shen
(2020) aplicaron métodos híbridos de aprendizaje
automático que integran árboles de regresión
escalonada, regresión y clasicación, selección
y el operador de encogimiento menos absolu-
to, y bosques aleatorios, y utilizaron todos estos
métodos para crear modelos con los que será
posible predecir las dicultades nancieras de
la empresa. Para la investigación se utilizaron un
total de 14 variables nancieras y seis variables
no nancieras. Los resultados muestran que el
modelo CART-LASOO tiene el mayor nivel de
precisión, concretamente el 89,74 %. También se
puede mencionar el estudio de Chen y Du (2009),
que utilizaron la minería de datos y la agrupación
de redes neuronales para predecir las dicultades
nancieras, aplicando 33 variables de carácter
nanciero y cuatro variables de carácter no -
nanciero. Las conclusiones del estudio muestran
que los modelos diseñados con redes neuronales
articiales logran una mejor precisión. Con el n
de predecir dicultades nancieras, el método de
Gregorova et al. (2020) - LR (regresión logística),
RF (bosques aleatorios) y NN (redes neuronales),
usaron 14 ratios nancieros y obtuvieron el mejor
desempeño en el modelo NN con un resultado de
precisión de 88,6 %. Chen y Jhuang (2020), que
también utilizan los métodos ANN y CHAID,
SR-C5.0, fueron responsables de otro modelo uti-
lizado para predecir dicultades nancieras. Los
autores usaron 18 variables de carácter nancie-
ro y tres variables no nancieras, y encontraron
que el modelo SR-C5.0 presentó el mayor nivel
de precisión. La tasa de precisión global fue del
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
287
91,65 %. El objetivo principal del estudio de Jan
(2021) fue crear modelos altamente ecientes y
precisos que sean capaces de predecir la dicultad
nanciera utilizando redes neuronales profun-
das (DNN) y redes neuronales convolucionales
(CNN). Con base en los resultados, los autores
concluyeron que la tasa de precisión más alta de
la predicción de dicultades nancieras es del
94,23 % y la tasa de error más baja de tipo I y la
tasa de error de tipo II son del 0,96 % y el 4,81 %,
respectivamente.
Gracias a los resultados anteriores, ahora es
posible proceder con las respuestas a las pregun-
tas de investigación.
¿Es el modelo GPR adecuado para pre-
decir dicultades nancieras?
Aunque, según el análisis de la literatura
existente, el modelo de GPR no es una
herramienta ampliamente utilizada en la
práctica para las dicultades nancieras,
los resultados de esta encuesta muestran
que el modelo de GPR es excelente para
estas necesidades. Esto se debe principal-
mente a que el modelo logra resultados
muy satisfactorios, con una precisión de
clasicación del 81 %.
¿Se contrapone el modelo GPR con el mo-
delo de regresión logística para predecir
dicultades nancieras?
Después de comparar los resultados de este
modelo con los modelos de aprendizaje profundo,
y el modelo de regresión lineal, se encontró que el
modelo GPR superó a este modelo comúnmente
utilizado. Como se mencionó anteriormente, el
modelo GPR alcanzó una precisión de clasica-
ción del 81 %, mientras que el modelo de regre-
sión lineal alcanzó solo el 74 %.
En la primera fase se identicó el modelo más
adecuado entre los modelos GPR comparando
sus funciones Kernel y el modelo fue el RQ. En
la fase posterior, enfocada a mejorar el desem-
peño del modelo a través de la optimización de
hiperparámetros, se logró identicar el modelo
óptimo a partir de los modelos GPR con base en
la variación de la función Base, que se denominó
RQ-Cero. Después de comparar los resultados de
este modelo con los resultados de otros modelos
de aprendizaje profundo, concluimos que el ren-
dimiento del modelo fue excelente porque logró
resultados muy relevantes, ya que superó a todos
los otros modelos utilizados comúnmente con el
modelo SVM, y esto nos lleva a plantearnos la
siguiente pregunta, ¿por qué no se ha probado
el modelo GPR en la predicción de dicultades
nancieras basado en la diferencia del tamaño
y el tipo de muestra de prueba de una manera
que lo hace comúnmente utilizado en la predic-
ción de dicultades nancieras o la predicción
de quiebres? También se concluye que existe una
relación inversa entre los valores de error y R2,
ya que cuantos menores sean los valores de error,
mayor será el valor R2, lo que indica la precisión y
calidad del modelo en la predicción de dicultades
nancieras. Por otro lado, la técnica PCA no logró
el objetivo deseado, ya que se logró una mejora en
los resultados después de deshabilitar esta técnica.
Finalmente, se recomienda probar el modelo GPR
en la predicción de dicultades nancieras con
base en una muestra de estudio diferente.
Los hallazgos de esta investigación subrayan
la importancia de predecir las dicultades nan-
cieras mediante el uso del GPR, que ha demostra-
do una gran capacidad para una predicción preci-
sa, particularmente cuando sus hiperparámetros
son optimizados. Este modelo ha demostrado
un rendimiento superior en comparación con
otros modelos de aprendizaje profundo y está
a la par con las máquinas vectoriales de soporte
(SVM), que en mismo es un logro digno de
mencionar. Hasta donde sabemos, la GPR es una
técnica poco utilizada en el contexto de la predic-
ción de dicultades o quiebres. Por lo tanto, este
estudio pretende alterar las perspectivas de los
investigadores sobre la utilización de la GPR en
este dominio. Mediante la exploración de nuevas
variaciones de los modelos de GPR y su someti-
miento a nuevas y diversas muestras de estudio,
es posible identicar y abordar las limitaciones
de investigaciones anteriores, incluyendo el pre-
sente estudio. Tales esfuerzos pueden ampliar
los resultados y benecios para todos los inte-
resados involucrados en este tema, incluyendo
prestamistas, auditores, inversionistas, entidades
gubernamentales y, en particular, empresas, de-
© 2023, Universidad Politécnica Salesiana, Ecuador
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
288 Amine Sabek y Jakub Horák
bido a que la continuidad de una empresa está
interconectada con la estabilidad general de la
economía del Estado. Predecir con precisión las
dicultades nancieras de una empresa facilita el
mantenimiento de la prosperidad, minimiza las
pérdidas, aumenta las tasas de inversión, preserva
las oportunidades de empleo, evita los despidos
y mantiene un entorno mutuamente benecioso
para todas las partes involucradas.
Apoyos y soporte financiero
de la investigación
Esta investigación fue nanciada por el Insti-
tuto de Tecnología y Negocios en České Budějo-
vice, el proyecto: IVSUZO2301 - El impacto de la
economía circular en los precios de las acciones de
las empresas que cotizan en la bolsa de valores.
Referencias bibliográficas
Asante-Okyere, S., Shen, C., Ziggah, Y. Y., Rulegeya,
M. M. y Zhu, X. (2018). Investigating the
predictive performance of Gaussian process
regression in evaluating reservoir porosity
and permeability. Energies, 11.
https://doi.org/10.3390/en11123261
Bonello, J., Brédart, X. y Vella, V. (2018). Machine lear-
ning models for predicting financial distress.
Journal of Research in Economics, 2, 174-185.
https://doi.org/10.24954/JORE.2018.22
Chen, S. y Shen, Z. D. (2020). Financial distress pre-
diction using hybrid machine learning techni-
ques. Asian Journal of Economics, Business and
Accounting, 16, 1-12.
https://bit.ly/4iTnlPn
Chen, S. D. y Jhuang, S. (2018). Financial distress pre-
diction using data mining techniques. ICIC
Express Letters, Part B: Applications, 9(2), 131-
136. https://bit.ly/3qH5eHc
Chen, W.-S. y Du, Y.-K. (2009). Using neural networks
and data mining techniques for the financial
distress prediction model. Expert Systems with
Applications, 36(2), 4075-4086.
https://doi.org/10.1016/j.eswa.2008.03.020
Costa, M., Lisboa, I. y Gameiro, A. (2022). Is the finan-
cial report quality important in the default
prediction? SME Portuguese Construction
Sector Evidence. Risks, 10(5).
https://doi.org/10.3390/risks10050098
Ferkousl, K., Chellalil, F., Kouzoul, A. y Bekkar, B.
(2021). Wavelet-Gaussian process regression
model for forecasting daily solar radiation in
the Saharan climate. Clean Energy, 5(2), 316-
328. https://doi.org/10.1093/ce/zkab012
Gavurova, B., Belas, J., Bilan, Y. y Horak, J. (2020). Study
of legislative and administrative obstacles
to SMEs business in the Czech Republic and
Slovakia. Oeconomia Copernicana, 11(4), 689-
719. https://doi.org/10.24136/OC.2020.028
Gregova, E., Valaskova, K., Adamko, P., Tumpach, M.
y Jaros, J. (2020). Predicting financial distress
of slovak enterprises: comparison of selected
traditional and learning algorithms methods.
Sustainability, 12(10).
https://doi.org/10.3390/su12103954
Hamoudi, Y., Amimeur, H., Aouzellag, D., Abdolraso,
M. G. M. y Ustun, T. S. (2023). Hyperparameter
bayesian optimization of Gaussian process
regression applied in speed-sensorless pre-
dictive torque control of an autonomous wind
energy conversion system. Energies, 16(12).
https://doi.org/10.3390/en16124738
Hantono, H. (2019). Predicting financial distress using
Altman score, Grover score, Springate score,
Zmijewski score (case study on consumer goods
company). Accountability, 8(1), 1-16.
https://doi.org/10.32400/ja.23354.8.1.2019.1-16
Herfurth, H. (2020). Gaussian process regression in
computational finance. Project Report, Uppsala
University, 1-29. https://bit.ly/3KGoUSk
Horak, J., Vrbka, J. y Suler, P. (2020). Support vector
machine methods and artificial neural networ-
ks used for the development of bankruptcy
prediction models and their comparison.
Journal of Risk and Financial Management, 13(3).
https://doi.org/10.3390/jrfm13030060
Jan, C. l. (2021). Financial information asymmetry:
using deep learning algorithms to predict
financial distress. Symmetry, 13(3).
https://doi.org/10.3390/sym13030443
Jeong, J. y Kim, C. (2022). Comparison of machine
learning approaches for medium-to-long-term
financial distress predictions in the construc
-
tion industry. Buildings, 12(10).
https://doi.org/10.3390/buildings12101759
Kliestik, T., Vrbka, J. y Rowland, Z. (2018). Bankruptcy
prediction in Visegrad group countries using
multiple discriminant analysis. Equilibrium-
Quarterly Journal of Economics and Economic
Policy, 13(3), 569-593.
https://doi.org/10.24136/eq.2018.028
Krulicky, T. y Horak, J. (2021). Business performan-
ce and financial health assessment through
Artificial Intelligence. Ekonomicko - manažerské
spektrum, 15(2), 38-51.
Optimización de hiperparámetros de regresión del proceso gaussiano para predecir problemas nancieros
Retos, 13(26),273-289
ISSN impreso: 1390-6291; ISSN electrónico: 1390-8618
289
Liew, K. F., Lam, W. S. y Lam, W. H. (2023). Financial
distress analysis of technology companies
using grover model. Computer Sciences &
Mathematics Forum, 7(1).
https://doi.org/10.3390/IOCMA2023-14405
Liu, Y., Chen, K., Kumar, A. y Patnaik, P. (2023).
Principles of machine learning and its applica-
tion to thermal barrier coatings. Coatings, 13(7).
https://doi.org/10.3390/coatings13071140
Paule-Vianez, J. (2019). Bayesian networks to predict
financial distress in spanish banking. Revista
Electrónica de Comunicaciones y Trabajos de
ASEPUMA, 20, 131-152.
https://doi.org/10.24309/recta.2019.20.2.02
Qu, Y., Quan, P., Lei, M. y Shi, Y. (2019). Review of
bankruptcy prediction using machine lear-
ning and deep learning techniques. Procedia
Computer Science, 162, 895-899.
https://doi.org/10.1016/j.procs.2019.12.065
Rahman, M., Sa, C. L. y Masud. M. A. K. (2021).
Predicting firms’ financial distress: an empi-
rical analysis using the F-Score Model. Journal
of Risk and Management, 14(5).
https://doi.org/10.3390/jrfm14050199
Shi, Y. y Li, X. (2019). An overview of bankruptcy pre-
diction models for corporate firms: A systema-
tic literature review. Intangible Capital Journal,
15(2), 1866-1875.
https://doi.org/10.3926/ic.1354
Taki, M., Rohani, A., Soheili-Fard, F. y Abdeshahi, A.
(2018). Assessment of energy consumption
and modeling of output energy for wheat
production by neural network (MLP and
RBF) and Gaussian process regression (GPR)
models. Journal of Cleaner Production, 172, 3028-
3041.
https://doi.org/10.1016/j.jclepro.2017.11.107
Vochozka, M., Vrbka, J. y Suler, P. (2020). Bankruptcy
or success? The effective prediction of a com-
pany’s financial development using LSTM.
Sustainability, 12(18).
https://doi.org/10.3390/su12187529
Wang, S., Gong, J., Gao, H., Liu, W. y Feng, Z. (2023).
Gaussian process regression and cooperation
search algorithm for forecasting nonstationary
runoff time series. Water, 15(11).
https://doi.org/10.3390/w15112111
Yang, Z., Li, X., Yao, X., Sun, J. y Shan, T. (2023).
Gaussian Process Gaussian Mixture PHD fil-
ter for 3D multiple extended target Tracking.
Remote Sensing, 15(13).
https://doi.org/10.3390/rs15133224
Zhou, T., Song, Z. y Sundmacher, K. (2019). Big data
creates new opportunities for materials
research: a review on methods and applica-
tions of machine learning for materials design.
Engineering, 5, 1017-1026.
https://doi.org/10.1016/j.eng.2019.02.011