Introdução ao Estudo de Geração de Dados Sintéticos para Aplicação em Interfaces Neurais Interativas
Introdução ao Estudo de Geração de Dados Sintéticos para Aplicação em Interfaces Neurais Interativas
Este trabalho investiga o uso de dados sintéticos para o desenvolvimento de Interfaces Neurais Interativas (INI), uma fronteira entre homem e computador que integra Inteligência Artificial (IA) e interação natural do usuário. A modelagem eficaz das INI requer grande quantidade de dados de treinamento, muitas vezes difíceis, caros e escassos de coletar. A geração de dados sintéticos surge como solução promissora, permitindo ampliar a quantidade e diversidade de dados, criar conjuntos personalizados e testar/avaliar sistemas em ambientes seguros. O estudo explorou diferentes abordagens, como Generative Adversarial Networks (GANs), métodos estatísticos (Monte Carlo) e a plataforma Mostly AI, onde foram trabalhados quatro modelos de redes neurais artificiais, parametrizadas de maneiras distintas. Dentre estes, um modelo se mostrou mais aderente à geração de dados sintéticos. A base de dados real utilizada para o estudo foi coletada e fornecida pela Universidade de Tübingen, Instituto de Psicologia Médica e Neurobiologia Comportamental (Niels Birbaumer), referentes ao desafio da II Competição de Interfaces Cérebro-Computador realizada no ano 2002. Os resultados demonstraram a viabilidade da geração de dados neurais sintéticos com estatísticas satisfatórias, validados por métricas como a distância de Kullback-Leibler, a distribuição univariada e a distribuição bivariada. Isso indica que os dados sintéticos possuem características semelhantes aos reais, permitindo seu uso em diversas aplicações de INI. Em conclusão, o domínio de técnicas de modelagem de dados sintéticos é fundamental para o desenvolvimento de Sistemas Inteligentes robustos e eficientes, abrindo caminho para aplicações mais eficazes e inovadoras em diversas áreas.
Dados sintéticos, inteligência artificial, interfaces neurais interativas, sistemas inteligentes.
João Paulo de Oliveira Macedo is a postgraduate student at the Faculty of Electrical and Computer Engineering – State University of Campinas – Brazil. He is currently a professor at CEETEPS – Brazil and a Teaching Support Professional for Research and Extension at UNICAMP. His research interests are in the areas of synthetic data, intelligent systems and artificial intelligence.
Gilmar Barreto has received a PhD. from State University of Campinas – Brazil. He is currently a professor at the State University of Campinas – Brazil. Her research interests are in the areas of fuzzy systems, multivariable systems, control, multiobjective optimization, electrochemistry and data modeling.
Paulo Victor de Oliveira Miguel has received a PhD. from State University of Campinas – Brazil. He is currently a professor at the State University of Campinas – Brazil. Her research interests are in the areas of synthetic data, artificial intelligence, computational semiotics, neuroscience and education.
Birbaumer, N. (2006). Breaking the silence: brain–computer interfaces (BCI) for communication and motor control. Psychophysiology, 43(6), 517-532.
Blankertz, B. (2002). BCI Competition II. Retrieved from https://www.bbci.de/competition/ii/.
Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., … & Amodei, D. (2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.
Corrar, L. J. (1993). O modelo econômico da empresa em condições de incerteza aplicação do método de simulação de Monte Carlo. Caderno de estudos, 01-11.
Creswell, A., White, T., Dumoulin, V., Arulkumaran, K., Sengupta, B. & Bharath, A. A. (2018). Generative adversarial networks: An overview. IEEE signal processing magazine, 35(1), 53–65.
Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. Proceedings of the Advances in Neural Information Processing Systems Conference, 2672-2680.
Jordon, J., Szpruch, L., Houssiau, F., Bottarelli, M., Cherubin, G., Maple, C., … & Weller, A. (2022). Synthetic Data–what, why and how?. arXiv preprint arXiv:2205.03257.
Karras, T., Aila, T., Laine, S., & Lehtinen, J. (2017). Progressive Growing of gans for Improved Quality, Stability, and Variation. arXiv, preprint arXiv:1710.10196.
Miguel, P. V. O. (2010). ECOLIG – O Protocolo Semiótico para Comunicação Homem-Máquina que Utiliza Interfaces do tipo Cérebro-Computador (Tese de doutorado). Universidade Estadual de Campinas (UNICAMP). Recuperado de https://repositorio.unicamp.br/Busca/Download?codigoArquivo=467129
Raghunathan, T. E. (2021). Synthetic data. Annual review of statistics and its application, 8, 129-140.