Programa

Detalhamento:

Dia 1 - A Complexidade do Processamento de Linguagem Natural: Um Painel Interdisciplina: Neste primeiro encontro, os participantes serão introduzidos à complexidade do Processamento de Linguagem Natural (PLN) a partir de um olhar interdisciplinar. Com base em pesquisas e abordagens de diferentes áreas, discutiremos como o PLN emerge da intersecção entre a Linguística, a Ciência da Computação e as Ciências Sociais.
 

Dia 2 - PLN e Ciências Sociais: Aplicações e Debates: O segundo dia será dedicado à interseção entre PLN e Ciências Sociais. A partir de trabalhos e pesquisas realizados principalmente em Ciência Política, exploraremos como ferramentas computacionais podem ser aplicadas no contexto de métodos quantitativos e qualitativos para as humanidades.

Dia 3 - Estado da Arte e Questões Linguísticas no PLN: Neste dia, abordaremos os principais avanços e desafios da linguística computacional aplicada ao PLN. Investigaremos como teorias linguísticas, especialmente aquelas relacionadas à semântica, pragmática, semiótica e análise do discurso, influenciam a construção de modelos para a análise de subjetividade em textos.

Dia 4 - Algoritmos, Codificação e Horizontes da Ciência da Computação no PLN: O último dia será focado em aspectos técnicos do PLN, que abrangem desde a construção de modelos de aprendizado de máquina até desafios computacionais relacionados ao treinamento de grandes modelos de linguagem (LLMs).

 

Bibliografia:

  1. Barberia, Lorena G.; Et al. (2023) An assessment of the public health surveillance strategy based on molecular testing during three major pandemic waves of COVID-19 in Brazil. PLOS Global Public Health, v. 3, p. e0002164
  2. Batista, K.; Fernandez, M.; Barberia, L.; Et al. (2024) Panorama da COVID longa no Brasil: análise preliminar de um inquérito para pensar políticas de saúde. Cadernos de Saúde Pública, v. 40, p. e0009462-e0009462
  3. Benamara, F., Inkpen, D., & Taboada, M. (2018). Introduction to the Special Issue on Language in Social Media: Exploiting Discourse and Other Contextual Information. Computational Linguistics, 44(4), 663-681. https://doi.org/10.1162/coli_a_00333
  4. Benamara, F., Taboada, M., & Mathieu, Y. (2017). Evaluative Language Beyond Bags of Words: Linguistic Insights and Computational Applications. Computational Linguistics, 43(1), 201-264. https://doi.org/10.1162/COLI_a_00278
  5. Bittencourt, M.; Silva, R.; Almeida, T. (2020) ML-MDLText: An efficient and lightweight multilabel text classifier with incremental learning. APPLIED SOFT COMPUTING, v. 96, p. 106699, 2020.
     
  6. Boing, A; Boing, A.; Borges, M.; Rodrigues, D.; Barberia, L.; Subramanian, SV. (2024) Spatial clusters and social inequities in COVID-19 vaccine coverage among children in Brazil. Ciência & Saúde Coletiva, v. 29, p. 1-13
  7. Boyd-Graber, J., Hu, Y., & Mimno, D. (2017). Application of Topic Models. Foundations and Trends® in Information Retrieval, 11(2-3), 143-296. https://doi.org/10.1561/1500000030
     
  8. Carmo, I., Rêgo, A. L. C., Barreto, M., Schuler, M., Heine, A., Villas, M. V., & Lifschitz, S. (2023). Gerenciamento de Dados de Redes Sociais com Análise de Redes e Modelagem de Tópicos. Anais do 38º Simpósio Brasileiro de Banco de Dados (SBBD) (pp. 64-70). Sociedade Brasileira de Computação. https://doi.org/10.5753/sbbd_estendido.2023.233417
     
  9. Chauhan, U., & Shah, A. (2021). Topic Modeling Using Latent Dirichlet Allocation: A Survey. ACM Computing Surveys, 54(7), Article 138. https://doi.org/10.1145/3462478
     
  10. Dou, W., & Liu, S. (2016). Topic and Time-Oriented Visual Text Analysis. IEEE Computer Graphics and Applications, 36(2), 8-13. https://doi.org/10.1109/MCG.2016.73
     
  11. Géron, A. (2019). Mãos à Obra Aprendizado de Máquina com Scikit-Learn e TensorFlow: Conceitos, Ferramentas e Técnicas Para a Construção de Sistemas Inteligentes (R. Contatori, Trans.). Alta Books. ISBN 978-85-508-0902-1
     
  12. Grimmer, J., Roberts, M. E., & Stewart, B. M. (2022). Text as Data: A New Framework for Machine Learning and the Social Sciences. Princeton University Press. ISBN 978-0691207551
     
  13. Grootendorst, M. (2022). BERTopic: Neural Topic Modeling with a Class-Based TF-IDF Procedure. https://doi.org/10.48550/arXiv.2203.05794
  14. Hyder, A.; Barberia, L. (2024) Addressing global gun violence: a Lancet Commission on Global Gun Violence and Health. Lancet, v. 404, p. 1-1
  15. Lochter, J.; Silva, R.; Almeida, T. (2022). Multi-level out-of-vocabulary words handling approach. Knowledge-Based Systems S, v. 251, p. 108911
  16. Pangakis, N., Wolken, S., & Fasching, N. (2023). Automated Annotation with Generative AI Requires Validation. arXiv. https://doi.org/10.48550/arXiv.2306.00176
  17. Silva, R.; Pires, P.; Almeida, T. (2023). Incremental learning for fake news detection. Journal of Information and Data Management - JIDM, v. 13, p. 566-579
     
  18. Silva, R; Santos, R.; Almeida, T.; Pardo, T. (2020). Towards automatically filtering fake news in Portuguese. Expert Systems With Applications, v. 146, p. 113199
     
  19. Silva, T. F. L. da. (2022); O Pão Que O Viado Amassou: contribuições da semiótica para o processamento de língua natural. Estudos Semióticos, 18(3), 70-92, 2022. https://doi.org/10.11606/issn.1980-4016.esse.2022.198626
     
  20. Silva, T. F. L. da. (2023); Using transformer networks and tensive semiotics to improve sentiment analysis accuracy in tourism digital platforms; in Semiotica e intelligenza artificiale, pp. 131-147, Aracne; Italia, 2023, ISBN 979-12-218-0429-4; https://www.aracneeditrice.eu/free-download/9791221804294.pdf
     
  21. Silva, T. F. L. da. (2023); Humanismo digital e transformação social: campos abertos para o fomento da inovação nas Ciências Humanas e Sociais; in Revista Sciencia Veritas, 2; https://prpg.usp.br/attachments/article/8936/Scientia_2_pg_5-8.pdf
     
  22. Silva, T. F. L. da, et al. (in press). CDB: A Unified Framework for Hope Speech Detection Through Counterfactual, Desire, and Belief. In Findings of the Association for Computational Linguistics: NAACL 2025.
     
  23. Sun, X., Li, X., Guo, S., Zhang, T., Wang, G., Li, J., & Wu, F. (2023). Text Classification via Large Language Models. In Findings of the Association for Computational Linguistics: EMNLP 2023; https://aclanthology.org/2023.findings-emnlp.603.pdf
     
  24. Zhang, W., Deng, Y., Liu, B., Pan, S. J., & Bing, L. (2024). Sentiment Analysis in the Era of Large Language Models: A Reality Check. In Findings of the Association for Computational Linguistics: NAACL 2024; https://aclanthology.org/2024.findings-naacl.246.pdf
     
  25. Zong, C., Xia, R., & Zhang, J. (2022). Text Data Mining. Springer.